实战：如何在Linux上安装与配置Hadoop-技术开发专区

实战：如何在Linux上安装与配置Hadoop

作者：陆嘉恒编辑：王玉圆 2013-01-28 00:05 IT168网站原创

【IT168 技术】Hadoop的安装非常简单，大家可以在官网上下载到最近的几个版本，网址为http://apache.etoak.com/hadoop/core/。

　　Hadoop最早是为了在Linux平台上使用而开发的，但是Hadoop在UNIX、Windows和Mac OS X系统上也运行良好。不过，在Windows上运行Hadoop稍显复杂，首先必须安装Cygwin以模拟Linux环境，然后才能安装Hadoop。

　　在Unix上安装Hadoop的过程与在Linux上安装基本相同，因此下面不会对其进行详细介绍。

　　在Linux上安装与配置Hadoop

　　在Linux上安装Hadoop之前，需要先安装两个程序：

　　1. JDK 1.6或更高版本;

　　2. SSH(安全外壳协议)，推荐安装OpenSSH。

　　下面简述一下安装这两个程序的原因：

　　1. Hadoop是用Java开发的，Hadoop的编译及MapReduce的运行都需要使用JDK。

　　2. Hadoop需要通过SSH来启动salve列表中各台主机的守护进程，因此SSH也是必须安装的，即使是安装伪分布式版本(因为Hadoop并没有区分集群式和伪分布式)。对于伪分布式，Hadoop会采用与集群相同的处理方式，即依次序启动文件conf/slaves中记载的主机上的进程，只不过伪分布式中salve为localhost(即为自身)，所以对于伪分布式Hadoop，SSH一样是必须的。

　　一、安装JDK 1.6

　　安装JDK的过程很简单，下面以Ubuntu为例。

　　(1)下载和安装JDK

　　确保可以连接到互联网，输入命令：

sudo apt-get install sun-java6-jdk

　　输入密码，确认，然后就可以安装JDK了。

　　这里先解释一下sudo与apt这两个命令，sudo这个命令允许普通用户执行某些或全部需要root权限命令，它提供了详尽的日志，可以记录下每个用户使用这个命令做了些什么操作;同时sudo也提供了灵活的管理方式，可以限制用户使用命令。sudo的配置文件为/etc/sudoers。

　　apt的全称为the Advanced Packaging Tool，是Debian计划的一部分，是Ubuntu的软件包管理软件，通过apt安装软件无须考虑软件的依赖关系，可以直接安装所需要的软件，apt会自动下载有依赖关系的包，并按顺序安装，在Ubuntu中安装有apt的一个图形化界面程序synaptic(中文译名为“新立得”)，大家如果有兴趣也可以使用这个程序来安装所需要的软件。(如果大家想了解更多，可以查看一下关于Debian计划的资料。)

　　(2)配置环境变量

　　输入命令：

sudo gedit /etc/profile

　　输入密码，打开profile文件。

　　在文件的最下面输入如下内容：

#set Java Environment
export JAVA_HOME= （你的JDK安装位置，一般为/usr/lib/jvm/java-6-sun）
export CLASSPATH=".:$JAVA_HOME/lib:$CLASSPATH"
export PATH="$JAVA_HOME/:$PATH"

　　这一步的意义是配置环境变量，使你的系统可以找到JDK。

　　(3)验证JDK是否安装成功

　　输入命令：

java -version

　　查看信息：

java version "1.6.0_14"
Java(TM) SE Runtime Environment (build 1.6.0_14-b08)
Java HotSpot(TM) Server VM (build 14.0-b16, mixed mode)

第1页：安装JDK 1.6 第2页：配置SSH免密码登录第3页：安装并运行Hadoop

关注我们