Hadoop单机模式部署

存储架构 2016-04-20

一、Hadoop部署模式

单机模式:默认情况下运行为一个单独机器上的独立Java进程,主要用于调试环境

伪分布模式:在单个机器上模拟成分布式多节点环境,每一个Hadoop守护进程都作为一个独立的Java进程运行

完全分布式模式:真实的生产环境,搭建在完全分布式的集群环境

二、添加用户和组

$ sudo adduser hadoop                         ##创建用户hadoop
$ sudo usermod -G sudo hadoop                   ##将hadoop用户添加进sudo用户组

三、安装相关软件

$ sudo apt-get update
$ sudo apt-get -y install openssh-server rsync openjdk-7-jdk
$ sudo service ssh restart
$ java -version

四、配置SSH免密登录

$ su -l hadoop                             ##切换至hadoop用户
$ ssh-keygen -t rsa -P ""                   ##配置SSH免密登录
$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys    ##将公钥追加到authorized_keys中
$ ssh localhost                           ##验证

五、Hadoop配置

①下载安装Hadoop

$ su -l hadoop
$ wget http://apache.fayea.com/hadoop/common/hadoop-2.7.1/hadoop-2.7.1.tar.gz 
$ tar -zxvf hadoop-2.7.1.tar.gz
$ sudo mv hadoop-2.7.1 /usr/local/hadoop

②配置Hadoop

a.添加环境变量

$ vi /home/hadoop/.bashrc
#HADOOP START
export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64
export HADOOP_INSTALL=/usr/local/hadoop/
export PATH=$PATH:$HADOOP_INSTALL/bin
export PATH=$PATH:$HADOOP_INSTALL/sbin
export HADOOP_MAPRED_HOME=$HADOOP_INSTALL
export HADOOP_COMMON_HOME=$HADOOP_INSTALL
export HADOOP_HDFS_HOME=$HADOOP_INSTALL
export YARN_HOME=$HADOOP_INSTALL
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_INSTALL/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_INSTALL/lib"
#HADOOP END
$ .  /home/hadoop/.bashrc    ##重载使其生效

六、测试

①创建输入数据

$ su -l hadoop
$ cd /usr/local/hadoop
$ sudo mkdir input
$ sudo cp /etc/passwd input/

②执行Hadoop WordCount应用(词频统计)

$ bin/hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.7.1-sources.jar org.apache.hadoop.examples.WordCount input output

③查看生成的单词统计数据

$ hadoop dfs -ls output
-rw-r--r--   1 hadoop hadoop          0 2015-12-18 13:18 output/_SUCCESS
-rw-r--r--   1 hadoop hadoop       2128 2015-12-18 13:18 output/part-r-00000
$ hadoop dfs -cat output/*

:

配置单节点Hadoop的文档: http://hadoop.apache.org/docs/r2.7.1/hadoop-project-dist/hadoop-common/SingleCluster.html#Standalone_Operation

责编内容by:记事本-51CTO技术博客 (源链)。感谢您的支持!

您可能感兴趣的

Secure, Native Visual Analytics Made Easier with A... Dale Kim, Sr. Director, Products/Solutions, Arcadia Data Implementing da...
hadoop分布式集群 分布式集群的实现 环境: 192.168.36.129node1:NN,SNN,RM 192.168.36.130node2:DN,NM ...
史上最快! 10小时大数据入门实战(六)- Hadoop 项目实战... 1 用户行为日志概述 离线数据处理架构 ...
OpenSOC深入剖析 什么是OpenSOC 思科在BroCON大会上亮相了其安全大数据分析架构 OpenSOC (由Cisco和Hortonworks共同开发),引起了广泛关注...
《Hadoop与大数据挖掘》一2.3.2动手实践:hdfs dfs命令实战... 本节书摘来华章计算机《Hadoop与大数据挖掘》一书中的第2章 ,第2.3.2节,张良均 樊 哲 位文超 刘名军 许国杰 周 龙 焦正升 著 更多章节内容...