1.成功搭建Hadoop集群后简单实验
2.ClouderaçCDHåApacheçHadoopçåºå«
3.Win7 64位系统安装hadoop2.2.0的源码方法
成功搭建Hadoop集群后简单实验
1 检查对HDFS的访问(在namenode上操作)
#./hadoop-0..2/bin/hadoop fs -ls
2 hadoop中的文件系统操作
#./hadoop-0..2/bin/hadoop fs -mkdir test
#./hadoop-0..2/bin/hadoop fs -ls test
#./hadoop-0..2/bin/hadoop fs -rmr test
3 测试hadoop
a 创建子目录
#./hadoop-0..2/bin/hadoop fs -mkdir input
b 把本地文件移动到hdfs
#./hadoop-0..2/bin/hadoop fs -put /usr/share/doc/pam-1.1.1/rfc.0.txt input
#./hadoop-0..2/bin/hadoop fs -put /usr/share/doc/pam-1.1.1/Linux-PAM_SAG.txt input
c 查看文件是否存在
#./hadoop-0..2/bin/hadoop fs -ls input
d 执行计算单词频率的MapReduce作业
#./hadoop-0..2/bin/hadoop jar /root/hadoop-0..2/hadoop-0..2-examples.jar wordcount input output
Found 2 items
drwxr-xr-x - root supergroup 0 -- : /user/root/output/_logs
-rw-r--r-- 2 root supergroup -- : /user/root/output/part-r-
e 查看输出结果
#./hadoop-0..2/bin/hadoop fs -ls output
#./hadoop-0..2/bin/hadoop fs -cat output/part-r- | head -n
f 从HDFS提取输出
#./hadoop-0..2/bin/hadoop fs -get output/part-r- output.txt
ClouderaçCDHåApacheçHadoopçåºå«
ããç®åèè¨ï¼ä¸æ¶è´¹çHadoopçæ¬ä¸»è¦æä¸ä¸ª(åæ¯å½å¤åå)ï¼åå«æ¯ï¼Apache(æåå§ççæ¬ï¼ææåè¡çååºäºè¿ä¸ªçæ¬è¿è¡æ¹è¿)ãClouderaçæ¬(Clouderaâs
Distribution Including Apache Hadoopï¼ç®ç§°CDH)ãHortonworksçæ¬(Hortonworks Data
Platformï¼ç®ç§°âHDPâ)ï¼å¯¹äºå½å èè¨ï¼ç»å¤§å¤æ°éæ©CDHçæ¬ï¼CDHåApacheçæ¬ä¸»è¦åºå«å¦ä¸ï¼
ãã(1) CDH对Hadoopçæ¬çååéå¸¸æ¸ æ°ï¼åªæ两个系åççæ¬ï¼åå«æ¯cdh3åcdh4ï¼åå«å¯¹åºç¬¬ä¸ä»£Hadoop(Hadoop
1.0)å第äºä»£Hadoop(Hadoop 2.0)ï¼ç¸æ¯èè¨ï¼Apacheçæ¬åæ··ä¹±å¾å¤;æ¯Apache
hadoopå¨å ¼å®¹æ§ï¼å®å ¨æ§ï¼ç¨³å®æ§ä¸æå¢å¼ºã
ãã(2)CDH3çæ¬æ¯åºäºApache hadoop 0..2æ¹è¿çï¼å¹¶èå ¥äºææ°çpatchï¼CDH4çæ¬æ¯åºäºApache hadoop
2.Xæ¹è¿ç,CDHæ»æ¯å¹¶åºç¨äºææ°Bugä¿®å¤æè FeatureçPatchï¼å¹¶æ¯Apache
hadoopååè½çæ¬ææ©åå¸ï¼æ´æ°é度æ¯Apacheå®æ¹å¿«ã
ãã(3)å®å ¨ CDHæ¯æKerberoså®å ¨è®¤è¯ï¼apache hadoopå使ç¨ç®éçç¨æ·åå¹é 认è¯
ãã(4)CDHææ¡£æ¸ æ°ï¼å¾å¤éç¨Apacheçæ¬çç¨æ·é½ä¼é 读CDHæä¾çææ¡£ï¼å æ¬å®è£ ææ¡£ãå级ææ¡£çã
ãã(5)CDHæ¯æYum/Aptå ï¼Tarå ï¼RPMå ï¼Cloudera Manageråç§æ¹å¼å®è£ ,Apache
hadoopåªæ¯æTarå å®è£ ã
ãã注ï¼CDH使ç¨æ¨èçYum/Aptå å®è£ æ¶ï¼æ以ä¸å 个好å¤ï¼ 1ãèç½å®è£ ãå级ï¼é常æ¹ä¾¿ 2ãèªå¨ä¸è½½ä¾èµè½¯ä»¶å
ãã3ãHadoopçæç³»ç»å èªå¨å¹é ï¼ä¸éè¦ä½ 寻æ¾ä¸å½åHadoopå¹é çHbaseï¼Flumeï¼Hiveç软件ï¼Yum/Aptä¼æ ¹æ®å½åå®è£ Hadoopçæ¬èªå¨å¯»æ¾å¹é çæ¬ç软件å ï¼å¹¶ä¿è¯å ¼å®¹æ§ã
ãã4ãèªå¨å建ç¸å ³ç®å½å¹¶è½¯é¾å°åéçå°æ¹(å¦confålogsçç®å½);èªå¨å建hdfs,
mapredç¨æ·ï¼hdfsç¨æ·æ¯HDFSçæé«æéç¨æ·ï¼mapredç¨æ·åè´è´£mapreduceæ§è¡è¿ç¨ä¸ç¸å ³ç®å½çæéã
Win7 位系统安装hadoop2.2.0的方法
Hadoop是一个开源框架,它允许在整个集群使用简单编程模型计算机的分布式环境存储并处理大数据,但是源码许多用户并不知道要怎么安装hadoop2.2.0,为了帮助大家更好的源码操作,现在给大家带来Win7 位系统安装hadoop2.2.0的源码源码更换详细方法供大家参考。
1、源码配置Cygwin环境变量PATH.把Cygwin安装目录下的源码sql sever项目源码,bin目录以入 usrsbin目录,源码都添加到PATH中;
2、源码启动Cygwin.bat ,源码打开如下命令行;
3、源码例如hadoop安装包放在分区D:下,源码则解压的源码命令为$ tar -zxvf /cygdrive/d/hadoop-0..2.tar.gz,解压后可使用ls命令查看(默认解压目录为。Cygwin安装目录);
4、源码模拟海水信道源码编辑hadoop-2.6.0/etc/hadoop/hadoop-env.sh,源码将export JAVA_HOME=${ JAVA_HOME}更改为自己电脑上的安装目录;
5。依次编辑hadoop-2.6.0/etc/hadoop/目录下的源码core-site.xmlhdfs-site.xml文件;
6、执行ssh-host-config命令,裂变 小程序 源码然后按下图上的选择输入:
当提示Doyouwanttouseadifferentname? 输入yes,这步是配置安装的sshd服务,以哪个用户登录,源码输入长度代码默认是cyg_server这个用户,这里就不事先新建cyg_server这个用户,用当 前本机的超管本地用户:chenx,后续根据提示,2次输入这个账户的密码。