查看HDFS文件系统数据的三种方法

大数据学习路线图

【版权声明:本指南为厦门大学林子雨编著的《大数据技术原理与应用》教材配套学习资料,版权所有,转载请注明出处,请勿用于商业用途】

1、使用插件——Hadoop-Eclipse-Plugin
此方法需要借助Eclipse,插件的安装及使用请参考博文使用Eclipse编译运行MapReduce程序_Hadoop2.6.0_Ubuntu/CentOS
借助Eclipse只能进行简单的HDFS操作,如查看,删除,上传,下载。以下是操作界面:
插件界面
2、HDFS Web界面
HDFS Web界面上只能查看文件系统数据。网址:http://localhost:50070
界面如下:
web界面
执行完WordCount程序后可以到本界面上下载output结果并查看,如图:
Hadoop web界面查看文件系统数据
3、 shell命令
这个方法是最基本的,能进行所有文件操作。

hadoop fs -ls /user/hadoop/output #查看指定目录下的文件和文件夹。/user/hadoop/output是HDFS上的目录,不是本地目录
hadoop fs -cat  /user/hadoop/output #查看文件内容

博主的用户名是dblab,相应的HDFS上的目录变为/user/dblab/output。界面截图如下:
shell
还有很多其他操作命令,见厦门大学林子雨编著的《大数据技术原理与应用》教材第3章51页。