【发布时间】:2016-08-03 18:02:04
【问题描述】:
我对 Hadoop 完全陌生,我想压缩一个大文件并将其放在 HDFS 中。到目前为止,这就是我所做的 1)安装单节点集群 2) 我的 core-site.xml 就像
<configuration>
<property> <name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
<property> <name>io.compression.codecs</name>
<value>com.hadoop.compression.lzo.LzoCodec</value>
</property>
</configuration>
现在,当我将本地 2GB 文件处理到 HDFS 时,使用以下命令。我仍然在 HDFS 中看到相同的大小。
hadoop fs -put 06_27_06_2016_tcp-leef.log-online /user/hduser/test/
不确定我在这里缺少什么,是否需要在 Hadoop 环境中启用任何其他属性,或者我是否需要为此编写 map-reduce 程序?所以要求是每当 HDFS 中出现新文件时,它应该自动压缩。
谢谢 虚拟机
【问题讨论】:
标签: hadoop