【发布时间】:2018-09-07 21:11:41
【问题描述】:
我安装了Pydoop 并尝试运行MapReduce 作业。为了进行试运行,我尝试执行字数统计示例wordcount_minimal.py 和wordcount_full.py。他们都挂在地图阶段。在stderr 的末尾,我根据我运行的脚本找到了这条消息:
模块“wordcount_minimal”没有属性“main”
或
模块“wordcount_full”没有属性“main”
我使用以下命令执行了作业:
pydoop 提交 --upload-file-to-cache wordcount_full.py wordcount_full hdfs_input_dir hdfs_output_dir
无法找到这背后的原因。知道可能是什么原因吗?
我能够使用map 和reduce 函数从pydoop script 执行示例,并且成功完成。但是使用pydoop submit 选项,我遇到了这个问题。不确定我是否遗漏了什么。
PS:我有一个包含 2 个节点的集群,运行 Hortonworks HDP 2.6.5。 Pydoop 都安装在它们上面。
【问题讨论】:
标签: python hadoop mapreduce hortonworks-data-platform