第0步:先欣赏下图红框内容,下面三行代码,就是一个完整的简单案例。

5分钟图解《Spark快速大数据分析》步骤5:Spark第一个简单案例

 

第1步:通过读取文件“README.md”,创建一个名为lines的RDD。这个源文件就位于spark的根目录下,可以在E盘spark安装文件夹里找到。

5分钟图解《Spark快速大数据分析》步骤5:Spark第一个简单案例

 

5分钟图解《Spark快速大数据分析》步骤5:Spark第一个简单案例

 

第2步:使用count()方法,统计RDD中元素的个数,结果显示有103个元素。

5分钟图解《Spark快速大数据分析》步骤5:Spark第一个简单案例

 

第3步:使用first()方法,统计RDD中的第一个元素,其实就是“README.md”的第一行,可以用记事本打开看看,检查一下第一行是不是“#Apache Spark”

5分钟图解《Spark快速大数据分析》步骤5:Spark第一个简单案例

 

5分钟图解《Spark快速大数据分析》步骤5:Spark第一个简单案例

相关文章:

  • 2021-06-07
  • 2021-11-01
  • 2021-11-16
  • 2021-08-20
  • 2021-05-29
  • 2021-10-30
  • 2021-08-07
  • 2021-09-08
猜你喜欢
  • 2021-07-29
  • 2021-11-14
  • 2021-07-26
  • 2021-05-08
  • 2021-12-10
  • 2021-08-02
  • 2021-12-16
相关资源
相似解决方案