spark 核心是RDD:弹性分布式数据集

(重要)spark RDD核心知识

(重要)spark RDD核心知识

基本RDD 转换运算

  • 创建intRDD
    • (重要)spark RDD核心知识
  • 创建stringRDD
    • (重要)spark RDD核心知识
  • map 运算
    • (重要)spark RDD核心知识
  • filter 数字运算
    • (重要)spark RDD核心知识
  • filter 字符串运算
    • (重要)spark RDD核心知识
  • distinct 运算
    • 去除重复元素
      • (重要)spark RDD核心知识
  • randomSplit 运算
    • 随机按照比例分为多个RDD
    • 如下比例:0.4:0.6
    • (重要)spark RDD核心知识
  • groupBy 运算
    • 根据匿名函数规则,分为多个Array
    • (重要)spark RDD核心知识

多个RDD 转换运算

  • 创建3个范例RDD
    • (重要)spark RDD核心知识
  • union 并集运算
    • (重要)spark RDD核心知识
  • innersection 交集运算
    • (重要)spark RDD核心知识
  • substract 差集运算
    • (重要)spark RDD核心知识
  • cartesian 笛卡尔乘积运算
    • (重要)spark RDD核心知识

基本动作运算

  • 读取数据
    • (重要)spark RDD核心知识
  • 统计功能
    • (重要)spark RDD核心知识
    • (重要)spark RDD核心知识

RDD key-value 基本转换运算

  • 创建范例 k-v RDD
    • (重要)spark RDD核心知识
  • (重要)spark RDD核心知识
  • (重要)spark RDD核心知识
  • (重要)spark RDD核心知识
  • (重要)spark RDD核心知识
  • (重要)spark RDD核心知识
  • (重要)spark RDD核心知识
  • (重要)spark RDD核心知识
  • 将具有相同key的值合并
    • (重要)spark RDD核心知识
      • (重要)spark RDD核心知识

多个RDD k-v 转换运算

  • (重要)spark RDD核心知识
  • (重要)spark RDD核心知识
    • (重要)spark RDD核心知识
  • (重要)spark RDD核心知识
    • (重要)spark RDD核心知识
  • (重要)spark RDD核心知识
    • (重要)spark RDD核心知识
  • 按照key 做差
    • (重要)spark RDD核心知识
    • (重要)spark RDD核心知识

key-value 动作运算

  • (重要)spark RDD核心知识
  • (重要)spark RDD核心知识
    • (重要)spark RDD核心知识
  • (重要)spark RDD核心知识
    • (重要)spark RDD核心知识
  • (重要)spark RDD核心知识
    • (重要)spark RDD核心知识
  • (重要)spark RDD核心知识
    • (重要)spark RDD核心知识
  • 根据key 查找value
    • (重要)spark RDD核心知识
      • (重要)spark RDD核心知识

共享变量:用于节省内存和运行时间,提升并行执行时的运行效率

  • 分为两种:
    • Broadcast 广播变量
      • 不使用广播
        • (重要)spark RDD核心知识
        • (重要)spark RDD核心知识
      • 使用广播变量
        • (重要)spark RDD核心知识
        • (重要)spark RDD核心知识
    • accumulator 累加器
      • (重要)spark RDD核心知识

RDD persistence 持久化

  • 需要重复运算的RDD 存储到内存中
    • 默认memory_only
      • (重要)spark RDD核心知识
    • (重要)spark RDD核心知识
    • (重要)spark RDD核心知识

 

相关文章:

  • 2021-11-14
  • 2018-04-28
  • 2021-04-23
  • 2021-11-21
猜你喜欢
  • 2018-01-05
  • 2021-11-15
  • 2021-03-28
  • 2021-12-03
  • 2021-04-04
  • 2021-11-22
  • 2021-06-04
相关资源
相似解决方案