1、简介 1、首先提供DataFrame API,可以对内部和外部各种数据源执行各种关系操作 2、其次可以支持大量的数据源和数据分析算法.Spark SQL可以融合传统关系数据库的结构化数据管理能力和机器学习算法的数据处理能力. 2、DataFrame与RDD的区别 相关文章: