快看漫画面试题

快看漫画大数据面试题

 

1)笔试

(1)SQL中LEFT JOIN的含义是____,如果tbs_user表记录了学生的姓名(name)和学号(id),tbs_score记录了学生(有的学生考试以后被开除了,没有其记录)的学号(id)和考试成绩(score)以及考试科目(subject),要想打印出所有及格(每一天都大于60分)学生的姓名及其各科总成绩,则可以用SQL语句______.

(2)请描述hadoop2.x中HDFS的高可用架构(high availability)是如何实现的。

(3)请简要描述spark任务中的“宽窄依赖”是什么?每个spark任务的stages是怎么划分的?

(4)有一个体积较大的HDFS文件,文件每一行的格式为:作品ID,用户ID,用户性别。请用一个spark任务实现以下功能:统计每个作品中,所有不同用户的性别分布。输出格式如下:作品ID,男性用户数量,女性用户数量。

(5)实现一个方法,传入整数n这个参数,输出所有和为n的连续整数序列。

例:输入n=15,输出:

1,2,3,4,5

4,5,6

大数据培训

相关文章:

  • 2021-06-11
  • 2018-10-30
  • 2021-11-26
  • 2021-11-19
猜你喜欢
  • 2022-12-23
  • 2019-06-27
  • 2021-06-19
  • 2021-11-20
  • 2021-09-05
  • 2021-11-25
  • 2022-01-01
相关资源
相似解决方案