快看漫画面试题
1)笔试
(1)SQL中LEFT JOIN的含义是____,如果tbs_user表记录了学生的姓名(name)和学号(id),tbs_score记录了学生(有的学生考试以后被开除了,没有其记录)的学号(id)和考试成绩(score)以及考试科目(subject),要想打印出所有及格(每一天都大于60分)学生的姓名及其各科总成绩,则可以用SQL语句______.
(2)请描述hadoop2.x中HDFS的高可用架构(high availability)是如何实现的。
(3)请简要描述spark任务中的“宽窄依赖”是什么?每个spark任务的stages是怎么划分的?
(4)有一个体积较大的HDFS文件,文件每一行的格式为:作品ID,用户ID,用户性别。请用一个spark任务实现以下功能:统计每个作品中,所有不同用户的性别分布。输出格式如下:作品ID,男性用户数量,女性用户数量。
(5)实现一个方法,传入整数n这个参数,输出所有和为n的连续整数序列。
例:输入n=15,输出:
1,2,3,4,5
4,5,6