第一天面试:
下午1点半到公司(人人贷),公司做P2P,个人贷款,一共三轮面试,第一个技术偏向算法,第二个DBA,主要问sql和hive ql,第三个应该是公司负责技术方面的老大,问部分技术问题;
主要问题:
1 sql优化
设计角度 — 建索引,建视图
sql--------------- 充分利用索引,避免全表扫描
2 hive优化
充分利用临时表 , 重复利用
3 PageRank怎么实现

4 几道sql问题,联表查,exists,group by保留全部字段
5 不用hadoop 自己设计方案 实现TB级别数据量,TOP10问题,数据倾斜问题怎么解决
仿照mapreduce 的原理答复

6 算法中O(n)一定比O(lg(n))性能差吗?为什么?有那些因素需要考虑
没有答出来 , 面试官说还需要考虑IO,网络,空间等因素才能决定
第二家面试 (国舜科技)
1 如何搭建实时日志分析平台,需要那些条件
公司准备做的一个大数据平台,按业务去一步步做答
2 java 集合set list map 原理 区别 如何选择
3 k-means算法如何实现,为何收敛
为何收敛没有答出来

如有需要,可以添加博主微信,获取更多面试资料,或者向博主请教面试经验
大数据面试总结《五》

相关文章:

  • 2021-10-14
  • 2021-05-21
  • 2021-07-08
  • 2021-09-24
  • 2021-04-09
  • 2021-04-01
  • 2021-12-03
  • 2021-04-17
猜你喜欢
  • 2021-07-03
  • 2021-12-05
  • 2021-12-05
  • 2021-12-15
  • 2021-10-07
  • 2021-08-25
相关资源
相似解决方案