巧达科技大数据面试题

巧达科技

巧达科技大数据面试题

（1）二分法快排

（2）一个大的文件实现不同的key进行不同的操作（数据处理分析）不用现成的框架使用多线程的思想实现

（3）一个文件一个线程读多个线程写阻塞队列

（4）Hadoop保存文件的特性：分片备份

（5）spark的原理

（6）宽窄依赖

（7）shuffle 什么时候进行

（8）spark开发遇到的困难

（9）集群部署

（10）如何处理数据倾斜

（11）一个线程负责读，假设读的速度很快，然后交给其他线程，组成阻塞式消息队列（类似于Kafka）

（12）一般队列和阻塞式队列的区别

大数据培训

相关文章：

猜你喜欢

相关资源

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode