失效链接处理 |
数仓面试题 PDF 下载
本站整理下载:
相关截图:
主要内容:
近期遇到的数仓⾯试题
数仓理论部分
1 星型模型、雪花模型区别,说说他们的优缺点?
2 你们数仓⽤了什么模型,说说为什么?
3 说说你们数仓的结构层次?
4 你有做过实时数仓吗,说说实时数仓⽅案。
MapReduce
1 讲⼀下MapReduce的全流程,重点突出shuffel部分,越细越好。
2 map个数, reduce个数怎样决定的?
3 fileinputformat 切分⽂件算法
4 hdfs写⼊流程是怎样的?
HIVE
1 有遇到过数据倾斜吗,怎样解决的?
2 ⼩⽂件问题怎么解决?
3 你们的hive表使⽤什么⽂件格式存储,不同的⽂件格式有啥区别?
4 ⼀条hql是怎么转化成MapReduce程序。
Kafka
有没有⼿动管理过offset,实现exactly once ?
|