失效链接处理 |
java深圳企业面试题 PDF 下载
本站整理下载:
相关截图:
主要内容:
学长1
1.java 的多态,继承
2.hashmap,数据结构,堆,栈特点,递归如何变非递归
3.hbase的rowkey设计原则
4.hbase的二级索引
5.flink如何保证精准一次
6.flink乱序处理机制
7.flink背压机制
8.flink如何处理数据倾斜
9.presto相关原理
学长2
编程题1:
给一个日期20200202,观察这个日期,同时满足两个特征:左右对称;除数字0外,只有一个非零数字。
编程题2:编码实现以下两项:
1. 输入任意日期,判断是否满足以上条件,测试用例:20200202,21211212
2. 输出自19700101至今所有符合条件的日期
组件题:
1.hive数据倾斜是什么?怎么解决?
2.count distinct和groupby区别?为什么count distinct会把数据发到一个reducer?
3.mapjoin怎么实现?多大算小表?小表在内存是什么数据结构?
4.MRshuffle及优化?
5.redis和hbase各自的优缺点?
6.hbase为什么快?
7.hbase热点产生的原因?
8.hbase性能降低的时候sparkstreaming怎么解决反压的问题?
9.flink相比sparkstreaming优点?
10.flink挂了之后cp的整个加载流程?
2. 安信仪表自动化有限公司
笔试题目:
1.hive里面shuffle优化
2.sqoop参数,全量导出、增量导出需要哪些参数
3.hive数据倾斜原因
4.hive数据倾斜怎么解决
5.悲观锁、乐观锁区别?实现?
6.spark streaming消息语义,kafka两种连接模式
7.一道简单的java题a++与++a
8.设计模式有哪些,怎么应用?
面试:
1.数仓结构
2.hive调优
3.spark streaming 精准一次消费
4.flink水印机制
5.flume拦截器
6.kafka精准一次消费
7.hive -n含义(hive \N 我可能听错了)
8.sqoop导数据会不会
3.风变编程
1.sqoop里面的参数有哪些?
2.维度建模:问我一些里面的表结构,什么组件?
3.用load命令到会不会太慢,有没有什么优化?
4.sql优化,in和exist有什么区别?
5.10亿条数据用1M内存怎么处理,如果用redis去重怎么去优化(布隆过滤器)?
6.宽表里面的索引稀疏怎么解决?
7.实时数仓的目的是什么,给你们解决了什么问题?
总结:每个人估计问的问题都不一样,主要是问你介绍过的,然后问得有点深,有很多概念都没听说过。所以同学们介绍自己熟悉一点的东西,如果flink什么不熟,千万别强行装逼。对面有点强。架构哪些如果可以,适当调整一下。
4.领星网络
1.Flink 的背压处理方式,什么原因引起的?
2.Flink出现的问题,怎么解决的?重启策略?
3.Flink数据倾斜的处理方式,怎么处理的,哪些算子引起的数据倾斜?
4.Flink集群的数量,资源调度是怎么做的?
5.Flink的提交参数,怎么确定下来的?
6.redis和Mysql的数据一致性保证是怎么做的
7.hashmap数据架构
8.通信协议,用的什么--涉及到后端的东西
5.平安寿险
学长1
1.介绍一下离线数据:每层的设计原则、都做了什么、为什么这么做
2.说一下你都在离线数仓中都做了什么
3.说一下你负责的ads层的指标的具体实现过程、怎么来的
有没有遇到数据倾斜的问题
|