失效链接处理 |
Apache Flink 十大技术难点实战 PDF 下载
本站整理下载:
相关截图:
主要内容:
Batch 兼容 Hive 且生产可用
Flink 从 1.9.0 版本开始支持 Hive 集成,但并未完全兼容。在 1.10.0 中我们对
Hive 兼容性做了进一步的增强,使其达到生产可用的标准。具体来说,Flink 1.10.0
中支持:
● Meta 兼容 - 支持直接读取 Hive catalog,覆盖 Hive 1.x/2.x/3.x 全部版本
● 数据格式兼容 - 支持直接读取 Hive 表,同时也支持写成 Hive 表的格式;支
持分区表
● UDF 兼容 - 支持在 Flink SQL 内直接调用 Hive 的 UDF,UDTF 和 UDAF
与此同时,1.10.0 版本中对 batch 执行进行了进一步的优化 (FLINK-14133),
主要包括:
● 向量化读取 ORC (FLINK-14135)
● 基于比例的弹性内存分配 (FLIP-53)
● Shuffle 的压缩 (FLINK-14845)
8 > 102 万行代码,1270 个问题,Flink 新版发布了什么?
● 基于新调度框架的优化 (FLINK-14735)
在此基础上将 Flink 作为计算引擎访问 Hive 的 meta 和数据,在 TPC-DS
10T benchmark 下性能达到 Hive 3.0 的 7 倍以上
|