Java知识分享网 - 轻松学习从此开始!    

Java知识分享网

        
AI编程,程序员挑战年入30~100万高级指南 - 职业规划
SpringBoot+SpringSecurity+Vue权限系统高级实战课程        

IDEA永久激活

Java微信小程序电商实战课程(SpringBoot+VUe)

     

AI人工智能学习大礼包

     

PyCharm永久激活

66套java实战课程无套路领取

     

Cursor+Claude AI编程 1天快速上手视频教程

     
当前位置: 主页 > Java文档 > 大数据云计算 >

hive性能优化 PDF 下载


时间:2020-09-04 08:50来源:http://www.java1234.com 作者:小锋  侵权举报
hive性能优化 PDF 下载
失效链接处理
hive性能优化 PDF 下载


 
本站整理下载:
 
相关截图:
 
主要内容:

接下来将详细介绍以上所列的优化方法
打开hive压缩 (中间数据、最终数据)
hive 最终输出结果压缩
    hive.exec.compress.output=true
    mapreduce.output.fileoutputformat.compress=true(mapreduce参数)
    mapreduce.output.fileoutputformat.compress.codec=(可以通过set io.compression.codecs查看支持的压缩格式,选择一个)
    mapreduce.output.fileoutputformat.compress.type=BLOCK;
hive中间结果压缩
    hive.exec.compress.intermediate=true(压缩格式:mapreduce.output.fileoutputformat* 配置)
hive中间结果map输出压缩
    mapreduce.map.output.compress=true
    mapreduce.map.output.compress.codec=[所需压缩方式]
数据倾斜
     Group by 引起数据倾斜:
        hive.groupby.skewindata;
        hive.groupby.mapaggr.checkinterval;
     Join 引起的数据倾斜 (大表与大表)
        hive.optimize.skewjoin
        hive.skewjoin.key
     Join 引起的数据倾斜(大表和小表)
         hive.auto.convert.join 
         hive.mapjoin.smalltable.filesize
         hive.auto.convert.join.noconditionaltask
         hive.auto.convert.join.noconditionaltask.siz

 
 
------分隔线----------------------------


锋哥推荐