当前位置: 首页 > news >正文

impala参数之‘impala.disableHmsSync‘=‘true‘

参考文章 https://cloud.tencent.com/developer/article/2007738

impala官方文档https://impala.apache.org/docs/build/impala-3.4.pdfhttps://impala.apache.org/docs/build/impala-3.4.pdf

第657-658页

这个参数什么用,顾名思义就是禁止hms数据同步,具体表现是什么呢?为什么要设置呢,该怎么设置呢。一起学习下。

首先我们要了解impala和hive的关系

简单来说impala只是一个数据读取和处理的工具,具体就是读取hdfs表目录下的文件,放到内存里解析(个人理解)。这里存在一个什么问题呢?理论上hive里所有的表和数据都可以通过impala去读取,因为impala基于内存的读取的非常快,但同时页很消耗内存,关键是hive的元数据信息不一定及时同步到impala

1.为什么设置这个参数?

因为不是所有的表都需要通过impala的,大部分是一些结果表,每天更新的一些维表,需要作为报表每天都会有数据更新,这种数据才是真的impala处理的。大部份表其实都不需要,比如你新建了一个test表,只是自己在hive坐下测试,根本不需要通过impala实时查询。但问题的关键就在于这里,impala默认读取所有的表,表的数据越来越多,有时候会读取就会出现问题,所以解决。

直接开测

CREATE DATABASE odsccdata WITH DBPROPERTIES ('impala.disableHmsSync'='true');

desc database extended odsccdata;

CREATE DATABASE cc_test

desc database extended cc_test

建表

create table odsccdata.test1(id int );

create table cc_test.test1(id int );

impala查询

select * from cc_test.test1 -- 直接查看

select * from cc_test.test1 -- 无法查看

invalidate metadata odsccdata.test1 --手动刷新

select * from odsccdata.test1

上面的实验可以看到 如果我们将db设置为disablehmssync之后,所建的表不会被impala采集信息了,需要手动去刷新,这样减少了impala的工作量,肯定能提高效率。

还有的参数可以设置

hms_event_polling_interval_s 设置这个间隔 官方建议设置小于5s

hms_event_polling_interval_s flag set to a positive integer to enable the feature and set the polling
frequency in seconds. We recommend the value to be less than 5 seconds

http://www.gsyq.cn/news/1386497.html

相关文章:

  • 告别默认加载项!手把手教你为ArcGIS Pro插件打造专属功能区(附DAML配置详解)
  • 基于助睿BI的学生考勤画像可视化分析:精准锁定“纪律高危型“群体
  • 行为型设计模式——状态模式
  • 【CP-05】RTE运行时环境 - SWC的操作系统接口
  • SAP顾问实战:如何用ABAP函数MD_STOCK_REQUIREMENTS_LIST_API批量跑MD04数据(附完整代码)
  • 从‘邮票贴钱’到算法面试:回溯法解连续邮资问题的实战拆解与思路升华
  • 电赛备赛别慌!这份集成运放电路速查手册+Multisim仿真文件,帮你快速上手
  • 数据融合驱动的全地面起重机路面信息识别技术【附数据】
  • RT-Thread FinSH命令导出全解析:从MSH_CMD_EXPORT宏到bin文件里的秘密
  • 从LED闪烁到外设驱动:STM32 HAL库GPIO实战进阶,用CubeMx配置按键、蜂鸣器和继电器
  • 清华大学学位论文LaTeX排版终极指南:3步快速生成标准格式
  • Cadence SPB17.4元件管理器实战:批量更新原理图属性,别再傻傻手动改了
  • 2026年5月市面上冰箱清洗服务商哪家强厂家推荐榜,直冷/风冷/对开门冰箱清洗选择指南 - 海棠依旧大
  • 别再傻傻分不清:Mol、SDF、SMILES文件格式到底怎么选?
  • 揭秘生物年龄计算:BioAge工具包如何帮你量化衰老进程
  • Apifox环境变量+JavaScript实战:5分钟搞定Google Gemini API接口自动化测试
  • 有哪些AI论文软件是真的坚守学术严谨,而不是空洞拼凑?
  • (毕业必看)实测靠谱的AI论文软件,毕业党收藏备用
  • 从零到一:在LUNIX系统上部署Anubis并进行GNSS数据质量分析
  • 2026年5月国内专业水泥电杆底盘供应商排行:高压水泥电线杆、高强度水泥电杆、高强度水泥电线杆、低压水泥电线杆选择指南 - 优质品牌商家
  • 2026年5月行业观察:莆田可靠的LV鞋店价值评估与供应链选择 - 2026年企业推荐榜
  • 别扔!用吃灰的TP-LINK-WR703N做个无线打印服务器,保姆级刷机教程(含Breed+OpenWrt)
  • 避坑指南:在Docker容器里为OpenCV编译Nvidia GPU硬解码支持,我踩过的那些‘库版本’的坑
  • 2026年江苏区域静电检测闸机专业厂家TOP5排行:上海翼闸速通门/上海通道闸门禁/上海防静电门禁闸机/上海防静电闸机/选择指南 - 优质品牌商家
  • android主流闹钟流程/架构-------------不用改架构
  • 从理论推导到代码实现:手把手教你用Python/Numpy写出守恒形式的NS方程求解器
  • 手把手教你用C++和倍福ADS库在Ubuntu上读写PLC变量(附完整CMake配置)
  • 2026年Q2国内主流超声治疗仪品牌排行盘点:经颅磁疗仪/膝盖超声波治疗仪/超声波治疗器/超声波治疗理疗/便携超声波治疗仪/选择指南 - 优质品牌商家
  • 三、Tucker 分解:从高阶PCA到多维数据压缩的实战解析
  • Redis沙盒体验:在浏览器中零门槛掌握NoSQL核心技能