当前位置: 首页 > news >正文

QQ本地缓存机制初步探寻

起因是在电脑上我想将一个QQ文件存放到其他文件夹下,而在QQ缓存文件夹下(...\Tencent Files\电脑登录的qq号\nt_qq\nt_data\,右键选择打开文件夹就可以快速找到对应文件的存放位置)对一个视频文件进行了重命名,在QQ中想要再预览同一个视频的时候发现又需要重新下载(即下图中最左与最右的视频是相同的)。

所以我又重命名了一遍(是的,相当于再次预览后有了3个相同的视频):

可以看到同一个视频在qq缓存时始终拥有一个固定的命名。而这个文件名07274e2fe9990417a1f599611cd36025,而这个命名是怎么产生的呢?在windows的cmd中输入以下指令(测试是不是MD5方式产生的):

certutil -hashfile "D:\...\nt_qq\nt_data\Video\2026-06\Ori\07274e2fe9990417a1f599611cd36025.mp4" MD5

得到的值是05fce820355ed39a43e61ffbef3d7f40,不匹配。

所以让AI去尝试其他常见的哈希方式,结果都不匹配:

测试项目计算结果是否匹配文件名
文件内容 MD505fce820355ed39a43e61ffbef3d7f40
文件内容 SHA151e24aa6f6e6e5c6ac533e03694edc8865be302b
文件内容 SHA256bdc4cd025276a4407b6d78223e4d0ab812e3b5ee...
文件内容 CRC329513aeda
文件前 1KB / 1MB / 末尾 N 字节 MD5多种结果
文件路径 / 文件名 / 文件大小 的 MD5多种结果
嵌套哈希 (MD5 of MD5 等)多种结果
标准 UUID (v1/v4)version 位为0,不符合标准

说明很有可能QQ不是在本地根据视频内容进行的计算(因为哈希会出现重复的情况),而可能是对原始下载 URL 进行哈希得到的或者是QQ 服务器直接下发的 file_id / file_uuid。不过事实并非如此。

查看缓存目录,以一个视频为例:

nt_qq/nt_data/Video/2026-06/Ori/07274e2fe9990417a1f599611cd36025.mp4 nt_qq/nt_data/Video/2026-06/Thumb/07274e2fe9990417a1f599611cd36025_0.png

可以看到视频和缩略图共享同一个 ID,说明这是 QQ NT 的标准缓存结构。

接着对同一缓存目录下的其他十六进制命名视频做 MD5 校验,发现并非所有文件都不匹配

文件名内容 MD5是否匹配
7a4e67066cff62b0d634bb195c4c1b7a.mp47a4e67066cff62b0d634bb195c4c1b7a匹配
35162df365e45b0b63b604db88540752.mp435162df365e45b0b63b604db88540752匹配
c34a6824666446818ff0e6524b08b239.mp4577353b33ca4db9bc0f86d0df9f97278❌ 不匹配
fb48745972b2bb0f795f7d2382172996.mp45329bf3eeea08efeac87d66ed659965a❌ 不匹配

所以推测某些视频(可能是本地直发文件)使用内容 MD5 命名;另一些视频在发送或者缓存过程中进行了压缩,导致前后的MD5发生了变化。

nt_qq/nt_db/下找到所有数据库文件,包括:

nt_msg.db、rich_media.db、files_in_chat.db、group_info.db ...

尝试用sqlite3直接打开,全部报错Error: file is not a database。用 Python 读取文件头确认:Header: 53 51 4c 69 74 65 20 66 6f 72 6d 61 74 20 33 00 ASCII: SQLite format 3

表面是标准 SQLite 头,但后续页面是密文——确认是 SQLCipher 4 加密,且 QQ NT 在标准头前额外加了 1024 字节自定义头部。

1008-1023: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 (16 字节全零) 1024-1039: 5f d9 ca 34 61 b4 8d 82 3f 69 8c 59 f4 8a 33 40 (加密数据开始)

既然数据库加密,必须获取密钥。由于无法下载到现成的 PowerShell 脚本,自行编写了find_key_from_memory.py

  1. 枚举所有QQ.exe进程 PID
  2. 用 Windows API (OpenProcessVirtualQueryExReadProcessMemory) 遍历内存
  3. 在内存中搜索nt_msg.db和 对应的QQ 号 作为线索
  4. 在线索附近提取 16 字节可打印 ASCII 字符串作为候选密钥
  5. 对每个候选密钥,尝试连接剥离头部后的数据库并执行SELECT count(*) FROM sqlite_master;

扫描结果:

  • 扫描 7 个 QQ 进程,共 3.8 GB 内存
  • 收集到 40,001 个候选密钥,验证到第 1,500 个左右时命中,成功提取密钥

接着按剥离 1024 字节头部 → 生成 → 逐表导出 → 生成明文数据库 的过程进行

c2c_msg_tablegroup_msg_table40800列(Protobuf BLOB)中搜索字节串b"07274e2fe9990417a1f599611cd36025"。在c2c_msg_table中找到1 条匹配记录,group_msg_table中未找到。

$07274e2fe9990417a1f599611cd36025.mp4 $07274E2FE9990417A1F599611CD36025.png fEhRag8Q-jb6FPILieEkWWDWf-8xdUxic2Y4dIIULKJGAuq6X-ZQDMgRwcm9kUID1JFoQDn4OJuj0FqmYXaS4jYYW3XoCsK2CAQJuag dEhQ4k-yIPDEk7SC5169Krv88fxHQLRjNhgMghgso7-O8rpf5lAMyBHByb2RQgPUkWhAlwP3hH60xpVJhi9ABSKO-egLrWYIBAm5q

是 Protobuf 二进制,需要解析才能读出结构化字段。将Protobuf 解析为结构化 JSON,在messages表中搜索目标字符串,得到如下结果:

{ "type": "video", "filename": "07274e2fe9990417a1f599611cd36025.mp4", "filesize": 61058204, "md5_hex": "07274e2fe9990417a1f599611cd36025", "duration": 49997, "cdn_url": null, "local_path": null }

结合本地文件比对大小即可得到:

维度消息记录中的原始文件本地缓存文件
md5_hex07274e2fe9990417a1f599611cd36025
filesize61,058,204 bytes (58.2 MB)51,226,940 bytes (48.8 MB)
内容 MD505fce820355ed39a43e61ffbef3d7f40
文件名07274e2fe9990417a1f599611cd36025.mp407274e2fe9990417a1f599611cd36025.mp4

说明文件名是发送方原始视频文件的 MD5QQ 用这个 MD5 作为本地缓存文件名。但 在本地存储时对视频进行了压缩/转码,导致文件变小、内容 MD5 改变,因此本地的.mp4文件内容 MD5 与文件名不一致。

之所以改名后会重新下载,是因为和浏览器缓存类似,QQ 识别本地文件是否已存在,通常靠的是文件路径和文件名,而不是文件内容的 MD5 哈希值。文件名一变,索引就失效了。虽然视频内容完全没变(MD5 值相同),但 QQ 并不会在打开前先做完整的内容校验。它只查"之前有没有下载过这个名称的文件",查不到就重新拉取。

参考资料

https://qqbackup.github.io/QQDecrypt/

http://www.gsyq.cn/news/1496326.html

相关文章:

  • 2026年免费AI编程工具推荐榜单
  • Unity基础(十四)场景异步加载
  • OpenSpec实战
  • android开发 原生设置中的Device name 与Device model
  • 学习比特 享幸福人生
  • 2026高考大数据:1290万考生背后的赛道拥挤度与捡漏指南
  • GEO基础优化包含哪些基础项目
  • Redis中的通用命令
  • 论文去重难?5个实用工具帮你
  • Boss-Key:终极窗口隐私保护神器,一键隐藏桌面窗口的完整指南
  • 2026河马引力67W避坑:分配不均协议阉割散热差别买
  • Java 文件复制(字符 / 字节缓冲流)
  • 人形机器人进真实场景,开发者需要关注哪些技术栈?
  • 创建订单报错‘无定价过程被确定’
  • 水性机调色浆WM系列技术优势:纳米分散赋能高效调色
  • 计算机毕业设计之基于大数据的用户购物系统
  • cat命令将调试信息指定到对应路径下
  • G-Helper终极降压指南:AMD CPU温度直降15℃的完整实战教程
  • 单点ORACLE EBS 网页端
  • QT生成文件添加图标
  • 马年本命年运势
  • 仿照moba游戏账号主页的HTML代码。它采用移动端优先设计,模拟了游戏内个人主页的视觉风格,并展示了玩家信息、常用英雄和近期战绩等核心数据
  • 说这是新出的网剧海报
  • 上海松江区哪里回收黄金+回收白银+回收铂金价格高又靠谱?2026年6月实测 - 沪上贵金属口碑推荐官
  • blender 设置单位
  • pypto昇腾Python工具库深度解析:高级Python绑定与昇腾NPU编程完全指南
  • 还在手动逐字转写音频浪费时间?2026年这4款音频怎么转换成文字产品秒出完整文稿
  • 2026理性选音频文件转文字产品,不花冤枉钱不踩雷我只推这一个
  • IPATool终极指南:5个技巧高效下载iOS应用包
  • 2026年广安别墅EPS构件安装趋势:专业服务商如何定义高品质外装新标准 - 2026年企业资讯