当前位置: 首页 > news >正文

[智能体-287]:向量数据库 vs 传统关系型数据库(MySQL):存储内容 + 常用操作对比

向量数据库 vs 传统关系型数据库(MySQL):存储内容 + 常用操作对比

一、各自存放内容(核心区分,结合词向量案例)

1. 传统关系型数据库(MySQL/PostgreSQL):结构化数据

只存标量结构化数据,无高维浮点向量

存储字段类型:数字、字符串、日期、枚举、布尔

示例数据表:水果信息表

表格

id(int)name(varchar)category(varchar)price(float)create_time(date)
1苹果水果8.52025-01-10
2香蕉水果6.22025-01-11
3轿车交通工具999992025-02-01

用途:业务属性、原文、编号、价格、分类等业务字段。

2. 向量数据库(Milvus/Qdrant/Chroma):非结构化数据:向量

两类数据同存:标量字段 + 高维稠密向量字段(词向量 / Embedding)Collection(等价数据表)结构:

表格

id (主键)name (字符串标量)category (字符串标量)vec (向量字段,3 维浮点数组)
1苹果水果[0.61,0.22,-0.55]
2香蕉水果[0.58,0.25,-0.52]
3轿车交通工具[-0.62,0.28,0.35]
  • 标量:分类、名称、标签用于过滤;
  • 向量:由 Word2Vec/BERT 生成,用于语义相似度搜索。

落地规范:MySQL 存业务详情,向量库只存标签 + 向量 + 唯一 ID。

二、核心操作对比:增、删、改、查(重中之重)

1、新增数据

MySQL:INSERT,整行结构化写入

sql

INSERT INTO fruit(id,name,category,price) VALUES(1,'苹果','水果',8.5);

特点:字段固定约束、类型校验、支持事务。

向量库:add/insert,同时写入标量 + 向量数组

python

运行

coll.add(ids=["1"],documents=["苹果"],metadatas=[{"category":"水果"}], embeddings=[[0.61,0.22,-0.55]])

特点:向量是浮点数组,无严格范式约束。

2、删除数据

MySQL:按字段条件删除(等值 / 区间)

sql

DELETE FROM fruit WHERE id=1; DELETE FROM fruit WHERE category='水果';
向量库:按 id删 / 按标量过滤批量删

python

运行

coll.delete(ids=["1"]) coll.delete(where={"category":"水果"})

3、修改更新

MySQL:UPDATE,按条件修改任意标量字段

sql

UPDATE fruit SET price=9 WHERE id=1;
向量库:整体覆盖,不能单独修改向量中某一个浮点数,只能整条数据替换向量

python

运行

coll.update(ids=["1"],embeddings=[[0.62,0.23,-0.54]])

4、查询(最本质差距)!!!!

(1)MySQL:精确匹配 / 区间查询,没有语义检索能力
  • 等值查询

sql

SELECT * FROM fruit WHERE name='苹果';

只能查出苹果,查不出香蕉

  • 范围筛选

sql

SELECT * FROM fruit WHERE price<10 AND category='水果';

只能按字面、数值筛选,不懂词义相似。

(2)向量数据库:两种查询:标量过滤 + 向量相似度检索(ANN)
  1. 普通标量过滤(同 MySQL):筛选 category="水果"
  2. 核心:向量相似检索(独有)输入苹果向量[0.61,0.22,-0.55],查 Top2 相似:

python

运行

res=coll.query(query_embeddings=[[0.61,0.22,-0.55]],n_results=2)

返回:苹果、香蕉(语义相近,文字不一样也能命中)。

3.混合查询(工业常用):先标量过滤,再向量检索

python

运行

coll.query(query_embeddings=[...],where={"category":"水果"})

先筛水果类目,再在水果里找语义相似内容。

5、额外特有操作

MySQL 独有
  • JOIN 多表关联、GROUP BY 分组统计、聚合 (sum/count)、外键约束、事务回滚。
向量库独有
  • 构建 HNSW/IVF 向量索引、余弦 / L2 距离计算、向量归一化、批量向量聚类。

三、简明总结

  1. MySQL:存属性,查字面;擅长精确筛选、统计、业务账务。
  2. 向量库:存属性 + 词向量,查语义;擅长相似召回、RAG、以文搜文。
http://www.gsyq.cn/news/1472049.html

相关文章:

  • Hutool NumberUtil不止是计算器:生成随机验证码、判断质数、进制转换这些场景你用过吗?
  • 灰度发布与金丝雀发布
  • 目标检测Head设计避坑指南:从RetinaNet到DyHead,我踩过的那些注意力机制的‘坑’
  • 从一次失败的登录测试说起:手把手教你用Burp Suite给Pikachu靶场‘验证码绕过’漏洞做‘尸检报告’
  • 蓝绿发布与灰度发布
  • PyTorch为何成为TVA的“大脑皮层“(8)
  • 技术管理者如何用刨根问底法有效领导专业团队
  • VHDL实现占空比50%的5分频器:原理、代码与优化
  • 智慧树刷课插件:5分钟完成自动化学习的终极指南
  • 从一次内部攻防演练看JBoss漏洞:攻击者视角下的未授权访问与权限维持
  • 蓝绿发布和金丝雀发布
  • 质量好的工业吸尘器怎么选?关键性能与品牌解析 - 品牌排行榜
  • 知识图谱关系表示:从符号标签到自然语言的范式演进
  • 告别简单池化:用Attention机制让MIL模型在病理图像分类中更‘聪明’(PyTorch实战)
  • atomic 原子操作真的“原子“吗?CPU 指令真相解析
  • 2026年达州全屋定制工厂实力排行:达州星平方全屋定制工厂口碑怎么样/本地品牌对比 - 优质品牌商家
  • [智能体-292]:人类自然语言精髓:符号为壳,语境为坐标系|语言演化 + 人脑高情商语义理解全解
  • 【毕业设计】基于springboot后端微信小程序的丽江市旅游分享平台基于springboot+微信小程序的丽江市旅游分享平台(源码+文档+远程调试,全bao定制等)
  • 避坑指南:Termux安装Linux桌面时,关于音频、网络和性能的那些事儿
  • G-Helper:华硕笔记本用户的终极轻量级控制指南
  • 2026年东莞商家小程序怎么做
  • Hutool FileUtil实战:从日志清理到文件同步,3个真实项目场景应用
  • 淘宝买的CARSIM2020安装包,实测保姆级安装与破解教程(含HostID替换避坑指南)
  • 2026年C语言就业情况如何?想进IT大厂有机会吗?
  • 解决ISE调用ModelSim仿真失败:vlib work库创建问题深度解析
  • 淘宝买的CARSIM2020安装包,从下载到破解的保姆级避坑指南(含HostID获取)
  • 保姆级教程:给你的PyTorch模型装上‘X光’——TensorBoard逐层可视化权重与激活实战
  • 2025-2026年北京润府电话查询:看房前需了解项目定位与注意事项 - 品牌推荐
  • MCP协议实战:AI工程师的模型可控性架构指南
  • 告别枯燥时序图:用‘父子对话’和‘聊天应答’比喻彻底搞懂IIC协议(附STM32驱动OLED实例)