当前位置: 首页 > news >正文

胖头鱼的技术专栏-436 AI时代需要怎样的数据库?今天这场直播也许给出了答案(20260629)

数据库管理436期 2026-06-29

  • 胖头鱼的技术专栏-436 AI时代需要怎样的数据库?今天这场直播也许给出了答案(20260629)

胖头鱼的技术专栏-436 AI时代需要怎样的数据库?今天这场直播也许给出了答案(20260629)

作者:胖头鱼的鱼缸(尹海文) Oracle ACE Pro: Database PostgreSQL ACE 10年+数据库行业经验 拥有OCM 11g/12c/19c、MySQL 8.0 OCP、Exadata、CDP等认证 墨天轮MVP,ITPUB认证专家 圈内拥有“总监”称号,非著名社恐(社交恐怖分子) 全网同名:胖头鱼的鱼缸 ITPUB:yhw1809 除授权转载并标明出处外,均为“非法”抄袭


AI Database,这个名词对于我来说,并不陌生,毕竟我的这个基于数据库的AI Agent基础设施架构目前适配了的两个数据库之一就是Oracle AI Database 26ai,如果回溯到2024年,那时候它还叫Oracle Database 23ai的时候,但是从名称里面已经看到Oracle将数据库推向AI的决策。

上周在朋友圈我也看到了一款国产数据库,OceanBase,开启了一个新的线上活动OceanBase Hours,首期嘉宾涵盖了OB的CEO、CTO和产品总,以及蚂蚁平台技术事业部总架构师,重量嘉宾云集,可见OceanBase对本次直播活动的重视程度。而公众号预告文章的题目也是“下周一见!OceanBase AI 数据库来了!”,看来OceanBase AI Database也到来了。

今天正好有时间(毕竟无业嘛),可以全程看看这场线上直播,但在开始之前,先聊几件事。首先,不知道大家发现没有,最近OceanBase改Logo了,除了图标改为单色以外,字体也产生了些许变化,尤其是“a”变化最大,不知道和本次直播的AIDB有没有关系(个人主观臆测,仅供娱乐)。

另一件事呢,其实也和AI时代数据库的很多概念有关,从最早的DB4AI/AI4DB,到后来的AI Ready,再到最近“广为流传”的AI Native,数据库的概念发展似乎比数据库本身的发展还要快很多,但我也看到了不少的迷失。

但是,在我看来,数据库是AI时代基础设施的最优选择,我最近的工作也是基于这一观点进行的。而本次直播活动中,OceanBase也提到了“AI数据库不是数据库的一个分支,而是AI时代的基础设施重建”。

在直播过程中,OceanBase阐释了一个AI时代数据库急需应对的问题,结合我的理解我对其进行了总结:

  • 数据库使用方的变化
    在传统业务系统以外,还有大量来自于AI Agent对数据库的操作,未来AI Agent甚至会成为数据库使用的助力,其中最大的变化就是业务场景从被动式响应变成了主动持续性操作
  • 数据模态的变化
    关系型数据仍然是核心,但是它们需要与更加广大的多模数据进行联动,对于数据类型就包含了向量、JSON、图、时序、GIS等数据,而更广大的业务适配场景则还包含文本、图像、音频、视频等信息

因此AI时代数据库就需要解决前面两个问题,实现全场景全模态的支持,OceanBase的答案是(取自官方材料):

  • 一体化
    多模态数据、离线与在线的计算,统一在同一个强一致的底座上。数据不再被切割、不必在多套系统之间反复搬运,那个"越用越准"的飞轮才转得起来
  • 多模态
    结构化、半结构化和非结构化数据,需要在同一套体系中被统一管理和治理,通过标量、全文、向量等方式进行混合搜索,智能体的记忆天生跨越模态,沉睡的非结构化数据也由此被真正盘活

在OceanBase原来已有强大的单机分布式一体化多模态数据库基础之上,通过下面的架构进化进一步实现AI时代一体化和多模态的数据库需求:

  • 通过湖库一体架构实现了在任何数据规模和数据模态场景需求下都能够在一套数据库内实现,将数据湖的开放格式与海量存储能力、数据库的结构化管理与在线服务能力统一起来,把结构化、半结构化和非结构化数据纳入同一套元数据、权限、事务和生命周期管理体系。数据不必在多个系统之间反复搬迁和复制,就可以直接支撑在线服务、实时分析和AI应用运行。
  • 在湖库一体的基础之上,通过多模表让结构化字段、文本、图片、音视频、JSON、文本、向量等数据形态进入同一张表的语义之下。虽仍然是一张表,其实承载更丰富的数据资产,并在同一套治理体系中被检索、计算和调用。
  • 在多模表之上,AI列进一步把模型能力引入数据处理链路。基于原始数据生成摘要、标签、特征、向量或其他语义结果,让模型理解能力以“列”的形式进入数据库,配合OceanBase早已实现的成熟的多模数据混合检索能力,让非结构化数据成为可搜索、可计算、可治理、可被Agent安全调用的数据资产。

但是数据库仍然有需要自己坚持的地方——数据安全,这里需要包括:

  • 容灾备份
    无论是生产数据库还是Agent的运行数据,都需要有效的安全防护,且数据库需要能够持续的提供服务。因此数据库的容灾备份能力仍然是AI时代数据安全且持续有效的最优选择
  • 数据隔离
    针对不同Agent的运行数据需要由数据库支持完整的隔离与共享机制能力,以确保AI时代数据安全的另一份保障并可实现数据可控的共享实现多Agent的高效协作
  • 可审计追溯
    针对重要来源的数据,数据库还应当做到操作可记录、可审计,必要时还需要实现防篡改

上面这些能力其实都是数据库的传统能力,是需要被坚持且不断完善的,这些是企业AI落地的坚实地基

在直播中我还看到一点和我做的系统不谋而合,即OceanBase AI数据库设计原则之一:

  • Agent友好:Agent所需的记忆、上下文、隔离、分支、回滚与规模化运行能力,不应该依赖外部系统拼装,而应成为数据底座的原生能力

要实现这一目标谈何容易,回到OceanBase的一体化多模态,这就是答案:通过湖库一体、多模表与AI列、多模混合检索等能力,满足全业务场景与全数据模态,让AI时代所需的任何操作不再被数据量、并发量、数据链路等因素被束缚,可以自由的使用统一的数据存取方式一套数据库中自由的操作,降低Agent在数据库底座中的工程化落地成本

对照我的系统,OceanBase AI数据库所展现出来的东西,也让其下一步适配的重点目标。结合我的开发经验,以Skill作为系统载体,充分调用数据库的各类MCP,我也期待看到OceanBase进一步完善AI数据库的周边生态。

最后以直播中OceanBase AI数据库的一句话含义结尾:

OceanBase AI数据库,是以湖库一体为核心架构、面向Agent和多模态数据设计的现代数据基础设施。它将数据库的事务、一致性与实时处理能力,与数据湖的开放、海量存储和多样化计算能力统一起来,把结构化、半结构化、非结构化数据纳入统一管理体系,打通在线服务与离线分析,消除多系统拼装带来的数据割裂、链路冗余与工程复杂性,为现代AI应用提供可靠、实时、可扩展的数据底座。

老规矩,知道写了些啥。

http://www.gsyq.cn/news/1606449.html

相关文章:

  • 批量更改BOM组件不参与成本计算-CEWB
  • 3分钟搞定M3U8视频下载:告别在线观看限制的高效工具
  • 34 年匠心造好机,大连欣科蜂窝板生产线实力稳居区域第一
  • 面向真实科研场景,构建由Codex、Claude Code、OpenClaw、Hermes四位“AI研究员“组成的可迭代、可迁移的科研协作团队
  • 如何轻松掌控电脑风扇:FanControl完整指南助你实现静音与性能的完美平衡
  • 办公提效工具 OpenClaw 安装全流程,部署报错统一处理方案(含安装包)
  • 做自媒体,我是怎么用花生AI绕过剪辑这道坎的
  • 2026ChatGPT、DEEPSEEK、豆包等AI搜索结果优化方法?
  • 使用低代码爬虫软件自动化采集电商商品数据
  • 网安新手攻克 Kali 难题大全!各类高频报错一次性给出解决方案,搞定环境问题稳步进阶,冲刺高薪安全赛道
  • DeepEval终极指南:5分钟掌握AI模型评估框架的完整配置
  • 从 AI Agent 到具身智能:当智能开始拥有“身体”
  • 5分钟免费实现VR视频转2D的终极指南:VR-Reversal完整教程
  • Minecraft光影终极指南:用Revelation打造电影级方块世界
  • 5步掌握Res-Downloader:跨平台资源下载工具全面指南
  • Audition软件安装步骤(附安装包)Audition AU2026 超详细下载安装教程
  • 3个MeEdu二次开发实战技巧:从API调用到Hook扩展的深度定制指南
  • (安装包)Windows OpenClaw 超详细安装!纯可视化操作,小白一遍装好
  • 配音工具怎选?2026自媒体避坑指南,新手选配音工具看这4点就够了
  • AI 标「已完成」,清单却是空的——让 .ai/ 规矩自检一次(附提示语)
  • 自由能商用燃气热水器:告别热水焦虑,用硬核实力定义高端商用热水
  • 计算机毕业设计之电脑商城销售管理系统的设计与实现
  • lattice propel的使用例子
  • 程序员量化交易实战 23:串起每日模拟盘流程
  • git进阶07_Git 高级技巧与故障排查
  • [大模型架构重构,或可完美适配昇腾]大模型不是生成器而是分类响应器——三段式归档-范式-输出引擎 + 分类调度缓存
  • 2026最新易学入门APP怎么选?
  • 金融法草案正式落地|数据分类分级升级为法定义务,金融机构合规闭环落地指南
  • 漫画收藏者的终极管理工具:如何用标签系统拯救混乱的本地漫画库?
  • ChatGPT Plus付费全流程拆解(Apple ID/Google Pay/国际信用卡三轨并行实操手册)