当前位置: 首页 > news >正文

Semantic Kernel使用连接器进行向量搜索

目录

向量搜索(Vector Search)

支持的向量类型

向量搜索选项

VectorProperty

Top 和 Skip

IncludeVectors

Filter

小结


Semantic Kernel 提供了向量存储(Vector Store)抽象层中的向量搜索功能,支持多种选项如过滤、分页等。本文将详细介绍其用法。

向量搜索(Vector Search)

SearchAsync方法允许基于已向量化的数据进行搜索。该方法接收一个向量和可选的VectorSearchOptions<TRecord>作为输入,适用于以下类型:

  • IVectorSearchable<TRecord>

  • VectorStoreCollection<TKey, TRecord>

注意VectorStoreCollection<TKey, TRecord>实现了IVectorSearchable<TRecord>

如下是VectorStoreCollection类的定义:

public abstract class VectorStoreCollection<TKey, TRecord> : IVectorSearchable<TRecord>, IDisposable where TKey : notnull where TRecord : class { ..... }

支持的向量类型

SearchAsync的向量参数为泛型类型。每个数据存储支持的向量类型不同,请参阅各连接器文档。

⚠️ 搜索向量类型必须与目标向量类型一致。例如,同一条记录中有两个不同类型的向量,需确保提供的搜索向量与目标向量类型匹配。若有多个向量,可通过VectorProperty指定目标。


向量搜索选项

通过VectorSearchOptions<TRecord>可配置以下选项:

VectorProperty

指定要搜索的向量属性。如果未指定且模型仅包含一个向量,则使用该向量。若没有或有多个向量而未指定,则会抛出异常。

public async IAsyncEnumerable<(Hotel Record, double? Score)> SearchByTextAsync( string query, int topK = 5, CancellationToken ct = default) { var queryVector = await _emb.CreateAsync(query, ct); var col = GetCollection(); var options = new VectorSearchOptions<Hotel> { //Filter = h => h.HotelName == "Tokyo", VectorProperty = h => h.DescriptionEmbedding, Skip = 0, IncludeVectors = false }; awaitforeach (var r in col.SearchAsync(queryVector, topK, options, ct)) { yield return (r.Record, r.Score); } }

Top 和 Skip

用于分页。

  • Top:返回前 N 条结果

  • Skip:跳过前 N 条结果

var vectorSearchOptions = new VectorSearchOptions<Product> { Skip = 40 }; var searchResult = collection.SearchAsync(searchVector, top: 20, vectorSearchOptions);

IncludeVectors

指定是否返回结果中的向量属性。

  • 默认值:false(节省带宽与处理成本)

  • 若为true,则返回完整向量数据

var vectorSearchOptions = new VectorSearchOptions<Product> { IncludeVectors = true };

Filter

用于在向量搜索前先对记录进行过滤。

好处:

  • 降低延迟和计算开销

  • 用于访问控制,过滤掉用户无权限的数据

⚠️ 很多存储需要字段设置为IsIndexed = true才能参与过滤。

public async IAsyncEnumerable<(Hotel Record, double? Score)> SearchByTextAsync( string query, int topK = 5, CancellationToken ct = default) { var queryVector = await _emb.CreateAsync(query, ct); var col = GetCollection(); var options = new VectorSearchOptions<Hotel> { Filter = h => h.HotelName == "Tokyo", VectorProperty = h => h.DescriptionEmbedding, Skip = 0, IncludeVectors = false }; awaitforeach (var r in col.SearchAsync(queryVector, topK, options, ct)) { yield return (r.Record, r.Score); } }

小结

Semantic Kernel 的 Vector Store 连接器提供了强大的向量搜索功能:

  • SearchAsync:执行相似度搜索

  • VectorProperty:选择目标向量

  • Top / Skip:支持分页

  • IncludeVectors:是否返回向量

  • Filter:先过滤后搜索,提高性能和安全性

这些功能让你能够在不同存储(如 InMemory、Qdrant 等)上轻松实现向量化搜索和检索。

引入地址

http://www.gsyq.cn/news/132383.html

相关文章:

  • 2025儿童鞋服品牌Top10揭晓!这些品牌凭什么征服家长? - 品牌测评鉴赏家
  • ESA正式授予Sivers波束成形技术开发合同
  • 第196期 TRAE 与 Amazon Kiro 智能体驱动集成开发环境(Agentic IDE)对比 - 详解
  • 第2章:LangChain大模型工具开发(Agent工具能力)
  • 跨境电子商务综合试验区DID(内含七批试验区名单)
  • 宝妈必看!2025高性价比儿童鞋服品牌红榜,安全舒适还省钱 - 品牌测评鉴赏家
  • 面向对象和异常
  • 再见,Kimi?月活不及豆包 5%,谁是下一个王?
  • Java计算机毕设之基于springboot的泳衣泳帽游泳用品专卖店系统的设计与实现基于springboot的游泳用品专卖店系统的设计与实现(完整前后端代码+说明文档+LW,调试定制等)
  • 单向循环链表
  • 2025年12月中国童装品牌深度调研:男生女生童装舒适度与性价比分析报告 - 品牌测评鉴赏家
  • Semantic Kernel 实战系列(七) - 高级主题 - Agents 与多代理系统
  • 《手搓》线程池优化的追求
  • mengzhu铃声
  • 在 Visual Studio 中引入计划功能(公开预览版)
  • 2025年度复盘与总结
  • BNO055九轴传感器原理图设计,已量产(加速度传感器)
  • 边界与内部和相等的稳定子数组
  • Semantic Kernel 实战系列(六) - Memory与向量存储
  • 2025冬至继上
  • 2025年12月中国童装品牌调研:HEYLADS男生女生品牌实力解析 - 品牌测评鉴赏家
  • 震惊!选对云服务器代理商,这5个关键指标必须知道!
  • sleuth(micrometer)+zipkin - yebinghuai-qq
  • 学习笔记:网络流
  • 本地知识库新选择:访答深度解析
  • 【PSO-LSTM】基于PSO优化LSTM网络的电力负荷预测附Python代码
  • 【Pytorch】基于LSTM-KAN、BiLSTM-KAN、GRU-KAN、TCN-KAN、Transformer-KAN(各种KAN修改一行代码搞定)的共享单车租赁预测研究(数据可换)附Pytho
  • 【协同攻击】基于人工势场算法APF实现无人机蜂群系统具有飞行时间和攻击角度的协同攻击研究附Matlab代码
  • 【程序员必备】LoRA微调技术面经总结:收藏级大模型学习指南
  • Java毕设选题推荐:基于springboot的校园一卡通管理系统的设计与实现 校园智能卡管理系统设计与实现【附源码、mysql、文档、调试+代码讲解+全bao等】