当前位置: 首页 > news >正文

微软 Foundry Local - 本地 AI 推理解决方案

微软在其 2025 Build 大会上发布了 Foundry Local,能够在本地设备上执行 AI 推理,意味着可以利用本地的 AI 算力,如:CPU/GPU/NPU;也让用户在隐私方面得到了充足的保障,还能有改善成本效益!Foundry Local 默认除了支持 CLI外,还支持 SDK、REST API 和 Catalog API,用户可以自行基于 Foundry Local 进行开发。在未来 Foundry Local 还将内置对 Agent/MCP 的支持。

Foundry Local 还支持跨平台,除了能够运行在Windows 11 上,还能够运行在 macOS。由于需要本地存储和运行模型,请确保有足够的算力和存储,Foundry Local 支持硬件加速:NVIDIA GPU(2000系列或更高版本)、AMD GPU(6000系列或更高)、Intel iGPU、Intel NPU(32GB或更多内存)、高通 Snapdragon X Elite(8GB或更多内存)、高通 NPU,以及 Apple 系列。

        要在本地以 Foundry Local 运行 AI 模型,首先需要安装 Foundry Local。

  • Windows:
    • winget install Microsoft.FoundryLocal
  • macOS:
    • brew tap microsoft/foundrylocal
    • brew install foundrylocal

        运行模型只需要执行:

foundry model run <model>

        在 Foundry Local 上可运行的模型有很多,可使用以下命令查看:

foundry model list

        还可以加载 --filter 参数对显示列表进行筛选。

其他有用的参数还有:

foundry model info <model> 显示有关特定模型的详细信息

foundry model download <model> 在不运行模型的情况下只下载模型到本地缓存

foundry model load <model> 将模型加载到服务中

foundry model unload <model> 从服务中卸载模

        要查看本地已经下载缓存的模型,可执行:

foundry cache list

image

要检查 Foundry Local 服务状态,可执行:

foundry service status

image

Foundry Local CLI 详细使用可参考:Foundry Local 文档。

Foundry Local SDK 目前支持 JavaScript、Python、C# 和 Rust,也可以使用 REST API 去调用 Foundry Local Service。这是一个用于演示或本地实验的示例项目,可能展示如何在本地环境中使用或集成“Foundry”相关功能。核心代码在https://github.com/andrewleader/FoundryLocalLabDemo/blob/main/FoundryLocalLabDemo/ExecutionLogic.cs:

封装 FoundryLocalManager,提供基础模型管理:
•    StartServiceAsync:启动本地 Foundry 服务
•    ListCatalogModelsAsync / ListCachedModelsAsync:列出目录/本地缓存模型
•    DownloadModelAsync:按进度流式下载模型(IAsyncEnumerable<ModelDownloadProgress>)
•    LoadModelAsync / UnloadModelAsync:加载/卸载模型


基于选定模型进行流式解析用户文本为结构化对象:
•    ParseStudentProfileStreamingAsync:
•    通过 OpenAIClient + Microsoft.Extensions.AI 创建聊天客户端(使用 FoundryLocalManager 提供的 Endpoint 和 ApiKey)
•    构造一个包含字符串枚举的 JSON Schema,要求模型仅输出 JSON
•    发送提示词并以流式方式接收回复,边接收边通过 IAsyncEnumerable<StudentProfileUpdate> 返回中间文本增量
•    收集完整回复后,去除可能的 <think> 标签和 ```json 代码块围栏,处理嵌套对象,再用 Json.NET(含 StringEnumConverter)反序列化为 StudentProfile
•    最后返回一次包含解析好的 StudentProfile 的更新


image

项目地址:https://github.com/andrewleader/FoundryLocalLabDemo

http://www.gsyq.cn/news/38961.html

相关文章:

  • win10 下运行aoe2,报错,应用程序无法正常启动 0xc000022
  • AI浪潮下的学习与就业:机遇还是陷阱?
  • 如何从csdn中快速转载文章(转载)
  • 一行“优雅”代码踩爆3x3矩阵:Python列表乘法的“共享引用”陷阱
  • 【C】 static用法
  • 模拟赛 31
  • P1.python环境的配置和安装
  • CSP-S 2025 游寄喵
  • Windows 10操作技巧:如何在 Windows 10 中恢复永久删除的文件
  • 2026 年预估适用于 Windows 10_11 的 10 款最佳数据恢复软件
  • 2025 年 9 款最佳 PDF 文档管理编辑工具
  • flex:1 什么意思
  • ESP32 I2C通信
  • day05-智能换脸-12306出行建议-提取音频工作流
  • x./AC自动机
  • 怎么在现有App里融入AI对话能力
  • DFS 序 O(1) 求 LCA
  • 矿山通信如何实现全域一体化?迈威为煤矿装上了“智慧神经网络”
  • 哈希学习总结
  • 2025 年 11 月制冷设备厂家推荐排行榜,小型制冷设备,空调制冷设备,工业制冷设备,商用制冷设备,大型制冷设备,制冷设备安装与维修服务公司推荐
  • 从创作到分析全搞定!2025公众号效率工具深度测评,这波升级95%的人还不知道
  • 20232304 2025-2026-1 《网络与系统攻防技术》实验四实验报告
  • k8s-java应用部署(4)
  • 单目三角化原理 - MKT
  • [CEOI 2017] Sure Bet
  • LeRobot v0.4.0 正式发布:全面提升开源机器人的学习能力
  • whk 笔记
  • 冬月做题记录
  • 低代码与传统开发:不是替代,而是互补
  • 11.3模拟赛