当前位置: 首页 > news >正文

47_Spring AI 干货笔记之图像模型 API

一、图像模型 API

Spring 图像模型 API 旨在提供一个简单且可移植的接口,用于与专注于图像生成的各种 AI 模型 交互,使开发人员能够以最少的代码更改在不同图像相关模型之间切换。这种设计符合 Spring 的模块化和可互换性理念,确保开发人员能够快速调整其应用程序以适应与图像处理相关的不同 AI 能力。

此外,借助 ImagePrompt(用于输入封装)和 ImageResponse(用于输出处理)等辅助类的支持,图像模型 API 统一了与专注于图像生成的 AI 模型的通信。它管理了请求准备和响应解析的复杂性,为图像生成功能提供了直接且简化的 API 交互。

Spring 图像模型 API 构建于 Spring AI 通用模型 API 之上,提供了图像特定的抽象和实现。

二、API 概述

本节提供了 Spring 图像模型 API 接口及相关类的指南。

三、图像模型

以下是 ImageModel 接口定义:

@FunctionalInterfacepublicinterfaceImageModelextendsModel<ImagePrompt,ImageResponse>{ImageResponsecall(ImagePromptrequest);}

3.1 ImagePrompt

ImagePrompt 是一个 ModelRequest,它封装了 ImageMessage 对象列表和可选的模型请求选项。以下列表显示了 ImagePrompt 类的简化版本,省略了构造函数和其他实用方法:

publicclassImagePromptimplementsModelRequest<List<ImageMessage>>{privatefinalList<ImageMessage>messages;privateImageOptionsimageModelOptions;@OverridepublicList<ImageMessage>getInstructions(){...}@OverridepublicImageOptionsgetOptions(){...}// 构造函数和实用方法已省略}

3.2 ImageMessage

ImageMessage 类封装了要使用的文本以及该文本在影响生成图像时应具有的权重。对于支持权重的模型,权重可以是正值或负值。

publicclassImageMessage{privateStringtext;privateFloatweight;publicStringgetText(){...}publicFloatgetWeight(){...}// 构造函数和实用方法已省略}

3.3 ImageOptions

表示可以传递给图像生成模型的选项。ImageOptions 接口扩展了 ModelOptions 接口,用于定义一些可以传递给 AI 模型的可移植选项。

ImageOptions 接口定义如下:

publicinterfaceImageOptionsextendsModelOptions{IntegergetN();StringgetModel();IntegergetWidth();IntegergetHeight();StringgetResponseFormat();// openai - url 或 base64 : stability ai byte[] 或 base64}

此外,每个特定模型的 ImageModel 实现都可以有自己的选项,这些选项可以传递给 AI 模型。例如,OpenAI 图像生成模型有自己的选项,如质量、风格等。

这是一个强大的功能,允许开发人员在启动应用程序时使用特定于模型的选项,然后在运行时使用 ImagePrompt 覆盖它们。

3.4 ImageResponse

ImageResponse 类的结构如下:

publicclassImageResponseimplementsModelResponse<ImageGeneration>{privatefinalImageResponseMetadataimageResponseMetadata;privatefinalList<ImageGeneration>imageGenerations;@OverridepublicImageGenerationgetResult(){// 获取第一个结果}@OverridepublicList<ImageGeneration>getResults(){...}@OverridepublicImageResponseMetadatagetMetadata(){...}// 其他方法已省略}

ImageResponse 类保存 AI 模型的输出,每个 ImageGeneration 实例包含由单个提示产生的多个可能输出中的一个。

ImageResponse 类还携带一个 ImageResponseMetadata 对象,该对象保存有关 AI 模型响应的元数据。

3.5 ImageGeneration

最后,ImageGeneration 类从 ModelResult 扩展而来,表示输出响应以及与此结果相关的元数据:

publicclassImageGenerationimplementsModelResult<Image>{privateImageGenerationMetadataimageGenerationMetadata;privateImageimage;@OverridepublicImagegetOutput(){...}@OverridepublicImageGenerationMetadatagetMetadata(){...}// 其他方法已省略}

四、可用实现

为以下模型提供商提供了 ImageModel 实现:

  • OpenAI 图像生成

  • Azure OpenAI 图像生成

  • QianFan 图像生成

  • StabilityAI 图像生成

  • ZhiPuAI 图像生成

五、API 文档

您可以在此处找到 Javadoc。

六、反馈与贡献

该项目的 GitHub 讨论区 是发送反馈的好地方。

http://www.gsyq.cn/news/114825.html

相关文章:

  • 【Java毕设源码分享】基于springboot+小程序的宿舍管理系统的设计与实现(程序+文档+代码讲解+一条龙定制)
  • 【Java毕设源码分享】基于springboot+vue的数据库课程在线教学平台设计与实现(程序+文档+代码讲解+一条龙定制)
  • 题解:qoj15309 Dumb Problem II
  • 边缘设备部署挑战:内存占用与算力需求平衡
  • AI语音伦理讨论:EmotiVoice的声音克隆是否安全?
  • Jenkins自动化构建与CI/CD流水线实战
  • vue基于springboot的连锁超市门店销售管理系统可视化大屏数据分析系统
  • EmotiVoice语音合成模型的热更新与无缝切换机制设计
  • Android selinux 权限 修复 avc: denied
  • 第35章 Shell 结合curl实现接口测试:GET/POST请求+响应解析
  • 智慧水务|供排水解决方案
  • 2025年质量好的金蝶印刷ERP行业口碑榜 - 行业平台推荐
  • 2025年终总结:国产洗板机知名品牌厂家推荐,附北京普天选购建议 - 品牌推荐大师
  • 2025年惠州审计公司权威推荐榜单:专业代账/公司注销/税务优化源头公司精选 - 品牌推荐官
  • 【time-rs】解释://! Error that occurred at some stage of parsing(error/parse.rs)
  • 清醒的堕落
  • 使用 Google Antigravity 在大地上码代码码
  • EmotiVoice语音合成在博物馆导览系统中的智能化升级
  • Nginx | HTTP 反向代理:与上游服务端建立连接处理实践
  • 告别PPT焦虑!百考通AI智能助手,一键生成专业答辩与开题PPT,让您的汇报闪耀全场
  • 基于深度学习YOLOV8道路裂缝检测系统 yolov8如何训练道路裂缝检测数据集
  • 开题报告PPT智能生成:从混沌到清晰的结构化展示
  • 高精度、低延迟、轻量化 YOLOV11创新点 骨干网络(backbone)改进 2、识别头改进 3、卷积块(Conv)改进 4、轻量化模型 5、移动端设计 6、多头注意力机制 7、空间和通道协同注意力
  • 告别繁琐问卷设计!百考通AI智能助手,5分钟生成专业调研问卷
  • 学术PPT颜值革命:百考通AI模板库与设计秘籍,告别“理工风审美”
  • Deepseek是被降智了吗?
  • 2025年年终西安管道疏通推荐:专业排行解析与多维度对比评测 - 品牌推荐
  • 把一维数组硬当成二维用:一次讲透 C 语言“指向数组的指针”
  • 神经紧张素受体SORT1
  • 【云计算】【Kubernetes】 ⑥ K8S Pod优雅下线全解析:从preStop到Eureka下线实战