当前位置: 首页 > news >正文

ai-image-gen-mcp MCP 服务说明文档

1. 服务概述

一句话简介:多模型AI图像生成MCP Server。支持Seedream (Doubao)、SDXL、FLUX.1 Schnell/Dev。30x RTX 4090 GPU加速。

  • 服务名称:ai-image-gen-mcp
  • 版本号:最新版本
  • 开发者/提供方:zhaohongyuziranerran
  • 协议类型:MCP (Model Context Protocol)

2. 核心功能

列出该MCP服务提供的主要功能点:

  • 多模型支持:支持4种主流AI图像生成模型 - Seedream 5.0、SDXL、FLUX.1 Schnell、FLUX.1 Dev
  • 文本生成图像:根据文本描述生成高质量图像
  • 图像转换:支持图像到图像的转换和变换
  • 图像处理:提供图像放大(2x/4x)、背景移除等功能
  • 批量生成:支持批量生成多个图像
  • 风格迁移:支持8种艺术风格的迁移应用
  • GPU加速:30块RTX 4090 GPU加速本地模型推理

3. 使用场景

描述该服务适合在什么情况下使用:

  • 创意设计:快速生成创意图像,支持多种艺术风格
  • 内容创作:为文章、博客、社交媒体生成配图
  • 图像编辑:图像放大、背景移除、风格迁移等后期处理
  • 批量生产:批量生成大量图像,提高工作效率
  • 原型设计:快速生成设计原型和概念图

4. 接入方式

4.1 服务端点

在线访问地址:http://www.mzse.com/image-gen-mcp/

GitHub仓库:https://github.com/zhaohongyuziranerran/ai-image-gen-mcp

4.2 认证与权限

该服务需要配置以下环境变量:

  • SEEDREAM_API_KEY:Seedream API密钥(默认内置)
  • SEEDREAM_BASE_URL:Seedream API基础URL
  • COMFYUI_URL:本地ComfyUI端点(默认:http://localhost:8188)
  • IMAGE_OUTPUT_DIR:生成图像的输出目录

4.3 数据格式

所有请求和响应均采用JSON格式。图像生成结果返回图像URL或Base64编码。

4.4 服务器配置

在MCP客户端配置中添加服务:

{ "mcpServers": { "ai-image-gen-mcp": { "url": "http://www.mzse.com/image-gen-mcp/" } } }

5. 接口定义

该服务提供10个核心工具:

工具名称功能描述主要参数
generate_image文本生成图像prompt, model, style, size
generate_from_image图像到图像转换image, prompt, model
list_models列出可用模型
get_model_info获取模型详情和定价model_id
upscale_image超分辨率放大(2x/4x)image, scale
remove_background背景移除image
batch_generate批量生成图像prompts, model, style
get_generation_status检查任务状态task_id
style_transfer应用艺术风格image, style
image_variation生成图像变体image, num_variations

5.1 支持的模型

模型提供商速度质量成本
Seedream 5.0Doubao API~17秒¥0.04/图
SDXL本地 4090~5秒免费
FLUX.1 Schnell本地 4090~3秒免费
FLUX.1 Dev本地 4090~15秒最佳免费

5.2 支持的艺术风格

该服务支持8种艺术风格:

  • photorealistic:照片写实风格
  • anime:动漫风格
  • oil-painting:油画风格
  • watercolor:水彩风格
  • 3d-render:3D渲染风格
  • pixel-art:像素艺术风格
  • chinese-ink:中国水墨风格
  • cyberpunk:赛博朋克风格

6. 快速开始

6.1 环境要求

  • Python 3.8+
  • FastMCP 2.x
  • GPU(推荐):NVIDIA RTX 4090或更高配置
  • ComfyUI(用于本地模型)

6.2 示例代码

本地安装
# 安装依赖 pip install -r requirements.txt # 运行(stdio模式 - 用于Claude/WorkBuddy) python server.py # 运行(HTTP模式 - 用于远程访问) python server.py --transport http --port 8009
生成图像示例
generate_image( prompt="a cyberpunk cat jumping over neon signs", model="flux-schnell", style="cyberpunk", size="1024x1024" )
图像放大示例
upscale_image( image="path/to/image.jpg", scale=4 )
背景移除示例
remove_background( image="path/to/image.jpg" )
风格迁移示例
style_transfer( image="path/to/image.jpg", style="oil-painting" )

7. 注意事项

  • 模型选择:根据需求选择合适的模型,平衡速度、质量和成本
  • GPU加速:本地模型需要GPU支持,推荐使用RTX 4090或更高配置
  • API密钥:使用Seedream API需要配置API密钥
  • 输出目录:建议配置IMAGE_OUTPUT_DIR环境变量指定输出目录
  • 部署方式:支持stdio和HTTP两种传输模式,推荐使用在线访问方式
  • 许可证:采用MIT开源许可证
http://www.gsyq.cn/news/1610838.html

相关文章:

  • DART:采样两份草稿估计思考预算,节省 67% token 效果还更好
  • 机器学习与模式识别 第一章 机器学习导论 考点压缩
  • 数据安全检查,这3个API盲区最容易被问穿
  • 基于改进YOLOv8与无人机航拍的电动自行车违规行为智能检测系统实战
  • 别再傻傻手写了!Python一行代码判断是不是数字,爽到飞起
  • 如何免费使用Outfit字体:9种字重打造专业品牌设计的完整指南
  • File和IO
  • 与你的 Elasticsearch 数据对话:使用 Google ADK 和 MCP 构建一个实时语音 agent ,分为 3 个组件
  • C#工业视觉实战:集成工业相机与YOLOv8实现缺陷检测系统
  • Dify平台大模型接入实战:从云端API到本地部署全流程指南
  • 探索兴趣爱好的内涵
  • Postman便携版终极指南:Windows用户的免安装API开发解决方案
  • 48.可直接落地!IEC61131-3 ST 完整源码|PLC 物料分拣 + PID 调速 + Modbus 通信
  • SH9递归对抗驱动的活系统:九层架构理论体系深度研究报告(世毫九实验室原创研究)
  • 零基础入门MySQL数据分析:从SQL语法到电商实战项目
  • 洛谷 P2024:[NOI2001] 食物链 ← 扩展域并查集
  • 35款自动脱壳工具合集:逆向工程中的“开罐器”与“手术刀”
  • 只会写业务 UI 走不远!吃透这套 Framework 体系,跳槽大厂拉开薪资差距
  • 什么!翻译论文还要消耗token? 关于如何提升marker转英文文档速度,并使用skill批量翻译论文
  • openEuler-portal-mcp智能推荐系统:如何实现100%工具推荐覆盖率
  • Apache Commons Text RCE漏洞CVE-2022-42889:原理、复现与安全修复
  • Kali Linux 渗透测试环境搭建:VMware 虚拟机安装配置全流程指南
  • YOLOv8知识蒸馏实战:从37%到42%mAP,无损提升轻量模型精度
  • C语言指针详解3
  • 工作原理:其核心是一个两步过程。
  • Mineradio音乐播放器下载安装地址
  • 机顶盒B860AV2.1-M刷机攻略
  • 从 ABAP 后端到 AEX,Local Integration Engine 下的 Business System 配置全景
  • AI渐进编程之四:状态机如何约束 AI 的动作?
  • 【SI_GMSL2】深入了解示波器测试GMSL2眼图