5.1 KiB

Raw Blame History

AI 模型 Capabilities 数据补充完成

日期: 2026-02-13
任务: 补充图片和视频模型的 capabilities 配置
参考文档:

✅ 已完成工作

1. 图片模型补充（新增）

模型系列	模型名称	关键能力
OpenAI	`gpt-image-1`, `gpt-image-1-mini`	size, quality, input_fidelity, output_format, n
Google Imagen	`imagen-4.0-ultra`, `imagen-4.0`, `imagen-4.0-fast`, `imagen-3.0`	size (1K/2K/4K/auto), quality, n
Qwen	`qwen-image-edit`	图像编辑模式，支持 erase/repaint/variation
Flux	`FLUX.1-Kontext-pro`	aspect_ratio, safety_tolerance, n
iRAG	`irag-1.0`, `ernie-irag-edit`	guidance, watermark, 图像编辑
Ideogram	`V3`	aspect_ratio (7 种比例), rendering_speed

2. 视频模型补充（新增）

模型系列	模型名称	分辨率支持	时长支持
Wan 2.6	`wan2.6-t2v`, `wan2.6-i2v`	480P/720P/1080P (13 种尺寸)	5s, 10s
即梦 3.0	`jimeng-3.0-720p`, `jimeng-3.0-1080p`, `jimeng-3.0-pro`	720P/1080P	5s, 10s (Pro)
Veo 快速	`veo-3.1-fast-generate-preview`	720P, 1080P	4s, 6s, 8s

3. 数据库更新统计

项	数量
已更新模型	10 个
跳过模型（音频/文本）	12 个
总配置模型	29 种（图片 + 视频）

📊 完整模型清单

图片模型（19 个）

OpenAI 系列

✅ dall-e-3
✅ gpt-image-1.5
✅ gpt-image-1
✅ gpt-image-1-mini

Google Imagen 系列

✅ imagen-4.0-ultra-generate-001
✅ imagen-4.0-generate-001
✅ imagen-4.0-fast-generate-001
✅ imagen-4.0-fast-generate-preview-06-06
✅ imagen-3.0-generate-002

Qwen 系列

✅ qwen-image
✅ qwen-image-edit

Doubao 系列

✅ doubao-seedream-4-5
✅ doubao-seedream-4-0

Flux 系列

✅ flux-2-flex
✅ flux-2-pro
✅ FLUX.1-Kontext-pro

iRAG 系列

✅ irag-1.0
✅ ernie-irag-edit

Ideogram 系列

✅ V3

视频模型（10 个）

OpenAI Sora 系列

✅ sora-2
✅ sora-2-pro

Google Veo 系列

✅ veo-3.1-generate-preview
✅ veo-3.0-generate-preview
✅ veo-3.1-fast-generate-preview

万相 Wan 系列

✅ wan2.2-t2v-plus
✅ wan2.2-i2v-plus
✅ wan2.5-t2v-preview
✅ wan2.5-i2v-preview
✅ wan2.6-t2v
✅ wan2.6-i2v

即梦 Jimeng 系列

✅ jimeng-3.0-720p
✅ jimeng-3.0-1080p
✅ jimeng-3.0-pro

🎯 关键特性说明

1. 尺寸格式

格式类型	模型	示例
固定尺寸	DALL-E, Sora	`1024x1024`, `1280x720`
档位格式	Veo	`720P`, `1080P`
K 格式	Flux, Imagen, Doubao	`1K`, `2K`, `4K`, `auto`
星号格式	Qwen, iRAG	`10241024`, `7681024`

2. 参考图片支持

数量	模型
1 张	大部分模型
2 张	Doubao 4-5/4-0（多图融合）
5 张	Flux 2 Flex

3. 特殊能力

能力	模型	说明
组图生成	Doubao 4-5	最多 15 张
图像编辑	Qwen Image Edit, iRAG Edit	erase/repaint/variation
宽高比	Flux, Ideogram	原生支持 aspect_ratio 参数
安全宽松度	Flux	safety_tolerance (0-6)

🚀 使用建议

前端调用示例

// 简单模式（使用适配器）
await generateImage({
  model: 'flux-2-pro',
  prompt: '一只猫在草地上',
  resolution: '1024',        // 统一参数
  aspectRatio: '16:9',       // 统一参数
  quality: 'high'            // 统一参数
})

// 高级模式（模型特定参数）
await generateImage({
  model: 'dall-e-3',
  prompt: '一只猫在草地上',
  size: '1792x1024',         // DALL-E 特定格式
  quality: 'hd',
  input_fidelity: 'high'
})

适配器工厂支持

已实现的适配器：

✅ SoraAdapter - Sora 2/2 Pro
✅ VeoAdapter - Veo 3.0/3.1/3.1-fast
✅ FluxAdapter - Flux 2 Pro/Flex/Kontext
✅ OpenAIAdapter - DALL-E 3, GPT Image 系列

待扩展：

🔲 WanAdapter - Wan 2.2/2.5/2.6 系列
🔲 JimengAdapter - 即梦 3.0 系列
🔲 ImagenAdapter - Imagen 4.0 系列

📁 相关文件

文件	说明
`server/scripts/migrate_model_capabilities.py`	迁移脚本（已更新 29 种模型配置）
`server/app/models/ai_model.py`	AIModel 模型（包含 capabilities JSONB 字段）
`server/app/services/ai_adapters/`	适配器实现（4 个适配器）
`docs/server/rfcs/144-ai-models-capability-config.md`	RFC 144 原始文档

✅ 验证

执行迁移脚本结果：

docker exec jointo-server-app python scripts/migrate_model_capabilities.py

# 输出
- 已更新: 10 个模型
- 已跳过: 12 个模型（音频/文本）

所有图片和视频模型的 capabilities 已成功同步到数据库！

实施人: Claude
审核状态: ✅ 数据迁移完成

5.1 KiB Raw Blame History

AI 模型 Capabilities 数据补充完成

✅ 已完成工作

1. 图片模型补充（新增）

2. 视频模型补充（新增）

3. 数据库更新统计

📊 完整模型清单

图片模型（19 个）

OpenAI 系列

Google Imagen 系列

Qwen 系列

Doubao 系列

Flux 系列

iRAG 系列

Ideogram 系列

视频模型（10 个）

OpenAI Sora 系列

Google Veo 系列

万相 Wan 系列

即梦 Jimeng 系列

🎯 关键特性说明

1. 尺寸格式

2. 参考图片支持

3. 特殊能力

🚀 使用建议

前端调用示例

适配器工厂支持

📁 相关文件

✅ 验证

5.1 KiB

Raw Blame History