26 KiB

Raw Blame History

AI 剧本解析提示词

文档版本：v2.0
最后更新：2026-02-06
重要变更：支持两阶段解析，解决Token限制问题

解析策略

为了解决长剧本的Token限制问题，采用两阶段解析策略：

阶段1：提取全局元素（1次AI调用）

输入：完整剧本文本
输出：角色、场景、道具及其标签
Token消耗：约15,000 tokens

阶段2：分批拆解分镜（N次AI调用，可并行）

输入：剧本片段 + 已提取的元素列表
输出：该片段的分镜数组（含对白）
Token消耗：每批约5,000-8,000 tokens

用户体验流程

用户上传剧本
    ↓
阶段1：提取元素
    ↓
前端显示元素列表（用户可审核/修改）
    ↓
用户确认 → 开始拆解分镜
    ↓
阶段2：分批拆解分镜（实时进度）
    ↓
完成：查看完整分镜列表

阶段1：提取元素

完整提示词（阶段1）

将以下内容复制给AI使用：

# 系统角色

你是一个专业的影视剧本分析专家，擅长从剧本中提取角色、场景、道具信息，并识别它们的不同状态和变体。

---

# 任务说明

请分析以下剧本，提取所有角色、场景、道具信息，并为每个元素识别不同的状态标签。

## 1. 角色（Characters）

- **识别所有出现的角色**
- **为每个角色提取不同的年龄段/状态标签**（如：少年、青年、老年、受伤状态等）
- **描述每个标签的具体特征**（年龄、服装、外貌、情绪状态等）
- **标注角色类型**：主角(main)、配角(supporting)、群演(extra)
- **标注是否为画外音角色**（如纪录片解说员、旁白）

**示例**：
- 角色名：孙悟空
  - 标签1：少年（15岁，穿着布衣，活泼好动）
  - 标签2：青年（30岁，身穿金甲，英勇果敢）

## 2. 场景（Locations）

- **识别所有拍摄场景**
- **为每个场景提取不同的时间/氛围标签**（如：白天、夜晚、春天、冬天等）
- **描述每个标签的具体特征**（光照、天气、季节、氛围等）

**示例**：
- 场景名：花果山
  - 标签1：白天（阳光明媚，鸟语花香）
  - 标签2：夜晚（月光下，宁静神秘）

## 3. 道具（Props）

- **识别所有重要道具**
- **为每个道具提取不同的状态标签**（如：崭新、破损、生锈等）
- **描述每个标签的具体特征**
- **标注道具类型**：
  - `interactive`（互动道具）：角色会使用/操作的道具
  - `set_dressing`（布景道具）：场景装饰性道具
- **标注归属**：
  - 互动道具：标注归属角色（`owner_character`）
  - 布景道具：标注归属场景（`owner_location`）

**示例**：
- 道具名：金箍棒
  - 类型：interactive
  - 归属角色：孙悟空
  - 标签1：崭新（刚打造，金光闪闪）
  - 标签2：破损（战斗后，有裂纹）
- 道具名：石桌
  - 类型：set_dressing
  - 归属场景：花果山
  - 标签1：风化（经年累月，长满青苔）

---

# 输出格式要求

请严格按照以下JSON格式返回结果：

```json
{
  "characters": [
    {
      "name": "角色名",
      "description": "角色描述",
      "role_type": "main|supporting|extra",
      "is_offscreen": false,
      "meta_data": {
        "gender": "male|female",
        "species": "人类|动物|其他",
        "personality": "性格描述"
      }
    }
  ],
  "character_tags": {
    "角色名": [
      {
        "tag_key": "youth",
        "tag_label": "少年",
        "description": "15岁的孙悟空，穿着布衣",
        "meta_data": {
          "age": 15,
          "clothing": "布衣",
          "mood": "活泼"
        }
      }
    ]
  },
  "locations": [
    {
      "name": "场景名",
      "location": "地点",
      "description": "场景描述",
      "meta_data": {}
    }
  ],
  "location_tags": {
    "场景名": [
      {
        "tag_key": "daytime",
        "tag_label": "白天",
        "description": "阳光明媚的花果山",
        "meta_data": {
          "lighting": "natural",
          "weather": "sunny"
        }
      }
    ]
  },
  "props": [
    {
      "name": "道具名",
      "description": "道具描述",
      "prop_type": "interactive|set_dressing",
      "owner_character": "角色名（互动道具）",
      "owner_location": "场景名（布景道具）",
      "meta_data": {
        "material": "材质",
        "size": "尺寸"
      }
    }
  ],
  "prop_tags": {
    "道具名": [
      {
        "tag_key": "new",
        "tag_label": "崭新",
        "description": "刚打造的金箍棒",
        "meta_data": {
          "condition": "new"
        }
      }
    ]
  }
}
```

---

# 剧本内容

{在这里插入剧本文本}

---

# 重要提示

1. **标签必须有明确的视觉差异**：不同标签应该在画面上有明显区别
2. **道具分类准确**：互动道具归属角色，布景道具归属场景
3. **元数据完整**：尽可能提供详细的meta_data信息
4. **名称一致性**：确保所有名称拼写一致，后续阶段会引用这些名称

输出格式（阶段1）

返回JSON格式，结构如下：

{
  "characters": [
    {
      "name": "角色名",
      "description": "角色描述",
      "role_type": "main|supporting|extra",
      "is_offscreen": false,
      "meta_data": {
        "gender": "male|female",
        "species": "人类|动物|其他",
        "personality": "性格描述"
      }
    }
  ],
  "character_tags": {
    "角色名": [
      {
        "tag_key": "youth",
        "tag_label": "少年",
        "description": "15岁的孙悟空，穿着布衣",
        "meta_data": {
          "age": 15,
          "clothing": "布衣",
          "mood": "活泼"
        }
      }
    ]
  },
  "locations": [
    {
      "name": "场景名",
      "location": "地点",
      "description": "场景描述",
      "meta_data": {}
    }
  ],
  "location_tags": {
    "场景名": [
      {
        "tag_key": "daytime",
        "tag_label": "白天",
        "description": "阳光明媚的花果山",
        "meta_data": {
          "lighting": "natural",
          "weather": "sunny"
        }
      }
    ]
  },
  "props": [
    {
      "name": "道具名",
      "description": "道具描述",
      "prop_type": "interactive|set_dressing",
      "owner_character": "角色名（互动道具）",
      "owner_location": "场景名（布景道具）",
      "meta_data": {
        "material": "材质",
        "size": "尺寸"
      }
    }
  ],
  "prop_tags": {
    "道具名": [
      {
        "tag_key": "new",
        "tag_label": "崭新",
        "description": "刚打造的金箍棒",
        "meta_data": {
          "condition": "new"
        }
      }
    ]
  }
}

阶段2：拆解分镜

完整提示词（阶段2）

将以下内容复制给AI使用：

# 系统角色

你是一个专业的影视分镜师，擅长将剧本拆解为可执行的分镜脚本。你需要根据已识别的角色、场景、道具，将剧本片段拆解为详细的分镜。

---

# 已识别的元素列表

## 角色
{在这里插入角色列表及其标签，格式如下：}

- 孙悟空
  - 少年：15岁，穿着布衣，活泼好动
  - 青年：30岁，身穿金甲，英勇果敢
- 菩提祖师
  - 老年：白发苍苍，身穿道袍，仙风道骨

## 场景
{在这里插入场景列表及其标签，格式如下：}

- 花果山
  - 白天：阳光明媚，鸟语花香
  - 夜晚：月光下，宁静神秘
- 斜月三星洞
  - 夜晚：火把摇曳，光影交错

## 道具
{在这里插入道具列表及其标签，格式如下：}

- 金箍棒（互动道具，归属：孙悟空）
  - 崭新：金光闪闪，光芒四射
- 石桌（布景道具，归属：花果山）
  - 风化：表面有青苔和裂纹
- 蒲团（布景道具，归属：斜月三星洞）
  - 陈旧：边缘磨损，但依然整洁

---

# 任务说明

请将以下剧本片段拆解为分镜脚本。

## 拆解要求

为每个分镜提供：

### 1. 基本信息
- **标题**：简短描述（如"孙悟空初登场"）
- **描述**：画面内容详细描述
- **拍摄描述**：景深、运镜方式、镜头语言、拍摄技巧

### 2. 影视专业参数
- **景别（shot_size）**：1-8（见下方枚举表）
- **运镜（camera_movement）**：1-9（见下方枚举表）
- **预估时长（estimated_duration）**：秒

### 3. 元素关联
- **角色**：使用已识别的角色名和标签名
- **场景**：使用已识别的场景名和标签名
- **道具**：使用已识别的道具名和标签名
- 为每个元素指定：
  - `action`：动作描述（如"大笑"、"奔跑"、"挥舞"）
  - `position`：画面位置（left/center/right/background/foreground）
  - `is_visible`：是否可见（画外音设为false）

### 4. 对白（Dialogues）
- **角色名**：说话的角色（必须是已识别的角色）
- **内容**：对白文本
- **对白类型**：1=普通对白, 2=内心OS, 3=旁白
- **顺序**：在分镜中的顺序（从0开始）
- **情绪**：高兴/悲伤/愤怒等（可选，用于TTS）

---

# 枚举值对照表

## 景别（shot_size）
1. extreme_wide_shot - 大远景（建立场景）
2. wide_shot - 远景（展示环境）
3. full_shot - 全景（全身）
4. medium_shot - 中景（腰部以上）
5. medium_close_up - 中近景（胸部/肩部以上）
6. close_up - 特写（面部）
7. extreme_close_up - 大特写（局部细节）
8. over_shoulder - 过肩镜头（对话场景）

## 运镜（camera_movement）
1. static - 固定
2. pan - 摇镜（水平旋转）
3. tilt - 俯仰（垂直旋转）
4. dolly - 推拉（前后移动）
5. zoom - 变焦（焦距变化）
6. tracking - 跟踪（跟随主体）
7. arc - 环绕（圆周运动）
8. crane - 升降（垂直移动/摇臂）
9. handheld - 手持（纪录片风格）

## 对白类型（dialogue_type）
1. normal - 普通对白（角色之间的正常对话）
2. inner_monologue - 内心OS（角色的内心独白，其他角色听不到）
3. narration - 旁白（画外音、解说、回忆旁白等）

---

# 输出格式要求

请严格按照以下JSON格式返回结果：

```json
{
  "storyboards": [
    {
      "title": "分镜标题",
      "description": "画面描述",
      "shooting_description": "拍摄描述",
      "shot_size": 4,
      "camera_movement": 1,
      "estimated_duration": 5.5,
      "order_index": 1,
      "start_time": 0.0,
      "end_time": 5.5,
      "meta_data": {
        "lighting": "自然光",
        "weather": "晴天",
        "time_of_day": "上午",
        "camera_angle": "仰拍",
        "lens": "广角"
      },
      "characters": [
        {
          "name": "孙悟空",
          "tag_label": "少年",
          "action": "挥舞金箍棒",
          "position": "center",
          "is_visible": true,
          "order": 0
        }
      ],
      "locations": [
        {
          "name": "花果山",
          "tag_label": "白天",
          "order": 0
        }
      ],
      "props": [
        {
          "name": "金箍棒",
          "tag_label": "崭新",
          "action": "被挥舞",
          "position": "foreground",
          "order": 0
        }
      ],
      "dialogues": [
        {
          "character_name": "孙悟空",
          "content": "今日我便要闯出一番天地！",
          "dialogue_type": 1,
          "sequence_order": 0,
          "emotion": "兴奋"
        }
      ]
    }
  ]
}
```

---

# 剧本片段

{在这里插入剧本片段文本}

---

# 重要提示

1. **必须使用已识别的元素**：角色、场景、道具的名称必须与上方列表完全一致
2. **必须使用已识别的标签**：tag_label必须是该元素的已识别标签
3. **动作描述要具体**：如"大笑"、"奔跑"、"挥舞"，而不是"动作"
4. **位置要明确**：使用标准位置值（left/center/right/background/foreground）
5. **对白结构化**：每条对白独立，包含完整信息
6. **顺序连续**：order_index从1开始连续递增，时间轴连续

输出格式（阶段2）

返回JSON格式，结构如下：

{
  "storyboards": [
    {
      "title": "分镜标题",
      "description": "画面描述",
      "shooting_description": "拍摄描述",
      "shot_size": 4,
      "camera_movement": 1,
      "estimated_duration": 5.5,
      "order_index": 1,
      "start_time": 0.0,
      "end_time": 5.5,
      "meta_data": {
        "lighting": "自然光",
        "weather": "晴天"
      },
      "characters": [
        {
          "name": "孙悟空",
          "tag_label": "少年",
          "action": "挥舞金箍棒",
          "position": "center",
          "is_visible": true,
          "order": 0
        }
      ],
      "locations": [
        {
          "name": "花果山",
          "tag_label": "白天",
          "order": 0
        }
      ],
      "props": [
        {
          "name": "金箍棒",
          "tag_label": "崭新",
          "action": "被挥舞",
          "position": "foreground",
          "order": 0
        }
      ],
      "dialogues": [
        {
          "character_name": "孙悟空",
          "content": "今日我便要闯出一番天地！",
          "dialogue_type": 1,
          "sequence_order": 0,
          "emotion": "兴奋"
        }
      ]
    }
  ]
}

字段说明

角色字段（Characters）

字段	类型	必填	说明
name	string	✅	角色名称
description	string	✅	角色描述
role_type	string	✅	角色类型：main(主角)/supporting(配角)/extra(群演)
is_offscreen	boolean	✅	是否为画外音角色（不出现在画面中）
meta_data	object	✅	额外元数据（性别、物种、性格等）

角色标签字段（Character Tags）

字段	类型	必填	说明
tag_key	string	✅	标签键（如youth/adult/old）
tag_label	string	✅	标签显示名称（如"少年"/"青年"/"老年"）
description	string	✅	标签详细描述（年龄、服装、外貌等）
meta_data	object	✅	额外元数据（age/clothing/mood等）

场景字段（Locations）

字段	类型	必填	说明
name	string	✅	场景名称
location	string	⚪	场景地点
description	string	✅	场景描述
meta_data	object	✅	额外元数据

场景标签字段（Location Tags）

字段	类型	必填	说明
tag_key	string	✅	标签键（如daytime/night）
tag_label	string	✅	标签显示名称（如"白天"/"夜晚"）
description	string	✅	标签详细描述（光照、天气、氛围等）
meta_data	object	✅	额外元数据（lighting/weather/season等）

道具字段（Props）

字段	类型	必填	说明
name	string	✅	道具名称
description	string	✅	道具描述
prop_type	string	✅	道具类型：interactive(互动道具)/set_dressing(布景道具)
owner_character	string	⚪	归属角色（互动道具必填）
owner_location	string	⚪	归属场景（布景道具必填）
meta_data	object	✅	额外元数据（material/size/color等）

道具标签字段（Prop Tags）

字段	类型	必填	说明
tag_key	string	✅	标签键（如new/old/damaged）
tag_label	string	✅	标签显示名称（如"崭新"/"陈旧"/"破损"）
description	string	✅	标签详细描述
meta_data	object	✅	额外元数据（condition/appearance等）

分镜字段（Storyboards）

字段	类型	必填	说明
title	string	✅	分镜标题
description	string	✅	画面描述
shooting_description	string	⚪	拍摄描述（景深、运镜方式、镜头语言）
shot_size	integer	⚪	景别（1-8，见枚举表）
camera_movement	integer	⚪	运镜（1-9，见枚举表）
estimated_duration	number	⚪	预估时长（秒）
order_index	integer	✅	顺序索引（从1开始）
start_time	number	✅	开始时间（秒）
end_time	number	✅	结束时间（秒）
meta_data	object	✅	额外元数据（lighting/weather/time_of_day等）
characters	array	✅	关联的角色数组
locations	array	✅	关联的场景数组
props	array	✅	关联的道具数组
dialogues	array	✅	对白数组

分镜角色关联字段

字段	类型	必填	说明	数据库字段
name	string	✅	角色名称（必须是已识别的角色）	element_name
tag_label	string	✅	标签名称（必须是该角色的已识别标签）	tag_label
action	string	⚪	动作描述（如"大笑"/"奔跑"）	action_description
position	string	⚪	画面位置（left/center/right/background/foreground）	spatial_position
is_visible	boolean	✅	是否在画面内（画外音设为false）	is_visible
order	integer	✅	显示顺序	display_order

分镜场景关联字段

字段	类型	必填	说明	数据库字段
name	string	✅	场景名称（必须是已识别的场景）	element_name
tag_label	string	✅	标签名称（必须是该场景的已识别标签）	tag_label
order	integer	✅	显示顺序	display_order

分镜道具关联字段

字段	类型	必填	说明	数据库字段
name	string	✅	道具名称（必须是已识别的道具）	element_name
tag_label	string	✅	标签名称（必须是该道具的已识别标签）	tag_label
action	string	⚪	动作描述（如"被挥舞"/"被打开"）	action_description
position	string	⚪	画面位置（left/center/right/background/foreground）	spatial_position
order	integer	✅	显示顺序	display_order

对白字段（Dialogues）

字段	类型	必填	说明
character_name	string	✅	说话的角色名称
content	string	✅	对白内容
dialogue_type	integer	✅	对白类型（1=普通对白, 2=内心OS, 3=旁白）
sequence_order	integer	✅	在分镜中的顺序（从0开始）
emotion	string	⚪	情绪标记（用于TTS生成和时长计算，如"高兴"/"悲伤"/"愤怒"）

注意：

无需返回时长字段：台词时长由后端根据字数、语速、情绪自动计算
情绪标记很重要：影响语速调整（高兴/兴奋语速快，悲伤/疲惫语速慢）
对白类型影响时长：旁白比普通对白慢15%，内心OS慢10%

枚举值对照表

角色类型（role_type）

数值	字符串值	说明
-	main	主角
-	supporting	配角
-	extra	群演

道具类型（prop_type）

数值	字符串值	说明
-	interactive	互动道具（角色会使用/操作）
-	set_dressing	布景道具（场景装饰性）

景别（shot_size）

数值	字符串值	说明
1	extreme_wide_shot	大远景（建立场景）
2	wide_shot	远景（展示环境）
3	full_shot	全景（全身）
4	medium_shot	中景（腰部以上）
5	medium_close_up	中近景（胸部/肩部以上）
6	close_up	特写（面部）
7	extreme_close_up	大特写（局部细节）
8	over_shoulder	过肩镜头（对话场景）

运镜（camera_movement）

数值	字符串值	说明
1	static	固定
2	pan	摇镜（水平旋转）
3	tilt	俯仰（垂直旋转）
4	dolly	推拉（前后移动）
5	zoom	变焦（焦距变化）
6	tracking	跟踪（跟随主体）
7	arc	环绕（圆周运动）
8	crane	升降（垂直移动/摇臂）
9	handheld	手持（纪录片风格）

对白类型（dialogue_type）

数值	字符串值	说明
1	normal	普通对白（角色之间的正常对话）
2	inner_monologue	内心OS（角色的内心独白，其他角色听不到）
3	narration	旁白（画外音、解说、回忆旁白等）

后端集成

阶段1：存储元素

# Celery Worker 调用
async def store_elements(screenplay_id: UUID, parsed_data: Dict):
    """存储阶段1的解析结果"""
    # 1. 存储角色
    character_id_map = {}
    for char_data in parsed_data['characters']:
        character = await screenplay_service.add_character(
            screenplay_id, char_data
        )
        character_id_map[char_data['name']] = character.character_id
    
    # 2. 存储场景
    location_id_map = {}
    for location_data in parsed_data['locations']:
        location = await screenplay_service.add_location(
            screenplay_id, location_data
        )
        location_id_map[location_data['name']] = location.location_id
    
    # 3. 存储道具
    prop_id_map = {}
    for prop_data in parsed_data['props']:
        prop = await screenplay_service.add_prop(
            screenplay_id, prop_data
        )
        prop_id_map[prop_data['name']] = prop.prop_id
    
    # 4. 存储标签
    tag_id_maps = await tag_service.store_tags(
        screenplay_id,
        parsed_data,
        character_id_map,
        location_id_map,
        prop_id_map
    )
    
    return {
        'character_id_map': character_id_map,
        'location_id_map': location_id_map,
        'prop_id_map': prop_id_map,
        'tag_id_maps': tag_id_maps
    }

阶段2：存储分镜

# Celery Worker 调用
async def store_storyboards(
    screenplay_id: UUID,
    storyboards_data: List[Dict],
    tag_id_maps: Dict
):
    """存储阶段2的解析结果"""
    storyboard_ids = await storyboard_service.create_storyboards_from_ai(
        screenplay_id=screenplay_id,
        storyboards_data=storyboards_data,
        tag_id_maps=tag_id_maps
    )
    return storyboard_ids

重要提示

1. 标签设计原则

标签是元素的变体：一个角色可以有多个年龄段标签，一个场景可以有多个时间标签
标签必须有明确的视觉差异：不同标签应该在画面上有明显区别
标签用于分镜关联：分镜不直接关联"孙悟空"，而是关联"孙悟空-少年"这个标签

2. 道具分类规则

互动道具：角色会使用/操作的道具（如武器、工具、手机、钥匙）
- 必须标注归属角色（owner_character）
- 可以有动作描述（action）
布景道具：场景装饰性道具（如桌椅、花瓶、背景物品）
- 必须标注归属场景（owner_location）
- 通常无动作描述

3. 对白处理

结构化数据：对白必须是数组，每条对白独立
角色关联：character_name必须是已识别的角色名称
顺序管理：sequence_order从0开始，按对白出现顺序递增
情绪标记：可选，但建议提供，用于TTS生成时的情感控制

4. 分镜关联规则

必须使用已识别的元素：角色、场景、道具的名称必须与阶段1提取的一致
必须使用已识别的标签：tag_label必须是该元素的已识别标签
动作描述要具体：如"大笑"、"奔跑"、"挥舞"，而不是"动作"
位置要明确：使用标准位置值（left/center/right/background/foreground）

5. Token优化建议

阶段1：尽可能详细，包含所有元素和标签
阶段2：每批10-20个分镜，避免超过token限制
简化模式：如果剧本很长，可以省略emotion字段，由后端推断

6. 数据一致性

元素名称必须一致：阶段2引用的元素名称必须与阶段1完全一致
标签名称必须一致：阶段2引用的标签名称必须与阶段1完全一致
顺序索引连续：分镜的order_index必须连续（1, 2, 3...）
时间轴连续：分镜的start_time和end_time应该连续

7. 时长计算说明

台词时长：

AI 无需计算台词时长
后端会根据以下因素自动计算：
- 字数（中文字符数）
- 语速（正常4.5字/秒）
- 情绪（高兴/兴奋语速快，悲伤/疲惫语速慢）
- 对白类型（旁白比普通对白慢15%）
- 标点停顿（逗号0.25秒，句号0.5秒）

分镜时长：

AI 无需计算分镜时长
后端会根据以下因素自动计算：
- 所有台词的总时长
- 台词间隔（0.5秒/条）
- 景别（大远景5秒，特写1.5秒）
- 运镜（环绕增加50%，固定无增加）
- 缓冲时间（前后共1.5秒）

AI只需提供：

台词内容（content）
情绪标记（emotion）
对白类型（dialogue_type）
景别（shot_size）
运镜（camera_movement）

后端会自动计算并存储 estimated_duration 字段。

示例文件

完整的示例JSON文件请参考：screenplay-ai-parse-example.json

26 KiB Raw Blame History