一、工具概述

马上短剧生成系统(Horseplay)是一款开源免费的全流程AI短剧创作工具,基于Python开发,适配普通创作者与开发团队使用。工具整合剧本创作、分镜设计、图像生成、视频合成、语音配音全链路能力,仅需输入主题词即可自动批量生成多集短剧内容,同时可全程保障剧集角色、场景环境、配音音色的一致性,解决传统短剧创作流程繁琐、成本高、风格不统一的问题。

该工具支持两种使用模式:源码部署运行、单文件EXE直接运行,EXE版本无需安装、无需注册、无需配置依赖环境,上手门槛极低。

1.1 安装整合包下载地址:

链接: https://pan.baidu.com/s/147sFelB0ATOKTBapgUKVyQ?pwd=8888 提取码: 8888

二、核心功能技术详解

2.1 智能剧本管理模块

本模块依托主流大语言模型,实现自动化、标准化的短剧剧本创作,适配多种创作场景:

  • 支持主题词一键生成完整短剧剧本,同时兼容小说、文章、段子等文本素材改编为短剧剧本;

  • 集成 OpenAI、DeepSeek 大模型,自动生成剧情内容、人物对话、场景描述以及对应分镜脚本;

  • 自动将零散文案标准化为行业通用剧本格式,规范场景、台词、分镜结构;

  • 支持自定义剧集总数,可自由新增、编辑、删除单集内容,灵活管理分集剧情。

2.2 双一致性保障系统

这是该工具的核心技术亮点,解决AI生成内容风格混乱、角色场景跳变的行业痛点,全方位保障剧集连贯性:

  • 角色一致性:支持自定义角色外貌特征、人物设定、背景故事,可上传专属角色参考图,全程固定角色形象,避免生成画面人物错乱;

  • 环境一致性:支持场景档案管理与环境参考图上传,固定每一集的场景风格、光影、环境布局,保证系列短剧场景统一;

  • 无需反复微调提示词,大幅降低多集短剧的风格维护成本。

2.3 AI视频生成模块

工具接入多款主流商用视频生成模型,具备成熟的文生视频、图生视频能力:

  • 支持模型:Google Veo、OpenAI Sora、Runway、Stable Video Diffusion;

  • 支持根据剧本文字描述、分镜参考图两种方式生成短视频片段;

  • 适配横屏16:9、竖屏9:16主流短剧比例,支持720P、1080P分辨率输出。

2.4 智能音频合成模块

集成多平台TTS语音合成与音效生成能力,实现全自动音画同步:

  • 兼容 ElevenLabs、OpenAI TTS、Edge TTS 三大语音接口;

  • 可自动根据角色、台词生成富有情感的配音,支持自定义角色音色;

  • 自动匹配场景氛围,生成对应的背景音乐、环境音效;

  • 内置音色参数固化机制,保障多集剧集同一角色声音一致。

2.5 可视化智能分镜模块

  • 依托 DALL-E 3、Stable Diffusion 模型,将文字剧本自动转化为可视化分镜画面;

  • 支持自定义摄像机角度、运镜方式、画面风格等分镜参数;

  • 提供分镜预览、画面重绘、参数微调功能,提升视频生成可控性。

三、项目技术栈与目录结构

3.1 核心技术栈

  • 开发语言:Python 3.10+

  • 可视化界面:PyQt6(轻量化响应式GUI框架)

  • 大语言模型:OpenAI GPT-4o、DeepSeek

  • 图像生成模型:DALL-E 3、Stable Diffusion、Google Nano-banana

  • 视频生成模型:Google Veo 3.1、OpenAI Sora 2、Runway Gen4 Turbo

  • 音频合成模型:OpenAI TTS、ElevenLabs

  • 媒体处理工具:FFmpeg、OpenCV、Pydub

  • 数据存储:基于JSON格式轻量化存储项目配置

3.2 完整项目目录结构


e:\play_tool\
├── src/                    # 源代码
│   ├── ui/                 # 用户界面 (PyQt6)
│   ├── core/               # 核心业务逻辑 (剧本, 角色)
│   ├── ai_engine/          # AI 引擎接口 (LLM, 图像, 视频, 音频)
│   └── database/           # 数据持久化
├── resources/              # 资源与配置
│   ├── config/             # 配置文件
│   ├── projects/           # 用户项目 (Git 忽略)
│   └── scenes/             # 场景资源
├── .venv/                  # 虚拟环境
├── requirements.txt        # 依赖列表
└── main.py                 # 启动入口

四、环境部署与运行详细教程

4.1 前置环境要求

  • Python 版本:3.10及以上

  • 必备工具:安装 FFmpeg 并配置至系统环境变量PATH

4.2 方式一:源码部署(开发者推荐)

适合需要二次开发、自定义功能的用户,步骤如下:

1. 项目源码

整合包中 horseplay 目录就是项目源码

2. 创建并激活虚拟环境

# Windows
python -m venv .venv
.venv\Scripts\activate

# Linux/macOS
python3 -m venv .venv
source .venv/bin/activate

3. 安装项目全部依赖

pip install -r requirements.txt

4. 生成本地配置文件

# Windows
copy resources\config\config.example.json resources\config\config.json

# Linux/macOS
cp resources/config/config.example.json resources/config/config.json

5. 配置API密钥

打开 resources/config/config.json 配置文件,填入 OpenAI、DeepSeek、Google、ElevenLabs 等所需平台的API密钥,保存配置。

6. 启动项目程序

python src/main.py

4.3 方式二:EXE单文件运行(普通用户推荐)

无需配置环境、无需安装、无需注册,零门槛使用:

整合包中 horseplay.exe 文件

直接双击exe程序文件,即可打开工具正常使用。

五、API模型配置说明

工具支持多厂商AI模型自由切换配置,可在软件全局设置 - API服务配置界面管理所有模型接口:

  • 大语言模型:OpenAI GPT-4o、DeepSeek

  • 图像生成模型:OpenAI DALL-E 3、Google Nano-banana

  • 视频生成模型:Google Veo 3.1、OpenAI Sora 2、Runway Gen4 Turbo

  • 语音合成模型:OpenAI TTS-1、ElevenLabs

支持自定义新增、编辑、删除接口配置,可设置默认调用模型,适配不同使用需求。

{图片真实地址}

六、完整使用流程

  1. 新建项目:进入项目管理界面,创建短剧项目,自定义故事类型、总集数、视频比例、分辨率参数;

  2. 生成剧本:输入核心主题词,AI自动生成全套分集剧本、场景描述与台词内容,支持手动修改微调;

  3. 角色配置:自动提取剧本角色,手动补充人物设定、上传角色参考图、绑定配音音色;

  4. 场景设定:配置每集场景环境、时间、氛围,上传环境参考图,保障场景一致性;

  5. 生成分镜:AI自动生成可视化分镜画面与视频提示词,支持画面预览、重绘和参数调整;

  6. 视频合成:调用配置好的视频模型,将分镜画面批量生成短剧视频片段;

  7. 音频合成:自动匹配台词生成配音、适配场景生成音效和背景音乐,完成音画同步;

  8. 导出成品:整合所有片段,导出完整标准化短剧视频。

七、项目开发进度规划

  • 第一阶段:完成基础UI界面、项目管理功能、可视化剧本编辑器开发;

  • 第二阶段:完成AI核心能力集成,实现剧本自动生成、图像分镜生成功能;

  • 第三阶段:搭建视频合成流水线,实现分镜画面自动转视频;

  • 第四阶段:完善音频合成、Wav2Lip口型同步、自动混音功能;

  • 第五阶段:优化视频导出格式,新增时间轴编辑、素材剪辑等进阶功能。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐