免费AI短剧生成工具技术详解与完整部署教程
一、工具概述
马上短剧生成系统(Horseplay)是一款开源免费的全流程AI短剧创作工具,基于Python开发,适配普通创作者与开发团队使用。工具整合剧本创作、分镜设计、图像生成、视频合成、语音配音全链路能力,仅需输入主题词即可自动批量生成多集短剧内容,同时可全程保障剧集角色、场景环境、配音音色的一致性,解决传统短剧创作流程繁琐、成本高、风格不统一的问题。
该工具支持两种使用模式:源码部署运行、单文件EXE直接运行,EXE版本无需安装、无需注册、无需配置依赖环境,上手门槛极低。

1.1 安装整合包下载地址:
链接: https://pan.baidu.com/s/147sFelB0ATOKTBapgUKVyQ?pwd=8888 提取码: 8888
二、核心功能技术详解
2.1 智能剧本管理模块
本模块依托主流大语言模型,实现自动化、标准化的短剧剧本创作,适配多种创作场景:
-
支持主题词一键生成完整短剧剧本,同时兼容小说、文章、段子等文本素材改编为短剧剧本;
-
集成 OpenAI、DeepSeek 大模型,自动生成剧情内容、人物对话、场景描述以及对应分镜脚本;
-
自动将零散文案标准化为行业通用剧本格式,规范场景、台词、分镜结构;
-
支持自定义剧集总数,可自由新增、编辑、删除单集内容,灵活管理分集剧情。
2.2 双一致性保障系统
这是该工具的核心技术亮点,解决AI生成内容风格混乱、角色场景跳变的行业痛点,全方位保障剧集连贯性:
-
角色一致性:支持自定义角色外貌特征、人物设定、背景故事,可上传专属角色参考图,全程固定角色形象,避免生成画面人物错乱;
-
环境一致性:支持场景档案管理与环境参考图上传,固定每一集的场景风格、光影、环境布局,保证系列短剧场景统一;
-
无需反复微调提示词,大幅降低多集短剧的风格维护成本。
2.3 AI视频生成模块
工具接入多款主流商用视频生成模型,具备成熟的文生视频、图生视频能力:
-
支持模型:Google Veo、OpenAI Sora、Runway、Stable Video Diffusion;
-
支持根据剧本文字描述、分镜参考图两种方式生成短视频片段;
-
适配横屏16:9、竖屏9:16主流短剧比例,支持720P、1080P分辨率输出。
2.4 智能音频合成模块
集成多平台TTS语音合成与音效生成能力,实现全自动音画同步:
-
兼容 ElevenLabs、OpenAI TTS、Edge TTS 三大语音接口;
-
可自动根据角色、台词生成富有情感的配音,支持自定义角色音色;
-
自动匹配场景氛围,生成对应的背景音乐、环境音效;
-
内置音色参数固化机制,保障多集剧集同一角色声音一致。
2.5 可视化智能分镜模块
-
依托 DALL-E 3、Stable Diffusion 模型,将文字剧本自动转化为可视化分镜画面;
-
支持自定义摄像机角度、运镜方式、画面风格等分镜参数;
-
提供分镜预览、画面重绘、参数微调功能,提升视频生成可控性。




三、项目技术栈与目录结构
3.1 核心技术栈
-
开发语言:Python 3.10+
-
可视化界面:PyQt6(轻量化响应式GUI框架)
-
大语言模型:OpenAI GPT-4o、DeepSeek
-
图像生成模型:DALL-E 3、Stable Diffusion、Google Nano-banana
-
视频生成模型:Google Veo 3.1、OpenAI Sora 2、Runway Gen4 Turbo
-
音频合成模型:OpenAI TTS、ElevenLabs
-
媒体处理工具:FFmpeg、OpenCV、Pydub
-
数据存储:基于JSON格式轻量化存储项目配置
3.2 完整项目目录结构
e:\play_tool\
├── src/ # 源代码
│ ├── ui/ # 用户界面 (PyQt6)
│ ├── core/ # 核心业务逻辑 (剧本, 角色)
│ ├── ai_engine/ # AI 引擎接口 (LLM, 图像, 视频, 音频)
│ └── database/ # 数据持久化
├── resources/ # 资源与配置
│ ├── config/ # 配置文件
│ ├── projects/ # 用户项目 (Git 忽略)
│ └── scenes/ # 场景资源
├── .venv/ # 虚拟环境
├── requirements.txt # 依赖列表
└── main.py # 启动入口
四、环境部署与运行详细教程
4.1 前置环境要求
-
Python 版本:3.10及以上
-
必备工具:安装 FFmpeg 并配置至系统环境变量PATH
4.2 方式一:源码部署(开发者推荐)
适合需要二次开发、自定义功能的用户,步骤如下:
1. 项目源码
整合包中 horseplay 目录就是项目源码
2. 创建并激活虚拟环境
# Windows
python -m venv .venv
.venv\Scripts\activate
# Linux/macOS
python3 -m venv .venv
source .venv/bin/activate
3. 安装项目全部依赖
pip install -r requirements.txt
4. 生成本地配置文件
# Windows
copy resources\config\config.example.json resources\config\config.json
# Linux/macOS
cp resources/config/config.example.json resources/config/config.json
5. 配置API密钥
打开 resources/config/config.json 配置文件,填入 OpenAI、DeepSeek、Google、ElevenLabs 等所需平台的API密钥,保存配置。
6. 启动项目程序
python src/main.py
4.3 方式二:EXE单文件运行(普通用户推荐)
无需配置环境、无需安装、无需注册,零门槛使用:
直接双击exe程序文件,即可打开工具正常使用。
五、API模型配置说明
工具支持多厂商AI模型自由切换配置,可在软件全局设置 - API服务配置界面管理所有模型接口:
-
大语言模型:OpenAI GPT-4o、DeepSeek
-
图像生成模型:OpenAI DALL-E 3、Google Nano-banana
-
视频生成模型:Google Veo 3.1、OpenAI Sora 2、Runway Gen4 Turbo
-
语音合成模型:OpenAI TTS-1、ElevenLabs
支持自定义新增、编辑、删除接口配置,可设置默认调用模型,适配不同使用需求。
{图片真实地址}
六、完整使用流程
-
新建项目:进入项目管理界面,创建短剧项目,自定义故事类型、总集数、视频比例、分辨率参数;
-
生成剧本:输入核心主题词,AI自动生成全套分集剧本、场景描述与台词内容,支持手动修改微调;
-
角色配置:自动提取剧本角色,手动补充人物设定、上传角色参考图、绑定配音音色;
-
场景设定:配置每集场景环境、时间、氛围,上传环境参考图,保障场景一致性;
-
生成分镜:AI自动生成可视化分镜画面与视频提示词,支持画面预览、重绘和参数调整;
-
视频合成:调用配置好的视频模型,将分镜画面批量生成短剧视频片段;
-
音频合成:自动匹配台词生成配音、适配场景生成音效和背景音乐,完成音画同步;
-
导出成品:整合所有片段,导出完整标准化短剧视频。
七、项目开发进度规划
-
第一阶段:完成基础UI界面、项目管理功能、可视化剧本编辑器开发;
-
第二阶段:完成AI核心能力集成,实现剧本自动生成、图像分镜生成功能;
-
第三阶段:搭建视频合成流水线,实现分镜画面自动转视频;
-
第四阶段:完善音频合成、Wav2Lip口型同步、自动混音功能;
-
第五阶段:优化视频导出格式,新增时间轴编辑、素材剪辑等进阶功能。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)