免费AI短剧生成工具技术详解与完整部署教程

三少爷的拖鞋

997人浏览 · 2026-05-27 09:09:15

三少爷的拖鞋 · 2026-05-27 09:09:15 发布

一、工具概述

马上短剧生成系统（Horseplay）是一款开源免费的全流程AI短剧创作工具，基于Python开发，适配普通创作者与开发团队使用。工具整合剧本创作、分镜设计、图像生成、视频合成、语音配音全链路能力，仅需输入主题词即可自动批量生成多集短剧内容，同时可全程保障剧集角色、场景环境、配音音色的一致性，解决传统短剧创作流程繁琐、成本高、风格不统一的问题。

该工具支持两种使用模式：源码部署运行、单文件EXE直接运行，EXE版本无需安装、无需注册、无需配置依赖环境，上手门槛极低。

1.1 安装整合包下载地址：

链接: https://pan.baidu.com/s/147sFelB0ATOKTBapgUKVyQ?pwd=8888 提取码: 8888

二、核心功能技术详解

2.1 智能剧本管理模块

本模块依托主流大语言模型，实现自动化、标准化的短剧剧本创作，适配多种创作场景：

支持主题词一键生成完整短剧剧本，同时兼容小说、文章、段子等文本素材改编为短剧剧本；
集成 OpenAI、DeepSeek 大模型，自动生成剧情内容、人物对话、场景描述以及对应分镜脚本；
自动将零散文案标准化为行业通用剧本格式，规范场景、台词、分镜结构；
支持自定义剧集总数，可自由新增、编辑、删除单集内容，灵活管理分集剧情。

2.2 双一致性保障系统

这是该工具的核心技术亮点，解决AI生成内容风格混乱、角色场景跳变的行业痛点，全方位保障剧集连贯性：

角色一致性：支持自定义角色外貌特征、人物设定、背景故事，可上传专属角色参考图，全程固定角色形象，避免生成画面人物错乱；
环境一致性：支持场景档案管理与环境参考图上传，固定每一集的场景风格、光影、环境布局，保证系列短剧场景统一；
无需反复微调提示词，大幅降低多集短剧的风格维护成本。

2.3 AI视频生成模块

工具接入多款主流商用视频生成模型，具备成熟的文生视频、图生视频能力：

支持模型：Google Veo、OpenAI Sora、Runway、Stable Video Diffusion；
支持根据剧本文字描述、分镜参考图两种方式生成短视频片段；
适配横屏16:9、竖屏9:16主流短剧比例，支持720P、1080P分辨率输出。

2.4 智能音频合成模块

集成多平台TTS语音合成与音效生成能力，实现全自动音画同步：

兼容 ElevenLabs、OpenAI TTS、Edge TTS 三大语音接口；
可自动根据角色、台词生成富有情感的配音，支持自定义角色音色；
自动匹配场景氛围，生成对应的背景音乐、环境音效；
内置音色参数固化机制，保障多集剧集同一角色声音一致。

2.5 可视化智能分镜模块

依托 DALL-E 3、Stable Diffusion 模型，将文字剧本自动转化为可视化分镜画面；
支持自定义摄像机角度、运镜方式、画面风格等分镜参数；
提供分镜预览、画面重绘、参数微调功能，提升视频生成可控性。

三、项目技术栈与目录结构

3.1 核心技术栈

开发语言：Python 3.10+
可视化界面：PyQt6（轻量化响应式GUI框架）
大语言模型：OpenAI GPT-4o、DeepSeek
图像生成模型：DALL-E 3、Stable Diffusion、Google Nano-banana
视频生成模型：Google Veo 3.1、OpenAI Sora 2、Runway Gen4 Turbo
音频合成模型：OpenAI TTS、ElevenLabs
媒体处理工具：FFmpeg、OpenCV、Pydub
数据存储：基于JSON格式轻量化存储项目配置

3.2 完整项目目录结构


e:\play_tool\
├── src/                    # 源代码
│   ├── ui/                 # 用户界面 (PyQt6)
│   ├── core/               # 核心业务逻辑 (剧本, 角色)
│   ├── ai_engine/          # AI 引擎接口 (LLM, 图像, 视频, 音频)
│   └── database/           # 数据持久化
├── resources/              # 资源与配置
│   ├── config/             # 配置文件
│   ├── projects/           # 用户项目 (Git 忽略)
│   └── scenes/             # 场景资源
├── .venv/                  # 虚拟环境
├── requirements.txt        # 依赖列表
└── main.py                 # 启动入口

四、环境部署与运行详细教程

4.1 前置环境要求

Python 版本：3.10及以上
必备工具：安装 FFmpeg 并配置至系统环境变量PATH

4.2 方式一：源码部署（开发者推荐）

适合需要二次开发、自定义功能的用户，步骤如下：

1. 项目源码

整合包中 horseplay 目录就是项目源码

2. 创建并激活虚拟环境

# Windows
python -m venv .venv
.venv\Scripts\activate

# Linux/macOS
python3 -m venv .venv
source .venv/bin/activate

3. 安装项目全部依赖

pip install -r requirements.txt

4. 生成本地配置文件

# Windows
copy resources\config\config.example.json resources\config\config.json

# Linux/macOS
cp resources/config/config.example.json resources/config/config.json

5. 配置API密钥

打开 resources/config/config.json 配置文件，填入 OpenAI、DeepSeek、Google、ElevenLabs 等所需平台的API密钥，保存配置。

6. 启动项目程序