GitHub:https://github.com/drose-yu/Auto_generate_vedio


Workflow Web 项目说明

项目概述
Workflow Web 是一个 AI 视频自动化生成与剪辑的工作流演示项目。用户输入剧情文本后,可依次生成以下内容:

  • 剧情结构
  • 角色描述
  • 角色定妆照(参考图)
  • 镜头提示词
  • 首帧图
  • 视频
  • 旁白

支持自动合成视频与音频,最大亮点是上手难度极低,小白程序员按照步骤可在十分钟内复现效果。


项目结构

backend/   # FastAPI 后端(工作流编排、任务队列、导出、视频合成)
frontend/  # Vue 前端(参数配置、任务提交、进度展示、历史结果查看)


主要能力

  1. 剧情文本一键运行完整工作流
  2. 文本模型支持主模型 + 分阶段覆盖
  3. 图片模型、视频模型、TTS 参数可配置
  4. 任务化运行(创建任务 / 轮询状态 / 取消任务)
  5. 历史结果持久化与素材 ZIP 下载
  6. 基于 FFmpeg 的历史结果视频拼接(可带音频)

运行环境

  • Python 3.12+
  • Node.js 18+(建议 20+)
  • npm 9+
  • FFmpeg(仅在使用“历史视频拼接 compose”功能时必需)

部署步骤

1. 克隆项目
git clone https://github.com/drose-yu/Auto_generate_vedio.git

2. 启动后端

2.1 创建虚拟环境并安装依赖

  • Windows PowerShell:
    cd backend
    python -m venv .venv
    .\.venv\Scripts\Activate.ps1
    pip install -r requirements.txt
    

  • macOS / Linux:
    cd backend
    python3 -m venv .venv
    source .venv/bin/activate
    pip install -r requirements.txt
    

2.2 配置环境变量

  1. backend 目录下执行:
    Copy-Item .env.example .env
    

  2. 编辑 backend/.env,至少填写:
    APP_DOUBAO_API_KEY=your_doubao_api_key_here
    APP_TTS_APP_ID=your_tts_app_id_here
    APP_TTS_ACCESS_TOKEN=your_tts_access_token_here
    APP_TTS_CLUSTER=volcano_tts
    

    如何获取
    • 登录火山引擎获取 API_KEY
    • 开通大模型服务(可白嫖额度)
    • 搜索“豆包语音合成模型 2.0”获取 TTS 相关参数

2.3 启动后端服务

uvicorn app.main:app --reload --port 8010

健康检查:

curl http://127.0.0.1:8010/health

3. 启动前端
  1. 新开终端:
    cd frontend
    npm install
    npm run dev
    

  2. 默认访问地址:http://127.0.0.1:5173
  3. 前端已配置代理:/api -> http://127.0.0.1:8010
    (配置位置:frontend/vite.config.ts
4. FFmpeg 安装(命令行)
  • Windows(winget):
    winget install -e --id Gyan.FFmpeg
    ffmpeg -version
    

  • macOS(Homebrew):
    brew install ffmpeg
    ffmpeg -version
    

  • Ubuntu / Debian
    sudo apt update
    sudo apt install -y ffmpeg
    ffmpeg -version
    

    执行 ffmpeg -version 输出版本号即安装成功。

常见问题

  1. 报错:未配置 API Key

    • 确认 backend/.env 中已配置 APP_DOUBAO_API_KEY,且后端从 backend 目录启动。
  2. ffmpeg not found

    • 系统 PATH 中缺少 FFmpeg,按安装步骤重装后重启终端。
  3. 前端请求失败或跨域问题

    • 确认后端运行在 8010 端口,前端运行在 5173 端口,并启用 Vite 代理配置。
  4. 文本/图片/视频生成失败

    • 可自定义填入大模型 ID(在火山引擎模型广场获取):
      文本模型:doubao-seed-2-0-code-preview-260215
      图片模型:doubao-seedream-4-5-251128
      视频模型:doubao-seedance-1-5-pro-251215
      


Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐