电影台词搜索引擎开源源码
剪影 — 电影台词搜索引擎
剪影是一款轻量级、本地部署的电影台词搜索引擎。它能让你在海量字幕文件中快速定位任何一句台词,并根据字幕时间轴精准截取视
频片段或画面截图,打通「文字 → 影像」的完整链路。 
一、核心功能
1. 全文台词搜索
输入关键词即可跨所有已导入电影进行全文检索。搜索结果包含:
- 关键词高亮 — 匹配文本以醒目标记突出显示
- 上下文台词 — 自动展示匹配行的前一句和后一句,帮助你还原对话语境
- 时间轴信息 — 每条结果精确到 时:分:秒,毫秒 的起止时间
- 按电影筛选 — 可在搜索结果中进一步筛选特定电影
- 分页浏览 — 大量结果时自动分页,每页 20 条
2. 字幕文件管理
- 拖拽上传 — 直接将 .srt 字幕文件拖入页面即可导入
- 自动解析 — 解析 SRT 格式的序号、时间轴、对白文本,自动去除 HTML 标签并合并多行文本
- 去重机制 — 相同文件名的字幕不会重复导入
- 影片管理 — 查看已收录电影列表、每部电影的台词数量,支持删除电影及其全部字幕
3. 视频关联
为每部电影关联对应的视频文件,支持两种方式:
- 本地路径 — 直接填写本机视频文件路径(如 D:\movies\film.mp4)
- 上传文件 — 上传视频文件到服务器(支持 mp4、mkv、avi、mov、flv、wmv、webm 格式,上限 500MB)
关联后即可使用截图和片段截取功能。
4. 视频截图
在任意搜索结果上点击「截图」,系统会根据该句台词的起始时间戳,调用 ffmpeg 从视频中截取对应画面,生成 JPG
图片并支持直接下载。
5. 片段截取
点击「截取片段」,系统会根据该句台词的起止时间,自动裁剪出对应的视频片段(MP4
格式),截取完成后可在线预览和下载。采用流拷贝(-c copy)模式,速度快且不损失画质。
6. 搜索历史
- 自动记录最近 10 条搜索关键词,存储于浏览器本地
- 点击搜索框时展示历史记录下拉列表
- 支持单条删除和一键清空
7. 结果导出
搜索结果可一键导出为 TXT 文本文件,内容包含关键词、筛选条件、导出时间以及所有匹配台词及其上下文。
8. 电影详情页
点击电影名可进入详情视图,浏览该电影的全部台词(分页),每条台词均可执行截图和片段截取操作。
---
五、适用场景
- 影迷检索 — 想找某句经典台词出自哪部电影的哪个时间点
- 视频剪辑 — 按台词关键词定位素材,一键截取所需片段
- 内容创作 — 快速获取影视截图用于图文、短视频二创
- 字幕研究 — 浏览和分析电影字幕文本,支持导出
---
六、快速启动
# 安装依赖
pip install flask
# 启动服务
python app.py
# 浏览器访问
http://localhost:5000
启动后,subtitles/ 目录下的示例字幕文件会自动导入。在页面上传 .srt 文件即可添加更多电影。
下载地址: https://pan.quark.cn/s/befa14e0ea27
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)