openclaw,skillsbot上必装的20个NLP Skill 技能说明书
NLP Skill 技能说明书
数据来源:SkillsBot AI Skill技能库 · NLP 分类
整理时间:2026-03-17
页面截图

技能速览表
| Skill 名称 | 功能描述 | 痛点解决 | 下载地址 |
|---|---|---|---|
| OpenAI Whisper 语音转文字工具 | 本地高精度语音识别,无需 API 密钥,支持多格式音频转写与翻译 | 调用云端 STT 有成本且隐私风险,离线场景无法使用 | skill/534 |
| 网页搜索工具 | 基于 DuckDuckGo 的网络内容搜索,返回标题/摘要/链接,支持引用格式 | 缺乏结构化搜索结果接口,手工检索效率低 | skill/8048 |
| GEO 内容优化器 | 优化内容权威性与可引用性,提升被 AI 系统检索和引用的概率 | 传统 SEO 在 AI 搜索时代失效,内容可见性大幅下降 | skill/892 |
| 写作风格提取技能 | 从样本文本中提取写作风格,生成可复用的语音配置文件 | 品牌写作风格难以标准化,多作者协作时风格不一致 | skill/9701 |
| MiniMax 文本转语音技能 | 封装 MiniMax TTS API,提供语音合成、声音克隆和声音设计功能 | 集成 TTS 服务代码繁琐,声音克隆没有简易接口 | skill/6579 |
| 语音控制技能 | 提供唤醒词检测、语音转文本与文本转语音的完整语音控制接口 | 语音控制应用开发门槛高,各模块割裂难以整合 | skill/7525 |
| MinerU PDF 智能提取器 | 将 PDF 转为结构化 Markdown,精准识别公式/表格,支持 OCR 扫描件 | PDF 内容提取质量差,公式和表格无法准确还原 | skill/864 |
| SetFit 小样本意图分类技能 | 基于对比学习,仅需 8-16 条示例即可训练高效文本分类模型 | 传统分类需大量标注数据,小样本场景模型精度差 | skill/264 |
| 知识提取引擎 | 从源材料中提取结构化知识与洞察,转化为可检索、可组合的笔记 | 原始文档信息散乱,知识难以结构化沉淀和复用 | skill/3362 |
| Rasa NLU 集成技能 | 配置和训练 Rasa NLU 管道,实现聊天机器人的意图识别与实体提取 | Rasa 配置复杂,从训练数据到部署全链路缺乏指引 | skill/261 |
| spaCy 命名实体识别技能 | 训练和部署自定义 NER 模型,支持实体抽取、槽位填充和聊天机器人开发 | 自定义 NER 模型训练流程复杂,缺乏端到端解决方案 | skill/265 |
| OpenAI Whisper API 音频转录工具 | 基于 OpenAI Whisper API 的命令行音频转录工具,支持多格式输出 | 手动调用 Whisper API 参数繁多,缺乏简洁的命令行封装 | skill/535 |
技能详细说明
1. OpenAI Whisper 语音转文字工具 (openai-whisper)
- 评分:⚡ 4.5 安装量:3+
- 详情页:https://www.skillsbot.cn/skill/534
功能描述
本地化运行的高精度语音识别工具,无需 API 密钥,支持多种音频格式(mp3、wav、m4a 等)及多种输出格式(txt、srt、vtt 等),适用于字幕制作、会议记录、内容创作等场景,还支持跨语言翻译功能。
痛点解决
- 云端 STT 服务按量计费,长音频成本高
- 本地化处理保护数据隐私,企业敏感会议不外传
- 离线环境(无网络)下仍可正常使用
- 免去 API Key 申请和配置的繁琐流程
2. 网页搜索工具 (web-search)
- 评分:⚡ 4.5 安装量:3+
- 详情页:https://www.skillsbot.cn/skill/8048
功能描述
基于 DuckDuckGo 搜索引擎的网络内容检索技能,允许用户通过查询字符串搜索网络内容,返回标题、摘要和链接,支持调整结果数量并提供规范的引用格式输出。适用于信息检索、新闻跟踪、研究工作、SEO 优化和数据分析。
痛点解决
- AI 工具缺乏实时联网能力,知识截止日期导致信息过时
- 手工搜索结果格式不统一,引用整理耗时
- 缺乏结构化搜索接口,难以与 AI 工作流集成
- 依赖 Google API 有配额限制,DuckDuckGo 无此问题
3. GEO 内容优化器 (geo-content-optimizer)
- 评分:⚡ 4.5 安装量:0
- 详情页:https://www.skillsbot.cn/skill/892
功能描述
专门优化内容以提高被 AI 系统引用概率的工具,通过提升内容的权威性、准确性、清晰度和可引用性来增强 SEO(搜索引擎优化)和 GEO(生成引擎优化),帮助内容在 AI 主导的搜索时代获得更好的可见性。
痛点解决
- 传统 SEO 策略在 ChatGPT/Perplexity 等 AI 搜索场景中失效
- 内容被 AI 引用的规律难以把握,内容可见性持续下降
- 缺乏针对 AI 检索优化的系统化方法论
- 内容质量提升方向不明确,迭代优化无据可依
4. 写作风格提取技能 (voice-capture)
- 评分:⚡ 4.5 安装量:1+
- 详情页:https://www.skillsbot.cn/skill/9701
功能描述
从样本文本中自动提取和编码写作风格,生成可重用的语音配置文件(Voice Profile)。通过分析写作模式(词汇偏好、句式结构、语气特征等),帮助用户保持写作风格的一致性或精准模仿特定风格,适用于内容创作、品牌管理和写作辅助场景。
痛点解决
- 多人协作内容创作时写作风格不一致,品牌声音散乱
- 手动描述写作风格不够精准,AI 难以准确还原
- 新内容无法自动对齐历史风格基准
- 风格配置缺乏可复用、可共享的标准化格式
5. MiniMax 文本转语音技能 (tts-skill)
- 评分:⚡ 4.5 安装量:1+
- 详情页:https://www.skillsbot.cn/skill/6579
功能描述
封装 MiniMax TTS API 的语音合成技能,提供文本转语音(TTS)、声音克隆和声音设计三大核心功能,通过 Python 模块集成,便于开发者快速实现语音合成应用,无需从头对接复杂的 TTS API。
痛点解决
- 直接对接 TTS API 需要大量样板代码
- 声音克隆功能 API 调用复杂,参数多
- 不同 TTS 服务接口不统一,切换成本高
- 缺乏可直接在 AI 工作流中调用的标准化 TTS 接口
6. 语音控制技能 (voice)
- 评分:⚡ 4.5 安装量:1+
- 详情页:https://www.skillsbot.cn/skill/7525
功能描述
提供完整的语音控制接口,集成唤醒词检测、语音转文本(STT)和文本转语音(TTS)三大模块,支持语音控制交易、智能助手等应用场景,提升操作效率和智能化体验。
痛点解决
- 语音控制应用需要整合多个独立模块,集成难度大
- 唤醒词检测、STT、TTS 各自独立,协调工作流复杂
- 量化交易等专业场景缺乏语音控制接口
- 从零构建语音交互系统周期长、成本高
7. MinerU PDF 智能提取器 (mineru-pdf-extractor)
- 评分:⚡ 4.5 安装量:0
- 详情页:https://www.skillsbot.cn/skill/864
功能描述
基于 MinerU API 的自动化 PDF 内容提取工具,能将本地或在线 PDF 高效转换为结构化 Markdown 格式,精准识别数学公式、复杂表格,并集成 OCR 功能处理扫描件,支持批量处理、学术论文解析和文档数字化归档。
痛点解决
- 传统 PDF 解析工具对公式和表格支持差,内容错乱
- 扫描版 PDF 无法直接提取文字,需额外 OCR 步骤
- 学术论文中的 LaTeX 公式丢失或变形
- 批量处理多个 PDF 文档缺乏自动化脚本
8. SetFit 小样本意图分类技能 (setfit-few-shot)
- 评分:⚡ 4.5 安装量:0
- 详情页:https://www.skillsbot.cn/skill/264
功能描述
基于对比学习的 NLP 小样本分类技能,仅需每类 8-16 个标注示例即可在几分钟内训练出高精度文本分类模型,无需复杂的提示工程,适用于意图识别、情感分析、主题分类等场景,特别适合数据稀缺或需要快速迭代的 AI 应用开发。
痛点解决
- 传统文本分类需要数千条标注数据,标注成本极高
- 大模型 Few-Shot 提示方案推理速度慢、成本高
- 从收集数据到上线需要漫长的开发周期
- 小样本场景下模型精度难以保证
9. 知识提取引擎 (reduce)
- 评分:⚡ 4.5 安装量:0
- 详情页:https://www.skillsbot.cn/skill/3362
功能描述
从各类源材料(文章、文档、网页等)中提取结构化知识和洞察,特别强调全面提取领域相关信息,并将其转化为可检索、可组合的笔记形式,为个人知识管理和知识库构建提供自动化支持。
痛点解决
- 阅读大量资料后关键信息难以有效沉淀
- 手动整理笔记耗时,且结构化程度低
- 知识碎片化,不同来源的信息无法有效关联
- 构建知识库缺乏自动化的信息提炼工具
10. Rasa NLU 集成技能 (rasa-nlu-integration)
- 评分:⚡ 4.5 安装量:0
- 详情页:https://www.skillsbot.cn/skill/261
功能描述
专注于 Rasa 自然语言理解(NLU)管道的配置与训练,覆盖训练数据设计、分词器/特征提取器/分类器(DIETClassifier)配置、模型优化、评估和部署全流程,适用于聊天机器人、虚拟助手等对话 AI 应用的意图识别和实体提取。
痛点解决
- Rasa 配置项繁多,新手入门曲线陡峭
- 训练数据格式和管道组件选型缺乏清晰指引
- 模型评估和调优缺乏系统化方法
- 从开发到部署缺乏端到端的完整参考流程
11. spaCy 命名实体识别技能 (spacy-ner)
- 评分:⚡ 4.5 安装量:0
- 详情页:https://www.skillsbot.cn/skill/265
功能描述
专门用于训练和部署自定义 spaCy 命名实体识别(NER)模型的工具包,支持实体抽取、槽位填充和聊天机器人开发,提供从模型训练、配置、评估到部署的完整解决方案,适用于信息提取和对话 AI 应用。
痛点解决
- spaCy 自定义 NER 模型训练流程复杂,文档分散
- 实体类型定义和训练数据标注缺乏规范指导
- 模型评估指标难以解读,性能调优无方向
- 从训练模型到生产部署缺乏统一的工程化方案
12. OpenAI Whisper API 音频转录工具 (openai-whisper-api)
- 评分:⚡ 4.5 安装量:0
- 详情页:https://www.skillsbot.cn/skill/535
功能描述
基于 OpenAI Whisper API 的命令行音频转录工具,可将 m4a、ogg 等多种格式音频文件快速、准确地转换为文字文本或 JSON 格式转录稿,支持指定语言和自定义提示词以优化识别效果,适用于语音识别、字幕生成和会议记录自动化。
痛点解决
- 直接调用 Whisper API 需要编写大量样板代码
- API 参数配置复杂,初次使用容易出错
- 缺乏简洁的命令行工具支持批量转录
- 输出格式(txt/JSON)转换需要额外处理
与 skill/534 的区别:
openai-whisper(skill/534)为本地离线运行(无需 API Key),openai-whisper-api(skill/535)通过云端 API 调用,适合无法本地部署大模型的场景。
技术方向分类
🎤 语音处理(STT / TTS)
| Skill | 链接 |
|---|---|
| OpenAI Whisper 语音转文字工具(本地版) | https://www.skillsbot.cn/skill/534 |
| OpenAI Whisper API 音频转录工具(云端版) | https://www.skillsbot.cn/skill/535 |
| MiniMax 文本转语音技能 | https://www.skillsbot.cn/skill/6579 |
| 语音控制技能 | https://www.skillsbot.cn/skill/7525 |
📝 文本理解与分类
| Skill | 链接 |
|---|---|
| SetFit 小样本意图分类技能 | https://www.skillsbot.cn/skill/264 |
| Rasa NLU 集成技能 | https://www.skillsbot.cn/skill/261 |
| spaCy 命名实体识别技能 | https://www.skillsbot.cn/skill/265 |
🔍 信息检索与内容优化
| Skill | 链接 |
|---|---|
| 网页搜索工具 | https://www.skillsbot.cn/skill/8048 |
| GEO 内容优化器 | https://www.skillsbot.cn/skill/892 |
📚 知识提取与文档处理
| Skill | 链接 |
|---|---|
| 知识提取引擎 | https://www.skillsbot.cn/skill/3362 |
| MinerU PDF 智能提取器 | https://www.skillsbot.cn/skill/864 |
| 写作风格提取技能 | https://www.skillsbot.cn/skill/9701 |
数据截取自 SkillsBot 技能库 NLP 分类第一页,共 12 个有效 Skill(去重后)。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)