openclaw,skillsbot上必装的20个NLP Skill 技能说明书

stockapi量化数据接口

476人浏览 · 2026-03-17 23:13:18

stockapi量化数据接口 · 2026-03-17 23:13:18 发布

NLP Skill 技能说明书

数据来源：SkillsBot AI Skill技能库 · NLP 分类
整理时间：2026-03-17

页面截图

在这里插入图片描述

技能速览表

Skill 名称	功能描述	痛点解决	下载地址
OpenAI Whisper 语音转文字工具	本地高精度语音识别，无需 API 密钥，支持多格式音频转写与翻译	调用云端 STT 有成本且隐私风险，离线场景无法使用	skill/534
网页搜索工具	基于 DuckDuckGo 的网络内容搜索，返回标题/摘要/链接，支持引用格式	缺乏结构化搜索结果接口，手工检索效率低	skill/8048
GEO 内容优化器	优化内容权威性与可引用性，提升被 AI 系统检索和引用的概率	传统 SEO 在 AI 搜索时代失效，内容可见性大幅下降	skill/892
写作风格提取技能	从样本文本中提取写作风格，生成可复用的语音配置文件	品牌写作风格难以标准化，多作者协作时风格不一致	skill/9701
MiniMax 文本转语音技能	封装 MiniMax TTS API，提供语音合成、声音克隆和声音设计功能	集成 TTS 服务代码繁琐，声音克隆没有简易接口	skill/6579
语音控制技能	提供唤醒词检测、语音转文本与文本转语音的完整语音控制接口	语音控制应用开发门槛高，各模块割裂难以整合	skill/7525
MinerU PDF 智能提取器	将 PDF 转为结构化 Markdown，精准识别公式/表格，支持 OCR 扫描件	PDF 内容提取质量差，公式和表格无法准确还原	skill/864
SetFit 小样本意图分类技能	基于对比学习，仅需 8-16 条示例即可训练高效文本分类模型	传统分类需大量标注数据，小样本场景模型精度差	skill/264
知识提取引擎	从源材料中提取结构化知识与洞察，转化为可检索、可组合的笔记	原始文档信息散乱，知识难以结构化沉淀和复用	skill/3362
Rasa NLU 集成技能	配置和训练 Rasa NLU 管道，实现聊天机器人的意图识别与实体提取	Rasa 配置复杂，从训练数据到部署全链路缺乏指引	skill/261
spaCy 命名实体识别技能	训练和部署自定义 NER 模型，支持实体抽取、槽位填充和聊天机器人开发	自定义 NER 模型训练流程复杂，缺乏端到端解决方案	skill/265
OpenAI Whisper API 音频转录工具	基于 OpenAI Whisper API 的命令行音频转录工具，支持多格式输出	手动调用 Whisper API 参数繁多，缺乏简洁的命令行封装	skill/535

技能详细说明

1. OpenAI Whisper 语音转文字工具 (`openai-whisper`)

评分：⚡ 4.5　安装量：3+
详情页：https://www.skillsbot.cn/skill/534

功能描述
本地化运行的高精度语音识别工具，无需 API 密钥，支持多种音频格式（mp3、wav、m4a 等）及多种输出格式（txt、srt、vtt 等），适用于字幕制作、会议记录、内容创作等场景，还支持跨语言翻译功能。

痛点解决

云端 STT 服务按量计费，长音频成本高
本地化处理保护数据隐私，企业敏感会议不外传
离线环境（无网络）下仍可正常使用
免去 API Key 申请和配置的繁琐流程

2. 网页搜索工具 (`web-search`)

评分：⚡ 4.5　安装量：3+
详情页：https://www.skillsbot.cn/skill/8048

功能描述
基于 DuckDuckGo 搜索引擎的网络内容检索技能，允许用户通过查询字符串搜索网络内容，返回标题、摘要和链接，支持调整结果数量并提供规范的引用格式输出。适用于信息检索、新闻跟踪、研究工作、SEO 优化和数据分析。

痛点解决

AI 工具缺乏实时联网能力，知识截止日期导致信息过时
手工搜索结果格式不统一，引用整理耗时
缺乏结构化搜索接口，难以与 AI 工作流集成
依赖 Google API 有配额限制，DuckDuckGo 无此问题

3. GEO 内容优化器 (`geo-content-optimizer`)

评分：⚡ 4.5　安装量：0
详情页：https://www.skillsbot.cn/skill/892

功能描述
专门优化内容以提高被 AI 系统引用概率的工具，通过提升内容的权威性、准确性、清晰度和可引用性来增强 SEO（搜索引擎优化）和 GEO（生成引擎优化），帮助内容在 AI 主导的搜索时代获得更好的可见性。

痛点解决

传统 SEO 策略在 ChatGPT/Perplexity 等 AI 搜索场景中失效
内容被 AI 引用的规律难以把握，内容可见性持续下降
缺乏针对 AI 检索优化的系统化方法论
内容质量提升方向不明确，迭代优化无据可依

4. 写作风格提取技能 (`voice-capture`)

评分：⚡ 4.5　安装量：1+
详情页：https://www.skillsbot.cn/skill/9701

功能描述
从样本文本中自动提取和编码写作风格，生成可重用的语音配置文件（Voice Profile）。通过分析写作模式（词汇偏好、句式结构、语气特征等），帮助用户保持写作风格的一致性或精准模仿特定风格，适用于内容创作、品牌管理和写作辅助场景。

痛点解决

多人协作内容创作时写作风格不一致，品牌声音散乱
手动描述写作风格不够精准，AI 难以准确还原
新内容无法自动对齐历史风格基准
风格配置缺乏可复用、可共享的标准化格式

5. MiniMax 文本转语音技能 (`tts-skill`)

评分：⚡ 4.5　安装量：1+
详情页：https://www.skillsbot.cn/skill/6579

功能描述
封装 MiniMax TTS API 的语音合成技能，提供文本转语音（TTS）、声音克隆和声音设计三大核心功能，通过 Python 模块集成，便于开发者快速实现语音合成应用，无需从头对接复杂的 TTS API。

痛点解决

直接对接 TTS API 需要大量样板代码
声音克隆功能 API 调用复杂，参数多
不同 TTS 服务接口不统一，切换成本高
缺乏可直接在 AI 工作流中调用的标准化 TTS 接口

6. 语音控制技能 (`voice`)

评分：⚡ 4.5　安装量：1+
详情页：https://www.skillsbot.cn/skill/7525

功能描述
提供完整的语音控制接口，集成唤醒词检测、语音转文本（STT）和文本转语音（TTS）三大模块，支持语音控制交易、智能助手等应用场景，提升操作效率和智能化体验。

痛点解决

语音控制应用需要整合多个独立模块，集成难度大
唤醒词检测、STT、TTS 各自独立，协调工作流复杂
量化交易等专业场景缺乏语音控制接口
从零构建语音交互系统周期长、成本高

7. MinerU PDF 智能提取器 (`mineru-pdf-extractor`)

评分：⚡ 4.5　安装量：0
详情页：https://www.skillsbot.cn/skill/864

功能描述
基于 MinerU API 的自动化 PDF 内容提取工具，能将本地或在线 PDF 高效转换为结构化 Markdown 格式，精准识别数学公式、复杂表格，并集成 OCR 功能处理扫描件，支持批量处理、学术论文解析和文档数字化归档。

痛点解决

传统 PDF 解析工具对公式和表格支持差，内容错乱
扫描版 PDF 无法直接提取文字，需额外 OCR 步骤
学术论文中的 LaTeX 公式丢失或变形
批量处理多个 PDF 文档缺乏自动化脚本

8. SetFit 小样本意图分类技能 (`setfit-few-shot`)

评分：⚡ 4.5　安装量：0
详情页：https://www.skillsbot.cn/skill/264

功能描述
基于对比学习的 NLP 小样本分类技能，仅需每类 8-16 个标注示例即可在几分钟内训练出高精度文本分类模型，无需复杂的提示工程，适用于意图识别、情感分析、主题分类等场景，特别适合数据稀缺或需要快速迭代的 AI 应用开发。

痛点解决

传统文本分类需要数千条标注数据，标注成本极高
大模型 Few-Shot 提示方案推理速度慢、成本高
从收集数据到上线需要漫长的开发周期
小样本场景下模型精度难以保证

9. 知识提取引擎 (`reduce`)

评分：⚡ 4.5　安装量：0
详情页：https://www.skillsbot.cn/skill/3362

功能描述
从各类源材料（文章、文档、网页等）中提取结构化知识和洞察，特别强调全面提取领域相关信息，并将其转化为可检索、可组合的笔记形式，为个人知识管理和知识库构建提供自动化支持。

痛点解决

阅读大量资料后关键信息难以有效沉淀
手动整理笔记耗时，且结构化程度低
知识碎片化，不同来源的信息无法有效关联
构建知识库缺乏自动化的信息提炼工具

10. Rasa NLU 集成技能 (`rasa-nlu-integration`)

评分：⚡ 4.5　安装量：0
详情页：https://www.skillsbot.cn/skill/261

功能描述
专注于 Rasa 自然语言理解（NLU）管道的配置与训练，覆盖训练数据设计、分词器/特征提取器/分类器（DIETClassifier）配置、模型优化、评估和部署全流程，适用于聊天机器人、虚拟助手等对话 AI 应用的意图识别和实体提取。

痛点解决

Rasa 配置项繁多，新手入门曲线陡峭
训练数据格式和管道组件选型缺乏清晰指引
模型评估和调优缺乏系统化方法
从开发到部署缺乏端到端的完整参考流程

11. spaCy 命名实体识别技能 (`spacy-ner`)

评分：⚡ 4.5　安装量：0
详情页：https://www.skillsbot.cn/skill/265

功能描述
专门用于训练和部署自定义 spaCy 命名实体识别（NER）模型的工具包，支持实体抽取、槽位填充和聊天机器人开发，提供从模型训练、配置、评估到部署的完整解决方案，适用于信息提取和对话 AI 应用。

痛点解决

spaCy 自定义 NER 模型训练流程复杂，文档分散
实体类型定义和训练数据标注缺乏规范指导
模型评估指标难以解读，性能调优无方向
从训练模型到生产部署缺乏统一的工程化方案

12. OpenAI Whisper API 音频转录工具 (`openai-whisper-api`)

评分：⚡ 4.5　安装量：0
详情页：https://www.skillsbot.cn/skill/535

功能描述
基于 OpenAI Whisper API 的命令行音频转录工具，可将 m4a、ogg 等多种格式音频文件快速、准确地转换为文字文本或 JSON 格式转录稿，支持指定语言和自定义提示词以优化识别效果，适用于语音识别、字幕生成和会议记录自动化。

痛点解决

直接调用 Whisper API 需要编写大量样板代码
API 参数配置复杂，初次使用容易出错
缺乏简洁的命令行工具支持批量转录
输出格式（txt/JSON）转换需要额外处理

与 skill/534 的区别：openai-whisper（skill/534）为本地离线运行（无需 API Key），openai-whisper-api（skill/535）通过云端 API 调用，适合无法本地部署大模型的场景。

技术方向分类

🎤 语音处理（STT / TTS）

Skill	链接
OpenAI Whisper 语音转文字工具（本地版）	https://www.skillsbot.cn/skill/534
OpenAI Whisper API 音频转录工具（云端版）	https://www.skillsbot.cn/skill/535
MiniMax 文本转语音技能	https://www.skillsbot.cn/skill/6579
语音控制技能	https://www.skillsbot.cn/skill/7525

📝 文本理解与分类

Skill	链接
SetFit 小样本意图分类技能	https://www.skillsbot.cn/skill/264
Rasa NLU 集成技能	https://www.skillsbot.cn/skill/261
spaCy 命名实体识别技能	https://www.skillsbot.cn/skill/265

🔍 信息检索与内容优化

Skill	链接
网页搜索工具	https://www.skillsbot.cn/skill/8048
GEO 内容优化器	https://www.skillsbot.cn/skill/892

📚 知识提取与文档处理

Skill	链接
知识提取引擎	https://www.skillsbot.cn/skill/3362
MinerU PDF 智能提取器	https://www.skillsbot.cn/skill/864
写作风格提取技能	https://www.skillsbot.cn/skill/9701

数据截取自 SkillsBot 技能库 NLP 分类第一页，共 12 个有效 Skill（去重后）。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

TabPFN 深度技术解读：表格数据基础模型的颠覆性突破与工程化全景

AtomGit开源社区

5个C语言开源项目统治全球科技30年：今天却被AI逼到转型边缘？

AtomGit开源社区

基于 KMP 实现一个跨平台音乐播放器

摘要：LynMusic是一款基于KMP技术开发的跨平台音乐播放器，支持安卓、iOS、macOS等多平台。开发者利用AI编程工具Codex完成了开发，解决了歌词搜索难、平台兼容性等问题。该播放器支持本地音乐、云盘导入、歌词分享、定时播放等功能，并适配车机、电视等设备。采用Kotlin Compose开发，相比Web方案性能更优。项目已开源，开发者分享了使用AI编程的心得，包括需求沟通、代码维护等经验