MetaSearchMCP：专为 AI 代理设计的元搜索后端

Keano Reurink

717人浏览 · 2026-05-05 09:28:25

Keano Reurink · 2026-05-05 09:28:25 发布

当传统元搜索引擎还在优化浏览器体验时，MetaSearchMCP 已经重新定义了机器消费型搜索的范式。

一个被忽视的问题

大多数开发者对元搜索的印象停留在 SearXNG —— 一个优秀的、面向浏览器用户的聚合搜索前端。但当你构建一个需要自主检索信息的 AI 代理时，SearXNG 的 HTML 输出就成了负担：你需要额外写解析器、处理反爬虫、管理超时，最后还要把乱七八糟的结果统一成 LLM 能理解的结构化数据。

这不是 SearXNG 的问题。它的设计目标就是服务人类用户，而 AI 代理需要的是完全不同的东西：机器可消费的搜索 API。

MetaSearchMCP 正是为此而生。

项目简介

MetaSearchMCP 是一个开源的元搜索后端，同时提供 HTTP API 和 MCP 服务器 两种接入方式。它把 Google、DuckDuckGo、Brave、arXiv、GitHub、Stack Overflow 等 20+ 搜索提供商 统一成一个标准化的接口，输出结构化的 JSON 结果。

关键数据：

39 Stars | Python 99.9% | MIT 许可证
支持 6 大类搜索：Web、知识、开发者、学术、金融、Google 专用链
原生 MCP 协议 支持（Claude Desktop / Cline / Continue 开箱即用）

核心设计哲学

1. 并发多提供商聚合

传统做法是选一个搜索 API，祈祷它别挂。MetaSearchMCP 的做法是：同时问多个引擎，取最快最好的结果。

POST /search
{
  "query": "fastapi vs django performance 2025",
  "tags": ["web", "developer"],  # 自动选择 DuckDuckGo + Bing + GitHub + Stack Overflow
  "max_results": 10
}

内置 去重引擎 会跨提供商合并相同 URL 的结果，按相关度重排后返回统一 schema 的列表。

2. 提供商级故障隔离

某个引擎超时或返回错误？不会影响整体结果。每个提供商有独立的超时控制（默认 10s），部分故障被优雅处理，剩余提供商的结果仍然返回。

3. 代理友好的载荷控制

AI 代理的上下文窗口是有限的。MetaSearchMCP 通过 max_results_per_provider 限制单提供商返回量，避免把整页 HTML 塞进 prompt。

4. MCP-first 架构

除了 HTTP API，项目核心是一个 MCP 服务器，通过 stdio 暴露以下工具：

工具	用途
`search_web`	通用网页搜索
`search_google`	Google 专用搜索链
`search_academic`	学术论文搜索
`search_github`	代码/仓库搜索
`compare_engines`	对比多个引擎的结果差异

这意味着你可以在 Claude Desktop 里直接说：“帮我搜一下最近关于 RAG 评估的论文”，而不用离开对话环境。

支持的搜索提供商

MetaSearchMCP 的提供商覆盖堪称全面：

Web 搜索：Google（直接爬取 / SerpBase / Serper）、DuckDuckGo、Bing、Brave、Yahoo、Yandex、Baidu、Ecosia、Qwant、Startpage、Mojeek、Mwmbl

开发者搜索：GitHub、GitLab、Stack Overflow、Hacker News、Reddit、npm、PyPI、crates.io、Docker Hub、Go Packages

学术搜索：arXiv、PubMed、Semantic Scholar、CrossRef

知识库：Wikipedia、Wikidata、Internet Archive、Open Library

金融数据：Yahoo Finance、Alpha Vantage、Finnhub

快速上手

安装

git clone https://github.com/gefsikatsinelou/MetaSearchMCP
cd MetaSearchMCP
python scripts/install.py --dev --test --run

运行 HTTP API

python -m metasearchmcp.server
# 默认监听 localhost:8000

配置搜索提供商

export SERPBASE_API_KEY="your_key"    # Google 搜索链首选
export BRAVE_API_KEY="your_key"       # 备用 Web 搜索
export GITHUB_TOKEN="your_token"      # 开发者搜索

ENABLED_PROVIDERS 环境变量可以白名单控制启用哪些提供商。

MCP 接入（Claude Desktop）

在 claude_desktop_config.json 中添加：

{
  "mcpServers": {
    "metasearch": {
      "command": "python",
      "args": ["-m", "metasearchmcp.broker"]
    }
  }
}

架构一览

项目采用模块化设计，核心只有几个文件：

模块	职责
`contracts.py`	Pydantic 请求/响应模型，定义统一 schema
`catalog.py`	提供商发现与选择逻辑（按名称或语义标签）
`orchestrator.py`	并发执行搜索、聚合响应、处理超时
`merge.py`	URL 规范化与跨引擎去重
`server.py`	FastAPI HTTP 入口
`broker.py`	MCP stdio 入口