Sitemcp:将网站变成MCP服务器的一个开源项目

siteMCP是什么?

sitemcp能够抓取网站内容并缓存,支持使用micromatch指定抓取的页面路径以及 CSS 选择器来精细化选择页面内容,并把抓取的内容用作MCP服务器的数据源,也就是说它把静态网站变成了一个可交互的知识库,配合MCP客户端进行提问,获取更精准的信息。

sitemcp是什么?.jpg

sitemcp功能

内容抓取与缓存:可以抓取指定网站的全部或部分页面,并将其缓存起来。支持使用 micromatch 来指定抓取的页面路径,例如:

sitemcp https://vite.dev -m "/blog/**" -m "/guide/**"

内容选择器:在某些页面中,mozilla/readability 提取的内容可能不够准确,此时可以通过指定 CSS 选择器来精确提取可读内容:

sitemcp https://vite.dev --content-selector ".content"

与 MCP 客户端配合使用:sitemcp 可以与 MCP 客户端(如 Claude Desktop)配合使用。通过配置文件,可以在客户端中启动 sitemcp 服务器。例如:

{
"mcpServers": {
"daisy-ui": {
  "command": "npx",
  "args": [
"-y",
"sitemcp",
"https://daisyui.com",
"-m",
"/components/**",
  ]
}
}
}

缓存机制:默认会在 ~/.cache/sitemcp 中缓存抓取的页面。如果不需要缓存,可以通过 --no-cache 标志来禁用。

sitemcp应用

sitemcp 等于是把静态网站变成了一个可交互的知识库,配合 MCP 客户端进行提问,解锁了更丰富的应用场景。例如,用户可以将抓取的网站内容作为知识库,通过 MCP 客户端进行提问,获取更精准的信息。

sitemcp使用教程

安装:sitemcp 支持多种安装方式。可以使用以下命令进行一次性安装:

bunx sitemcp
npx sitemcp
pnpx sitemcp

或者,也可以将其全局安装:

bun i -g sitemcp
npm i -g sitemcp
pnpm i -g sitemcp

使用:使用时只需指定目标网站的 URL:

sitemcp https://daisyui.com

还可以通过 --concurrency 参数指定并发数,以提高抓取效率:

sitemcp https://daisyui.com --concurrency 10

github地址:https://github.com/ryoppippi/sitemcp

收藏
最新工具
ChinaTextbook
ChinaTextbook

一个专门收集和分享中国大陆从小学到大学的教材资源的开源项目,特别...

暗壳AI
暗壳AI

家居AIGC营销与导购工具,它号称“一人即团队”,能够快速生成渲...

UntitledPen
UntitledPen

一个可以生成真实人声旁白的工具,也就是能够在一个平台上编写、编辑...

PageAI
PageAI

一款AI网站生成工具,就像一个小型创意工作室一样,能在短时间内根...

Seedance AI
Seedance AI

字节跳动推出的一款强大的视频生成工具,借助 Seedance 1...

ChatPs
ChatPs

ChatPs 是一款为 Photoshop 设计的插件,它背后是...

趣丸千音
趣丸千音

一个AI语音创作平台,专注提供一站式智能语音解决方案。集成文本转...

太极神器 TAICHI-flet
太极神器 TAICHI-flet

基于flet的一款多功能娱乐软件,实现了浏览图片、音乐、小说、各...

YIKM
YIKM

一个能在线玩小霸王、红白机、街机、FC 等经典游戏的地方,像《魂...

Bridgely
Bridgely

基于AI的实时通用翻译浏览器扩展,支持 60 多种语言,包括 W...