Sitemcp:将网站变成MCP服务器的一个开源项目

siteMCP是什么?

sitemcp能够抓取网站内容并缓存,支持使用micromatch指定抓取的页面路径以及 CSS 选择器来精细化选择页面内容,并把抓取的内容用作MCP服务器的数据源,也就是说它把静态网站变成了一个可交互的知识库,配合MCP客户端进行提问,获取更精准的信息。

sitemcp是什么?.jpg

sitemcp功能

内容抓取与缓存:可以抓取指定网站的全部或部分页面,并将其缓存起来。支持使用 micromatch 来指定抓取的页面路径,例如:

sitemcp https://vite.dev -m "/blog/**" -m "/guide/**"

内容选择器:在某些页面中,mozilla/readability 提取的内容可能不够准确,此时可以通过指定 CSS 选择器来精确提取可读内容:

sitemcp https://vite.dev --content-selector ".content"

与 MCP 客户端配合使用:sitemcp 可以与 MCP 客户端(如 Claude Desktop)配合使用。通过配置文件,可以在客户端中启动 sitemcp 服务器。例如:

{
"mcpServers": {
"daisy-ui": {
  "command": "npx",
  "args": [
"-y",
"sitemcp",
"https://daisyui.com",
"-m",
"/components/**",
  ]
}
}
}

缓存机制:默认会在 ~/.cache/sitemcp 中缓存抓取的页面。如果不需要缓存,可以通过 --no-cache 标志来禁用。

sitemcp应用

sitemcp 等于是把静态网站变成了一个可交互的知识库,配合 MCP 客户端进行提问,解锁了更丰富的应用场景。例如,用户可以将抓取的网站内容作为知识库,通过 MCP 客户端进行提问,获取更精准的信息。

sitemcp使用教程

安装:sitemcp 支持多种安装方式。可以使用以下命令进行一次性安装:

bunx sitemcp
npx sitemcp
pnpx sitemcp

或者,也可以将其全局安装:

bun i -g sitemcp
npm i -g sitemcp
pnpm i -g sitemcp

使用:使用时只需指定目标网站的 URL:

sitemcp https://daisyui.com

还可以通过 --concurrency 参数指定并发数,以提高抓取效率:

sitemcp https://daisyui.com --concurrency 10

github地址:https://github.com/ryoppippi/sitemcp

收藏
最新工具
在线DOS游戏
在线DOS游戏

一个能在浏览器直接玩DOS游戏的在线模拟器,适合怀旧玩家和游戏开...

HDLOGO
HDLOGO

HDLOGO 是一个专门整理矢量标志和图标的网站,提供各类品牌和...

Funes.world
Funes.world

一个在线博物馆项目,通过众包方式把世界各地的建筑做成3D模型,F...

PrettyScale
PrettyScale

一个在线面部分析及颜值打分网站,用户通过上传照片或直接用摄像头参...

圆周旅迹
圆周旅迹

一款旅游出行AI智能规划APP,它可以直接从小红书这些平台导入别...

Wonderplan AI
Wonderplan AI

一个免费的AI旅游规划工具,能根据你的喜好、需求生成专属行程,支...

智写流程
智写流程

一个能自动记录网页操作并生成操作指南的工具。它能捕捉鼠标点击、键...

ReactBits
ReactBits

一个免费开源的动画化、可交互React组件库,里面有好多动画化、...

电视眼
电视眼

也叫TV眼,是一个在线网络电视直播网站,提供全国5000+个电视...

Excel Dashboard Ai
Excel Dashboard Ai

一款能自动把 Excel 或 CSV 文件变成带交互功能的仪表盘...