cpdown:将网页内容复制为Markdown格式文本

cpdown 是一款实用的浏览器插件,主要功能是帮助用户将网页内容复制为纯净的 Markdown 格式,解决了传统复制方式中 HTML 标签混乱的问题。它不仅能够一键复制网页内容,还能提取 YouTube 视频字幕,并自动过滤网页广告和无用元素,同时显示内容的 token 数量,方便对接大语言模型(LLM)。此外,它还支持键盘快捷键操作,极大地提升了工作效率。

cpdown:将网页内容复制为Markdown格式文本.webp

功能特点

  • 一键复制网页内容:通过点击浏览器工具栏的 cpdown 图标或使用键盘快捷键,用户可以快速将网页内容复制为 Markdown 格式。

  • 提取 YouTube 视频字幕:在观看 YouTube 视频时,用户可以轻松地将视频字幕以 Markdown 格式复制。

  • 自动过滤网页广告和无用元素:自动移除网页中的脚本、样式、iframe 等不必要的 HTML 元素,确保复制的内容干净整洁。

  • 显示内容的 token 数量:显示复制内容的 token 数量,这对于需要与大语言模型(LLM)对接的用户来说非常实用。

  • 支持键盘快捷键操作:用户可以通过自定义的键盘快捷键快速复制内容。

应用场景

  • 内容创作者(如博客作者、文章写手):可以快速将在线内容转换为 Markdown 格式,便于在编辑器中进行排版和编辑。

  • 学术研究者:在阅读在线论文时,能够轻松复制关键信息到 Markdown 文档中,方便整理和引用。

  • 知识分享者:在社交媒体、论坛等平台上分享内容时,可以将网页内容快速格式化为 Markdown,使分享的内容更加清晰和专业。

技术栈

  • Cursor:优化开发者的开发体验。

  • WXT (Web Extension Toolkit):作为构建浏览器扩展的基础框架。

  • React:用于构建用户界面的 JavaScript 库。

  • Shadcn UI:提供用户界面组件。

  • Sonner:实现 toast 通知功能。

  • Tailwind CSS:实用的 CSS 框架,用于样式设计。

  • Defuddle 和 Mozilla Readability:用于提取网页主体内容并清理 HTML 代码。

  • Turndown:将 HTML 转换为 Markdown。

  • tiktoken:计算复制内容的 token 数量。

项目特点

  • 一键复制:通过工具栏图标或快捷键快速复制网页内容。

  • 内容提取:利用 Defuddle 或 Mozilla Readability 算法提取主体内容,剔除冗余 HTML 元素。

  • 自定义配置:支持用户根据需求调整设置,如选择提取算法、开关成功提示、开启庆祝动画等。

  • 跨平台兼容:同时支持 Chrome 和 Firefox 浏览器。

使用方法

  1. 安装cpdown浏览器插件

  2. 打开您想要复制的网站。

  3. 点击浏览器工具栏中的 cpdown 图标,或使用键盘快捷键。

  4. 页面内容将被复制为 Markdown 格式到剪贴板。

  5. 将 Markdown 内容粘贴到您需要的任何地方。

开源项目链接

GitHub 仓库地址:https://github.com/ysm-dev/cpdown

收藏
最新工具
ClonBrowser
ClonBrowser

一款主打多账号隔离、反指纹和自动化的桌面与网页端指纹浏览器,常用...

Lightyear.fm
Lightyear.fm

一个既有趣又有教育意义的网站。Lightyear模拟了无线电波以...

MovieGame
MovieGame

一个电影爱好者做的个人网站,玩家通过看电影截图来猜电影片名,网站...

汉兜
汉兜

一款汉字版的Wordle游戏,基于流行的英文猜词游戏Wordle...

Gempix2 AI
Gempix2 AI

一款集生成和编辑图像于一体的的AI图像生成工具,提供包括文本转图...

极像素
极像素

一个展示和探索超高像素全景图像的在线平台,能提供全球各地超高分辨...

Krunker.io
Krunker.io

一款免费的在线多人第一人称射击游戏,直接在网页就能玩。游戏玩法多...

转换云
转换云

一个在线音乐格式转换网站,包括.ncm、.mgg、.mflac、...

萝卜工坊
萝卜工坊

一个能把电子文本变成逼真手写风格的在线工具。它有AI专属字体制作...

LyricsPoster
LyricsPoster

一个帮你把喜欢的歌手图片和歌词做成海报的在线工具。你可以在简单的...