cpdown:将网页内容复制为Markdown格式文本
cpdown 是一款实用的浏览器插件,主要功能是帮助用户将网页内容复制为纯净的 Markdown 格式,解决了传统复制方式中 HTML 标签混乱的问题。它不仅能够一键复制网页内容,还能提取 YouTube 视频字幕,并自动过滤网页广告和无用元素,同时显示内容的 token 数量,方便对接大语言模型(LLM)。此外,它还支持键盘快捷键操作,极大地提升了工作效率。
功能特点
一键复制网页内容:通过点击浏览器工具栏的 cpdown 图标或使用键盘快捷键,用户可以快速将网页内容复制为 Markdown 格式。
提取 YouTube 视频字幕:在观看 YouTube 视频时,用户可以轻松地将视频字幕以 Markdown 格式复制。
自动过滤网页广告和无用元素:自动移除网页中的脚本、样式、iframe 等不必要的 HTML 元素,确保复制的内容干净整洁。
显示内容的 token 数量:显示复制内容的 token 数量,这对于需要与大语言模型(LLM)对接的用户来说非常实用。
支持键盘快捷键操作:用户可以通过自定义的键盘快捷键快速复制内容。
应用场景
内容创作者(如博客作者、文章写手):可以快速将在线内容转换为 Markdown 格式,便于在编辑器中进行排版和编辑。
学术研究者:在阅读在线论文时,能够轻松复制关键信息到 Markdown 文档中,方便整理和引用。
知识分享者:在社交媒体、论坛等平台上分享内容时,可以将网页内容快速格式化为 Markdown,使分享的内容更加清晰和专业。
技术栈
Cursor:优化开发者的开发体验。
WXT (Web Extension Toolkit):作为构建浏览器扩展的基础框架。
React:用于构建用户界面的 JavaScript 库。
Shadcn UI:提供用户界面组件。
Sonner:实现 toast 通知功能。
Tailwind CSS:实用的 CSS 框架,用于样式设计。
Defuddle 和 Mozilla Readability:用于提取网页主体内容并清理 HTML 代码。
Turndown:将 HTML 转换为 Markdown。
tiktoken:计算复制内容的 token 数量。
项目特点
一键复制:通过工具栏图标或快捷键快速复制网页内容。
内容提取:利用 Defuddle 或 Mozilla Readability 算法提取主体内容,剔除冗余 HTML 元素。
自定义配置:支持用户根据需求调整设置,如选择提取算法、开关成功提示、开启庆祝动画等。
跨平台兼容:同时支持 Chrome 和 Firefox 浏览器。
使用方法
打开您想要复制的网站。
点击浏览器工具栏中的 cpdown 图标,或使用键盘快捷键。
页面内容将被复制为 Markdown 格式到剪贴板。
将 Markdown 内容粘贴到您需要的任何地方。
开源项目链接
GitHub 仓库地址:https://github.com/ysm-dev/cpdown