Arxiv Daily AIGC:一个arXiv论文爬虫、分析和整理自动化工具

Arxiv Daily AIGC是什么?

Arxiv Daily AIGC 是一个AI驱动的arXiv论文爬虫、分析和整理自动化工具,每天从 arXiv 的 cs.CV 领域提取最新论文,通过 OpenRouter API 筛选出与图像、视频和多模态生成相关的论文,并对其价值进行评估。筛选后的论文信息会被保存为 JSON 文件,再根据这些数据生成美观的 HTML 每日报告,并更新主页。整个流程,包括每日定时抓取、筛选、生成和部署到 GitHub Pages,都是通过 GitHub Actions 自动完成的。

Arxiv Daily AIGC:一个arXiv论文爬虫、分析和整理自动化工具.webp

Arxiv Daily AIGC功能特点

  • 数据抓取:每天自动从arXiv的计算机视觉(cs.CV)领域抓取最新论文。

  • AI筛选:使用大型语言模型(LLM,目前通过OpenRouter API)智能筛选与图像/视频/多模态生成相关的论文,并从不同维度对论文的价值进行评分。

  • 数据存储:将筛选后的论文信息(标题、摘要、链接等)以日期命名的JSON文件形式保存(存储在daily_json/目录中)。

  • 网页生成:基于JSON数据使用预设模板生成每日HTML报告(存储在daily_html/目录中),并更新主入口页面index.html。

  • 自动化部署:通过GitHub Actions实现每日定时抓取、筛选、生成和部署到GitHub Pages的完整流程。

Arxiv Daily AIGC技术栈

  • 后端/脚本:Python 3.x(使用arxiv、requests、jinja2等库)。

  • 前端:HTML5、TailwindCSS(CDN)、JavaScript、Framer Motion(CDN)。

  • 自动化:GitHub Actions。

  • 部署:GitHub Pages。

Arxiv Daily AIGC安装与使用

  1. 克隆仓库:使用git clone命令克隆项目到本地。

  2. 创建并激活虚拟环境:推荐使用Python虚拟环境。

  3. 安装依赖:安装requirements.txt文件中列出的所有Python库。

  4. 配置API密钥:项目需要OpenRouter API密钥进行AI筛选。

Arxiv Daily AIGC使用方法

  • 本地运行:直接运行主脚本main.py手动触发完整流程(抓取、筛选、生成)。

  • GitHub Actions自动化:仓库配置了GitHub Actions工作流(.github/workflows/daily_arxiv.yml),默认每天定时运行。

相关链接

Github:https://github.com/onion-liu/arxiv_daily_aigc

项目主页:https://www.aha-time.com/arxiv_daily_aigc/

收藏
最新工具
Custom Cursor
Custom Cursor

一个能让你拥有个性化光标的网站。Custom Cursor网站有...

橙子8设计
橙子8设计

一站式AI电商图片制作平台,专为电商和跨境卖家服务。不用专业设计...

Sandspiel
Sandspiel

一款基于细胞自动机和实时物理的开源像素沙盘游戏,玩家可以在虚拟沙...

印象地图
印象地图

这是个可以帮你记住全国省市位置的测试工具。打开网站就能用,选个模...

Sandtris
Sandtris

一款把经典俄罗斯方块和流沙物理效果结合的休闲游戏。玩家需要利用沙...

Maze Toys
Maze Toys

一个以迷宫游戏为主的网站,提供多种类型的迷宫玩法,包括Mini、...

AiPyApp
AiPyApp

一款以Python为核心的开源新人工智能体助手,结合大模型和 P...

Adobe Express
Adobe Express

Adobe推出的一站式设计工具,整合了图像、视频、文档/PDF、...

Intangible AI
Intangible AI

创意行业空间智能AI平台,通过简洁的3D界面与空间智能技术解决A...

法大大iTerms
法大大iTerms

法大大推出的一站式法律AI工作台,基于自研法律大模型的AI智能体...