Arxiv Daily AIGC:一个arXiv论文爬虫、分析和整理自动化工具

Arxiv Daily AIGC是什么?

Arxiv Daily AIGC 是一个AI驱动的arXiv论文爬虫、分析和整理自动化工具,每天从 arXiv 的 cs.CV 领域提取最新论文,通过 OpenRouter API 筛选出与图像、视频和多模态生成相关的论文,并对其价值进行评估。筛选后的论文信息会被保存为 JSON 文件,再根据这些数据生成美观的 HTML 每日报告,并更新主页。整个流程,包括每日定时抓取、筛选、生成和部署到 GitHub Pages,都是通过 GitHub Actions 自动完成的。

Arxiv Daily AIGC:一个arXiv论文爬虫、分析和整理自动化工具.webp

Arxiv Daily AIGC功能特点

  • 数据抓取:每天自动从arXiv的计算机视觉(cs.CV)领域抓取最新论文。

  • AI筛选:使用大型语言模型(LLM,目前通过OpenRouter API)智能筛选与图像/视频/多模态生成相关的论文,并从不同维度对论文的价值进行评分。

  • 数据存储:将筛选后的论文信息(标题、摘要、链接等)以日期命名的JSON文件形式保存(存储在daily_json/目录中)。

  • 网页生成:基于JSON数据使用预设模板生成每日HTML报告(存储在daily_html/目录中),并更新主入口页面index.html。

  • 自动化部署:通过GitHub Actions实现每日定时抓取、筛选、生成和部署到GitHub Pages的完整流程。

Arxiv Daily AIGC技术栈

  • 后端/脚本:Python 3.x(使用arxiv、requests、jinja2等库)。

  • 前端:HTML5、TailwindCSS(CDN)、JavaScript、Framer Motion(CDN)。

  • 自动化:GitHub Actions。

  • 部署:GitHub Pages。

Arxiv Daily AIGC安装与使用

  1. 克隆仓库:使用git clone命令克隆项目到本地。

  2. 创建并激活虚拟环境:推荐使用Python虚拟环境。

  3. 安装依赖:安装requirements.txt文件中列出的所有Python库。

  4. 配置API密钥:项目需要OpenRouter API密钥进行AI筛选。

Arxiv Daily AIGC使用方法

  • 本地运行:直接运行主脚本main.py手动触发完整流程(抓取、筛选、生成)。

  • GitHub Actions自动化:仓库配置了GitHub Actions工作流(.github/workflows/daily_arxiv.yml),默认每天定时运行。

相关链接

Github:https://github.com/onion-liu/arxiv_daily_aigc

项目主页:https://www.aha-time.com/arxiv_daily_aigc/

收藏
最新工具
GamePix
GamePix

全球领先的 HTML5 和 WebGL 游戏分发平台。它把各类分...

PixelSquid
PixelSquid

Shutterstock推出的专为平面设计师和Photoshop...

Dos.Zone
Dos.Zone

一个聚合经典DOS游戏的在线游玩平台,游戏种类特别多,有动作、策...

KBHgames
KBHgames

一个老牌免费在线游戏网站,谁都可以在这儿找到想玩的游戏。涵盖动作...

SoundWise AI
SoundWise AI

一个完全免费的AI音视频转录工具,能在浏览器里直接把音频和视频转...

Armor Games
Armor Games

全球知名免费在线游戏平台与独立游戏发行商​,ArmorGames...

Social Auto Upload
Social Auto Upload

社交媒体视频一键多平台发布工具​,一站式解决抖音、小红书、视频号...

在线DOS游戏
在线DOS游戏

一个能在浏览器直接玩DOS游戏的在线模拟器,适合怀旧玩家和游戏开...

HDLOGO
HDLOGO

HDLOGO 是一个专门整理矢量标志和图标的网站,提供各类品牌和...

Funes.world
Funes.world

一个在线博物馆项目,通过众包方式把世界各地的建筑做成3D模型,F...