ArXiv Paper Summarizer:基于Python的arXiv论文摘要工具
ArXiv Paper Summarizer是什么?
ArXiv Paper Summarizer是一个基于 Python 的 arXiv 论文摘要ai工具,利用免费的 Gemini API 实现论文内容提取与总结,支持单 / 批量 URL 处理、关键词检索及每日自动摘要功能,适合科研人员快速获取文献关键信息。
ArXiv Paper Summarizer核心功能
单篇论文摘要:输入 ArXiv 论文 URL(需为摘要页而非 PDF 链接),生成内容总结。
批量 URL 摘要:将多个 URL 存入links.txt,一次性处理并保存结果到result.txt。
关键词检索与批量摘要:通过keywords_summarizer.py指定关键词(如 “transformer, sparsity”)和日期范围(如 2017-2024),自动检索相关论文并生成摘要。
每日自动摘要(通过 Google Apps Script):配置关键词和 Google Doc,每日定时检索新论文,将标题、链接和摘要自动更新到文档中。支持自定义执行时间(如午夜)和邮件通知。
ArXiv Paper Summarizer应用场景
快速获取研究进展:研究人员和学生可以快速了解特定领域的最新研究进展。
研究趋势跟踪:通过关键词批量摘要功能,可以跟踪新的研究趋势。
文献综述辅助:帮助研究人员在撰写文献综述时快速获取相关论文的核心内容。
ArXiv Paper Summarizer安装与配置
1. 环境要求
Python 3.11
Conda(环境管理)
Gemini API 密钥(需从 Google 获取)
2. 步骤
# 克隆仓库 git clone https://github.com/Shaier/arxiv_summarizer.git cd arxiv_summarizer # 创建并激活Conda环境 conda create -n arxiv_summarizer python=3.11 conda activate arxiv_summarizer # 安装依赖 pip install -r requirements.txt
3. 配置 API 密钥
打开url_summarize.py,替换第 5 行的YOUR_GEMINI_API_KEY为实际密钥。
自动摘要功能需在daily_arxiv.txt脚本中同时配置docId(Google Doc ID)和apiKey。
使用示例
单篇摘要
python url_summarize.py > 输入1(单篇) > 输入URL:https://arxiv.org/abs/2410.08003
批量 URL 摘要
在links.txt中每行添加一个 URL
运行:
python url_summarize.py > 输入2(批量)
关键词检索
python keywords_summarizer.py > 输入关键词:"machine learning, computer vision" > 输入开始日期:2023-01-01 > 输入结束日期:2023-12-31
自动每日摘要设置
创建 Google Doc
新建文档,复制 URL 中的文档 ID(如123HEM4h5aQwygDk_A-xNaJ8CUoyMZTFsChyMk)。
配置 Google Apps Script
访问Google Apps Script,新建项目。
将daily_arxiv.txt内容粘贴到编辑器,替换docId、apiKey和keywords数组。
测试与调度
手动运行脚本测试,确认 Google Doc 更新。
在 “触发器” 中设置每日定时执行(如选择 “每天午夜”)。
Github:https://github.com/Shaier/arxiv_summarizer