Local-NotebookLM:开源的本地版NotebookLM,能够将PDF转换为播客

Local-NotebookLM 是什么?

Local-NotebookLM 是一个本地化的ai工具,能够将PDF文档转换为播客。它支持本地语言模型(LLM)和文本到语音(TTS)模型,用户可以根据需求生成不同风格和长度的播客。

Local-NotebookLM:开源的本地版NotebookLM,能够将PDF转换为播客.webp

Local-NotebookLM功能特点

智能文档处理

  • 自动文本提取:从PDF中提取文本,自动清理格式错误和冗余内容。

  • 学术论文支持:支持处理包含数学公式的学术论文。

  • 智能分块处理:支持大文件处理,最大支持10万字,自动分块以优化处理效率。

多模式内容生成

  • 丰富输出格式:支持15种输出格式,包括播客、访谈、辩论、讲座等。

  • 多样化内容风格:提供8种内容风格,涵盖专业、学术、轻松、搞笑等。

  • 灵活内容长度:支持4种内容长度,从短篇(10分钟)到长篇(100+分钟)。

灵活模型支持

  • 多LLM服务兼容:支持6种LLM服务,包括OpenAI、Groq和本地模型。

  • 可配置TTS语音角色:支持主持人与嘉宾双角色对话,可自定义语音角色。

  • 本地优先设计:优先使用本地资源,保护隐私,同时降低使用成本。

全渠道使用方式

  • 命令行一键生成:通过简单命令快速生成内容。

  • Python API集成:支持Python API集成,方便开发者使用。

  • 网页版服务:基于FastAPI的网页版服务,便于在线操作。

安装与配置

  • 安装需求:需要安装Docker Desktop,并安装Kokoro-FastAPI。

  • 安装步骤:通过Git克隆项目,创建并激活虚拟环境,然后安装所需的Python包。

  • 配置文件:需要创建一个config.yaml文件,用于配置输出目录、LLM提供商、模型名称、语音克隆参数等。

Local-NotebookLM使用方法

  • 环境准备:根据所使用的LLM提供商,启动相应的服务或确保API密钥可用。

  • 运行脚本:通过运行python main.py input.pdf [options]命令,将PDF文件转换为播客。

  • 可选参数:用户可以指定播客的风格、长度、文本处理的分块大小等。

Local-NotebookLM处理流程

  1. PDF处理:提取PDF文本,清理并分割为可处理的块。

  2. 生成脚本:根据指定的风格和长度生成播客脚本。

  3. 优化TTS:对脚本进行优化,以提高语音合成的自然度。

  4. 生成音频:将文本转换为语音,并生成最终的音频文件。

FAQ

1. Local-NotebookLM如何生成播客?

  • 将PDF文件上传到工具中。

  • 使用命令行运行脚本,指定播客的风格和长度。

  • 工具会自动处理文本并生成音频文件

2. Local-NotebookLM 与 NotebookLM 有什么区别?

  • Local-NotebookLM 是一个本地化的工具,运行在本地机器上,支持本地LLM和TTS模型。

  • NotebookLM 是一个基于云的工具,主要用于笔记管理和文档分析,支持AI驱动的总结、协作和音频生成。

GitHub仓库:https://github.com/Goekdeniz-Guelmez/Local-NotebookLM

收藏
最新工具
ChinaTextbook
ChinaTextbook

一个专门收集和分享中国大陆从小学到大学的教材资源的开源项目,特别...

暗壳AI
暗壳AI

家居AIGC营销与导购工具,它号称“一人即团队”,能够快速生成渲...

UntitledPen
UntitledPen

一个可以生成真实人声旁白的工具,也就是能够在一个平台上编写、编辑...

PageAI
PageAI

一款AI网站生成工具,就像一个小型创意工作室一样,能在短时间内根...

Seedance AI
Seedance AI

字节跳动推出的一款强大的视频生成工具,借助 Seedance 1...

ChatPs
ChatPs

ChatPs 是一款为 Photoshop 设计的插件,它背后是...

趣丸千音
趣丸千音

一个AI语音创作平台,专注提供一站式智能语音解决方案。集成文本转...

太极神器 TAICHI-flet
太极神器 TAICHI-flet

基于flet的一款多功能娱乐软件,实现了浏览图片、音乐、小说、各...

YIKM
YIKM

一个能在线玩小霸王、红白机、街机、FC 等经典游戏的地方,像《魂...

Bridgely
Bridgely

基于AI的实时通用翻译浏览器扩展,支持 60 多种语言,包括 W...