LLMs-from-scratch:从零构建大模型

“LLMs-from-scratch” 是一个开源项目,由 Sebastian Raschka 创建,目的是帮助开发者从零开始实现一个类似 ChatGPT 的大型语言模型。这个项目是与他的书籍《Build a Large Language Model (From Scratch)》配套的官方代码仓库。

项目目标

  • 从零开始构建 LLM:通过逐步编码的方式,帮助读者深入理解 LLM 的内部机制。

  • 预训练和微调:提供完整的代码示例,用于在未标记数据上进行预训练,以及针对特定任务进行微调。

  • 教育目的:通过构建小型但功能完备的模型,帮助读者理解大型模型的开发过程。

LLMs-from-scratch:从零构建大模型.webp

主要功能结构

第 2 章:处理文本数据

  • 实现从零开始的字节对编码(BPE)分词器。

  • 提供数据加载器的实现和总结。

第 3 章:实现注意力机制

  • 实现多头注意力机制。

第 4 章:从零开始实现 GPT 模型

提供完整的 GPT 模型代码。

第 5 章:在未标记数据上进行预训练

  • 提供预训练代码和生成器代码。

第 6 章:针对文本分类进行微调

  • 提供针对文本分类任务的微调代码。

第 7 章:针对指令跟随进行微调

  • 提供指令微调代码和评估代码。

LLMs-from-scratch适合对自然语言处理和深度学习感兴趣的学习者,尤其是希望从零开始构建大型语言模型的开发者。

LLMs-from-scratch:从零构建大模型~tplv-tlddhu82om-image.webp

英文原版地址:https://github.com/rasbt/LLMs-from-scratch

中文资源地址:https://github.com/MLNLP-World/LLMs-from-scratch-CN

收藏

相关文章

最新工具
Oldswf
Oldswf

专门提供经典Flash小游戏的网站,收录了超过5万多不同类型的游...

AutoClip
AutoClip

一款AI智能视频切片工具,能自动下载B站视频、剪辑精彩片段并生成...

EdClub
EdClub

一个提供高品质课程的学习平台,EdClub主要提供打字学习、词汇...

Resource Boy
Resource Boy

一个提供高质量免费样机等设计资源的网站,有很多素材,像材质、笔刷...

AlternativeTo
AlternativeTo

一个众包软件推荐平台,可以帮用户找到更好的应用和服务。你可以搜各...

DaYin.page
DaYin.page

一个强大、免费、易用的在线习题打印生成器网站,可以一键生成数学题...

Mobile Phone Museum
Mobile Phone Museum

一个非营利组织的手机博物馆,目的是存档和保存移动技术,并扩大对移...

BlackACE黑桃A
BlackACE黑桃A

一款可以将网站转换为安卓APP的工具,它可以够帮助个人开发者、创...

Aluo AI
Aluo AI

电商AI图片编辑平台,30 秒就能做出专业的商品图片,它能自动扣...

CrazyGames
CrazyGames

全球有名的免费在线小游戏平台,涵盖动作、冒险、射击、益智、体育、...