LLMs-from-scratch:从零构建大模型

“LLMs-from-scratch” 是一个开源项目,由 Sebastian Raschka 创建,目的是帮助开发者从零开始实现一个类似 ChatGPT 的大型语言模型。这个项目是与他的书籍《Build a Large Language Model (From Scratch)》配套的官方代码仓库。

项目目标

  • 从零开始构建 LLM:通过逐步编码的方式,帮助读者深入理解 LLM 的内部机制。

  • 预训练和微调:提供完整的代码示例,用于在未标记数据上进行预训练,以及针对特定任务进行微调。

  • 教育目的:通过构建小型但功能完备的模型,帮助读者理解大型模型的开发过程。

LLMs-from-scratch:从零构建大模型.webp

主要功能结构

第 2 章:处理文本数据

  • 实现从零开始的字节对编码(BPE)分词器。

  • 提供数据加载器的实现和总结。

第 3 章:实现注意力机制

  • 实现多头注意力机制。

第 4 章:从零开始实现 GPT 模型

提供完整的 GPT 模型代码。

第 5 章:在未标记数据上进行预训练

  • 提供预训练代码和生成器代码。

第 6 章:针对文本分类进行微调

  • 提供针对文本分类任务的微调代码。

第 7 章:针对指令跟随进行微调

  • 提供指令微调代码和评估代码。

LLMs-from-scratch适合对自然语言处理和深度学习感兴趣的学习者,尤其是希望从零开始构建大型语言模型的开发者。

LLMs-from-scratch:从零构建大模型~tplv-tlddhu82om-image.webp

英文原版地址:https://github.com/rasbt/LLMs-from-scratch

中文资源地址:https://github.com/MLNLP-World/LLMs-from-scratch-CN

收藏

相关文章

最新工具
AiPyApp
AiPyApp

一款以Python为核心的开源新人工智能体助手,结合大模型和 P...

Adobe Express
Adobe Express

Adobe推出的一站式设计工具,整合了图像、视频、文档/PDF、...

Intangible AI
Intangible AI

创意行业空间智能AI平台,通过简洁的3D界面与空间智能技术解决A...

法大大iTerms
法大大iTerms

法大大推出的一站式法律AI工作台,基于自研法律大模型的AI智能体...

Relume
Relume

一个通过AI来优化网站设计与搭建流程的平台,可以快速生成网站地图...

Pomelli
Pomelli

Google开发的AI营销工具,主要服务中小商家。你只需要提供企...

Gartic.io
Gartic.io

一个很受欢迎的在线绘画猜词游戏。它把经典的“你画我猜”玩法和多人...

LandPPT
LandPPT

一个基于大语言模型的开源免费AIPPT生成平台,支持将文档内容自...

AppleWalls
AppleWalls

一个免费提供苹果官方内置壁纸下载的网站,包括iPhone、iPa...

Coddy.Tech
Coddy.Tech

一个免费、有趣且实用的编程学习平台。支持学习包括 Python、...