​​MergeKit​​:一个用于合并预训练语言模型的开源工具包

Mergekit是什么?

Mergekit 是一个 Python 工具,能将多个大模型合并成一个,发挥各自优势。比如,模型A写作厉害,模型 B 编程出色,mergekit 就能把它们合起来,变成一个更强的模型。它还能在 CPU 或 GPU 上合并,建议先用高精度模型合并,之后再量化和校准。这个ai项目很受开发者欢迎,比如有人用它把教育内容改成游戏主题,让创作更高效、更有趣。

MergeKit:一个用于合并预训练语言模型的开源工具包.jpg

Mergekit主要功能

  • 模型合并:将多个预训练语言模型合并为一个多功能模型,无需额外训练或集成计算开销。

  • 多种合并算法:支持多种合并方法,如线性插值、球面线性插值(SLERP)、任务算术(Task Arithmetic)、TIES、DARE 等。

  • 硬件友好:支持在 CPU 或 GPU 上运行,最低只需 8GB 显存。

  • 低内存使用:采用惰性加载张量技术,降低内存占用。

  • 参数插值:支持参数值的插值梯度,提供更细粒度的控制。

  • 分层组装:支持从不同模型的层片段中拼接组装语言模型(“Frankenmerging”)。

  • 专家混合合并:将多个密集模型合并为专家混合模型。

  • LoRA 提取:从微调模型中提取 PEFT 兼容的低秩近似。

  • 进化合并方法:包含一些实验性的进化合并方法。

Mergekit主要特点

  • 跨平台执行:支持GPU和CPU执行,最低8GB VRAM即可加速。

  • 低内存使用:通过懒加载张量实现。

  • 多种合并算法:包括线性插值、SLERP、任务算术等,未来还会增加更多算法。

  • 图形用户界面(GUI):提供基于Arcee的GUI,简化合并过程。

安装与使用

安装

git clone https://github.com/arcee-ai/mergekit.git
cd mergekit
pip install -e .

使用

mergekit-yaml config.yml ./output-dir --cuda

Mergekit应用场景

  • 模型能力融合:将不同专业领域的模型合并为一个多功能模型。

  • 性能优化:结合不同模型的优势,提升整体性能。

  • 资源受限环境下的优化:在计算资源有限的情况下创建更小但功能强大的模型。

  • 个性化模型定制:根据特定需求定制模型。

  • 模型研究与实验:为研究人员提供灵活的平台,探索不同的合并策略。

Github:https://github.com/arcee-ai/mergekit

收藏

相关文章

最新工具
Aithor
Aithor

一款AI驱动的研究,AI写作助手,可以帮助用户生成高质量的学术和...

CodeBuddy
CodeBuddy

腾讯云代码助手,AI时代的智能编程伙伴,支持代码生成、补全、诊断...

FalcoCut
FalcoCut

一款功能非常实用的多语言本地化AI视频生成与编辑工具,支持视频翻...

Cloud Studio
Cloud Studio

腾讯云推出的在线集成开发环境(IDE),让开发者不用在本地安装软...

AI外贸员Zoe
AI外贸员Zoe

百型智能推出的国内首个专注于外贸行业的垂直智能Agent,能够根...

AnimeShorts
AnimeShorts

一个AI漫画与动画创作平台,提供包括角色创建、AI 剧本优化、动...

DeckSpeed
DeckSpeed

一款由00后创业者严訸团队开发的、基于Agent 架构,融合大模...

PulpMiner
PulpMiner

一款将网页数据实时转化为JSON API的工具,用户粘贴网页 U...

Pfp.Fm
Pfp.Fm

一款基于 AI的头像艺术风格生成器,通过AI将用户上传的照片转化...

天罡智算
天罡智算

一个智能算力交易平台,专注于解决GPU资源错配问题,通过智能匹配...