首页 > Ai资讯 > Ai产品

MergeKit：一个用于合并预训练语言模型的开源工具包

MergeKit于2025-05-15发布在Ai产品

Mergekit是什么？

Mergekit 是一个 Python 工具，能将多个大模型合并成一个，发挥各自优势。比如，模型A写作厉害，模型 B 编程出色，mergekit 就能把它们合起来，变成一个更强的模型。它还能在 CPU 或 GPU 上合并，建议先用高精度模型合并，之后再量化和校准。这个ai项目很受开发者欢迎，比如有人用它把教育内容改成游戏主题，让创作更高效、更有趣。

MergeKit：一个用于合并预训练语言模型的开源工具包.jpg

Mergekit主要功能

模型合并：将多个预训练语言模型合并为一个多功能模型，无需额外训练或集成计算开销。
多种合并算法：支持多种合并方法，如线性插值、球面线性插值（SLERP）、任务算术（Task Arithmetic）、TIES、DARE 等。
硬件友好：支持在 CPU 或 GPU 上运行，最低只需 8GB 显存。
低内存使用：采用惰性加载张量技术，降低内存占用。
参数插值：支持参数值的插值梯度，提供更细粒度的控制。
分层组装：支持从不同模型的层片段中拼接组装语言模型（“Frankenmerging”）。
专家混合合并：将多个密集模型合并为专家混合模型。
LoRA 提取：从微调模型中提取 PEFT 兼容的低秩近似。
进化合并方法：包含一些实验性的进化合并方法。

Mergekit主要特点

跨平台执行：支持GPU和CPU执行，最低8GB VRAM即可加速。
低内存使用：通过懒加载张量实现。
多种合并算法：包括线性插值、SLERP、任务算术等，未来还会增加更多算法。
图形用户界面（GUI）：提供基于Arcee的GUI，简化合并过程。

安装与使用

安装

git clone https://github.com/arcee-ai/mergekit.git
cd mergekit
pip install -e .

使用

mergekit-yaml config.yml ./output-dir --cuda

Mergekit应用场景

模型能力融合：将不同专业领域的模型合并为一个多功能模型。
性能优化：结合不同模型的优势，提升整体性能。
资源受限环境下的优化：在计算资源有限的情况下创建更小但功能强大的模型。
个性化模型定制：根据特定需求定制模型。
模型研究与实验：为研究人员提供灵活的平台，探索不同的合并策略。

Github：https://github.com/arcee-ai/mergekit

腾讯元宝浏览器插件上线Chrome应用商店

阿里巴巴开源万相Wan2.1 - VACE视频模型

最新工具

CreBee

一款短视频矩阵运营工具，支持包括抖音、快手、小红书等主流社交平台...

Veltos Ai

一个能通过自然语言生成3D内容的创作平台，用户用日常语言描述想法...

VibeScan

一款AI代码扫描工具，能检测代码（包括 AI 生成的代码）中的安...

Typing Words

一款主打“打字+背单词”结合的网页端英语学习工具，它有两种练习模...

Hotkey Cheatsheet

“快捷键备忘录”，主要提供了众多软件和系统的快捷键速查信息，通过...

Peeps.ui8

UI8开发的免费在线3D头像工具，里面有超过 100 个能自己改...

Temp Mail

一款免费临时邮箱工具，能帮你快速生成一次性邮箱地址，短期接收邮件...

VoxDeck AI

一款AI演示文稿制作智能体工具，它可以做出好看又有动感的演示文稿...

BuzzFeed

美国一家数字媒体公司，主打互联网新闻和娱乐内容。它的内容丰富，覆...

Seko AI

一个能帮视频创作者 “一句话拍视频” 的智能平台。不用写复杂指令...

用户登录

MergeKit：一个用于合并预训练语言模型的开源工具包

Mergekit是什么？

Mergekit主要功能

Mergekit主要特点

安装与使用

Mergekit应用场景

相关文章

最新文章

最新工具

​​MergeKit​​：一个用于合并预训练语言模型的开源工具包

Mergekit是什么？

Mergekit主要功能

Mergekit主要特点

安装与使用

Mergekit应用场景

相关文章

最新文章

最新工具

MergeKit：一个用于合并预训练语言模型的开源工具包