Unsloth大模型微调专家

NSDT工具推荐： Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 - AI模型在线查看 - Three.js虚拟轴心开发包 - 3D模型在线减面 - STL模型在线切割 - 3D道路快速建模

在快速发展的人工智能世界中，对大型语言模型 (LLM) 进行微调变得越来越重要。随着AI模型的复杂性和能力不断增长，对高效训练方法的需求也急剧上升。微调使开发人员能够将这些强大的模型适应特定任务，使其更加通用和有效。

一家新的AI初创公司 Unsloth 将通过其突破性产品改变这一格局，该产品有望使微调过程快 30 倍。以下是 Unsloth 如何为人工智能开发人员和研究人员改变游戏规则。

1、速度和效率

Unsloth 提供了一种革命性的解决方案，将 Alpaca 模型的训练时间从通常的 85 小时缩短到仅 3 小时。这一重大改进意味着以前需要几天才能完成的任务现在可以在几个小时内完成。他们的 Max 产品通过将内存使用量减少 60% 来进一步提高性能，使批大小增加六倍。这些增强功能不会影响准确性；事实上，他们的 Max 产品可以将准确性提高多达 20%。

“在 24 小时内训练您自己的 ChatGPT，而不是 30 天”。—— Unsloth

2、无需新硬件

Unsloth 的突出特点之一是它仅通过软件优化就实现了这些性能提升，无需新硬件投资。该解决方案与 NVIDIA、Intel 和 AMD GPU 兼容，使其可供广泛的用户使用且用途广泛。

3、技术创新

Unsloth 实施了几种尖端技术来实现这些结果：

手动自动求导和链式矩阵乘法优化：通过手动推导矩阵微分并在链式矩阵乘法期间策略性地放置括号，Unsloth 显著提高了性能。
OpenAI 的 Triton 语言：他们使用 Triton 重写了所有核，确保它们干净、可读且快速。例如，他们的 RoPE 嵌入核实现（包括反向传递）展示了对性能和可读性的承诺。
通过 xformers 和 Tri Dao 的实现实现 Flash Attention：这允许更快的注意力机制，这是 LLM 中的一个关键组件。

4、性能基准

Unsloth 的优化不仅仅是理论上的；它们已经经过了严格的测试。以下是一些基准：

单块 Tesla T4 GPU 上的 Alpaca 数据集：Huggingface 最初的实现需要 23 小时 15 分钟，而 Unsloth 的 Max 产品仅用 2 小时 34 分钟就完成了任务，速度提高了 8.8 倍。
两块 Tesla T4 GPU 上的 SlimOrca 数据集：他们的解决方案将训练时间从 391 小时缩短到 51 小时，速度提高了 7.6 倍。
两块 Tesla T4 GPU 上的 LAION Chip2 数据集：训练时间从 164 小时缩短到 5 小时，速度提高了 31 倍。

在内存使用方面，对于 Open Assistant 数据集，Unsloth 的解决方案将 A10 GPU 上的峰值内存使用量从 16.7GB 减少到 6.9GB，将 Tesla T4 GPU 上的峰值内存使用量从 14.6GB 减少到 7.5GB。

5、开源和专业产品

Unsloth 相信社区和开源的力量。他们的免费开源版本使微调速度提高了两倍，内存使用量减少了 50%。你可以使用简单的 pip install 来尝试：

pip install "unsloth[cu118] @ git+https://github.com/unslothai/unsloth.git"
pip install "unsloth[cu121] @ git+https://github.com/unslothai/unsloth.git"

对于那些寻求更强大功能的用户，他们的 Pro 和 Max 产品提供多 GPU 支持、进一步加速以及从头开始全面训练 LLM 的支持。他们甚至将 bitsandbytes 的 4 位量化方法移植到 Triton。

Unsloth 目前提供以下计划：

6、未来计划

Unsloth 对未来有着雄心勃勃的计划。以下是接下来的预览：

在 NVIDIA、Intel 和 AMD GPU 上实现更快的推理
Sqrt 梯度检查点：此技术进一步将内存使用量减少了 25%。
AI-MO 竞赛：他们计划参加并在本次竞赛中脱颖而出。
更快的 DPO 实施：虽然 OpenAI 的 ChatGPT 使用 PPO 进行 RLHF，但 DPO 已证明同样强大，而 Unsloth 的目标是使其更快。

此外，他们即将推出几款令人兴奋的产品，包括金融LLM、衰退预测器和数据科学顾问代理。

原文链接：Introducing Unsloth: Revolutionizing LLM Training

BimAnt翻译整理，转载请标明出处

Unsloth大模型微调专家

1、速度和效率

2、无需新硬件

3、技术创新

4、性能基准

5、开源和专业产品

6、未来计划

admin

Llama 3.2 构建智能代理

Unsloth大模型微调指南

1、速度和效率

2、无需新硬件

3、技术创新

4、性能基准

5、开源和专业产品

6、未来计划

Llama 3.2 构建智能代理

Unsloth大模型微调指南

You might also like...

You might also like...