ChatLearn

简介

  • ChatLearn: 灵活、易用、高效的大语言模型(LLMs)强化学习训练框架

安装

  • 环境和代码准备

使用教程

  • 基于 FSDP 的端到端GRPO训练流程
  • 基于 Mcore 的端到端GRPO训练流程
  • 基于 FSDP 的端到端 Qwen2.5VL GRPO训练流程
  • 基于 Mcore 的Qwen2.5-VL 端到端GRPO训练流程
  • 使用ChatLearn构建Agent训练流程
  • 多节点分布式训练
  • 续跑和容错
  • 性能调优指南
  • Profile

自定义任务

  • 数据集准备

配置说明

  • 配置说明

常见问题

  • 常见问题
  • 常见报错
ChatLearn
  • 搜索


© Copyright 2024, Alibaba Cloud.

Built with Sphinx using a theme provided by Read the Docs.