ChatLearn
简介
ChatLearn: 灵活、易用、高效的大语言模型(LLMs)强化学习训练框架
安装
环境和代码准备
使用教程
基于 FSDP 的端到端GRPO训练流程
基于 Mcore 的端到端GRPO训练流程
基于 FSDP 的端到端 Qwen2.5VL GRPO训练流程
基于 Mcore 的Qwen2.5-VL 端到端GRPO训练流程
使用ChatLearn构建Agent训练流程
多节点分布式训练
续跑和容错
性能调优指南
Profile
自定义任务
数据集准备
配置说明
配置说明
常见问题
常见问题
常见报错
ChatLearn
搜索
Please activate JavaScript to enable the search functionality.