Profile

ChatLearn 提供了两种 Profile 的方式:

  1. torch profiler

  2. nsys

注意:对于大模型,profile 的结果会非常大,建议在 profile 的时候减小模型尺寸。

Torch Profiler

用户可以在执行脚本中配置 runtime_args.profiler_dir=path_to_profile_dir 来开启 Torch profiler。

runtime_args.profiler_dir=path_to_profile_dir

nsys

用户可以在执行脚本中配置 runtime_args.nsys=true 来开启 nsys 的 profiler。

runtime_args.nsys=true

在启动程序的时候,需要在执行命令前加上 nsys 的启动参数,可以参考下述命令

nsys profile -w true -t cuda,nvtx,osrt,cudnn,cublas -s none  --capture-range=cudaProfilerApi --capture-range-end=stop-shutdown --cudabacktrace=true -x true --force-overwrite true -o my_profile \
python train_rlhf.py XXX