Repository Reading Site
checkpoint-files.txt
ml-platform/examples/20-llm-training/02-checkpoint/checkpoint-000120/checkpoint-files.txt
这个目录模拟的是“训练过程中的一个中间检查点”。
真实项目里,这里常见的文件包括:
- `adapter_model.safetensors`
LoRA adapter 的权重文件
- `optimizer.pt`
优化器状态,恢复训练时要用
- `scheduler.pt`
学习率调度器状态
- `rng_state.pth`
随机数状态,便于复现实验
- `trainer_state.json`
训练器状态和日志摘要
- `training_args.bin` 或 `training_args.json`
本次训练的参数快照
为什么这里没有真实二进制:
- `*.safetensors`
- `*.pt`
- `*.pth`
因为这个仓库是学习仓库,不适合放超大的权重和优化器状态文件,所以只保留文本化结构说明。