K8s Lab 把当前仓库文档整理成一个可阅读的网页站点

Repository Reading Site

checkpoint-files.txt

ml-platform/examples/20-llm-training/02-checkpoint/checkpoint-000120/checkpoint-files.txt

Text Assetml-platform/examples/20-llm-training/02-checkpoint/checkpoint-000120/checkpoint-files.txt688 B2026年4月10日 10:41查看原始内容
这个目录模拟的是“训练过程中的一个中间检查点”。

真实项目里,这里常见的文件包括:

- `adapter_model.safetensors`
  LoRA adapter 的权重文件
- `optimizer.pt`
  优化器状态,恢复训练时要用
- `scheduler.pt`
  学习率调度器状态
- `rng_state.pth`
  随机数状态,便于复现实验
- `trainer_state.json`
  训练器状态和日志摘要
- `training_args.bin` 或 `training_args.json`
  本次训练的参数快照

为什么这里没有真实二进制:

- `*.safetensors`
- `*.pt`
- `*.pth`

因为这个仓库是学习仓库,不适合放超大的权重和优化器状态文件,所以只保留文本化结构说明。