Repository Reading Site
ml-platform/examples/20-llm-training
目录页面可以直接继续下钻查看 Markdown、示例文件和脚本。
大模型训练与模型产物样本目录
这个目录不是可直接执行的真实训练结果,而是为了帮助初学者理解:
- 训练配置长什么样
- 训练运行元数据长什么样
- checkpoint 目录通常包含什么
- base model、adapter、merged model、runtime package 各自是什么
这里刻意保留了真实工程里的文件名和目录层级,但把超大的二进制权重文件换成了文本说明文件,避免把学习仓库变成模型仓库。
包含:
00-sft-lora-training-config.yaml一份 SFT + LoRA 训练任务配置示例01-run-metadata.json一次训练运行的元数据示例02-checkpoint/checkpoint-000120/一个中间 checkpoint 的典型结构03-base-model/基础模型目录里常见的配置和 tokenizer 文件04-adapter/LoRA adapter 的配置与产物说明05-model-registry/model-version.yaml企业里模型版本登记卡示例06-merged-model/合并后模型目录的典型形态07-runtime-package/面向推理引擎的运行时包说明
建议配合根目录的:
一起阅读。