Repository Reading Site

大模型训练与模型产物样本目录

这个目录不是可直接执行的真实训练结果，而是为了帮助初学者理解：这里刻意保留了真实工程里的文件名和目录层级，但把超大的二进制权重文件换成了文本说明文件，避免把学习仓库变成模型仓库。包含：一份 SFT + LoRA 训练任务配置示例一次训练运行的元数据示例一个中间 checkpoint 的典型结构基础模型目录里常见的配置和 tokenizer 文件

Markdownml-platform/examples/20-llm-training/README.md2026年4月10日 10:41

大模型训练与模型产物样本目录

这个目录不是可直接执行的真实训练结果，而是为了帮助初学者理解：

训练配置长什么样
训练运行元数据长什么样
checkpoint 目录通常包含什么
base model、adapter、merged model、runtime package 各自是什么

这里刻意保留了真实工程里的文件名和目录层级，但把超大的二进制权重文件换成了文本说明文件，避免把学习仓库变成模型仓库。

包含：

00-sft-lora-training-config.yaml 一份 SFT + LoRA 训练任务配置示例
01-run-metadata.json 一次训练运行的元数据示例
02-checkpoint/checkpoint-000120/ 一个中间 checkpoint 的典型结构
03-base-model/ 基础模型目录里常见的配置和 tokenizer 文件
04-adapter/ LoRA adapter 的配置与产物说明
05-model-registry/model-version.yaml 企业里模型版本登记卡示例
06-merged-model/ 合并后模型目录的典型形态
07-runtime-package/ 面向推理引擎的运行时包说明

建议配合根目录的：

20-第二十课-大模型训练-SFT-LoRA-Checkpoint-Adapter与模型产物原理.md

一起阅读。