Repository Reading Site
大模型训练与模型产物样本目录
这个目录不是可直接执行的真实训练结果,而是为了帮助初学者理解: 这里刻意保留了真实工程里的文件名和目录层级,但把超大的二进制权重文件换成了文本说明文件,避免把学习仓库变成模型仓库。 包含: 一份 SFT + LoRA 训练任务配置示例 一次训练运行的元数据示例 一个中间 checkpoint 的典型结构 基础模型目录里常见的配置和 tokenizer 文件
大模型训练与模型产物样本目录
这个目录不是可直接执行的真实训练结果,而是为了帮助初学者理解:
- 训练配置长什么样
- 训练运行元数据长什么样
- checkpoint 目录通常包含什么
- base model、adapter、merged model、runtime package 各自是什么
这里刻意保留了真实工程里的文件名和目录层级,但把超大的二进制权重文件换成了文本说明文件,避免把学习仓库变成模型仓库。
包含:
00-sft-lora-training-config.yaml一份 SFT + LoRA 训练任务配置示例01-run-metadata.json一次训练运行的元数据示例02-checkpoint/checkpoint-000120/一个中间 checkpoint 的典型结构03-base-model/基础模型目录里常见的配置和 tokenizer 文件04-adapter/LoRA adapter 的配置与产物说明05-model-registry/model-version.yaml企业里模型版本登记卡示例06-merged-model/合并后模型目录的典型形态07-runtime-package/面向推理引擎的运行时包说明
建议配合根目录的:
一起阅读。