Repository Reading Site
files-manifest.txt
ml-platform/examples/20-llm-training/03-base-model/files-manifest.txt
这个目录模拟的是“基础模型目录”。
真实项目里,除了这里保留的配置文件,通常还会有:
- `model.safetensors`
单文件权重
或者:
- `model-00001-of-00004.safetensors`
- `model-00002-of-00004.safetensors`
- `model-00003-of-00004.safetensors`
- `model-00004-of-00004.safetensors`
- `model.safetensors.index.json`
这取决于模型体积是否需要分片。
你要建立一个很重要的直觉:
- `config.json` 决定模型结构怎么解释
- `tokenizer*.json` 决定文本怎么切 token
- `model*.safetensors` 才是参数本体
缺任何一类文件,模型都可能无法正确加载或行为异常。