Repository Reading Site
K8s Lab 文档站
把当前仓库文档整理成一个可在浏览器中阅读的本地网站。
Web Reading Layer
K8s Lab 文档站
这个页面直接读取当前仓库里的 Markdown、YAML、JSON 和脚本文件, 把散落在根目录、Phase 目录和平台专题里的内容整理成一个可浏览的阅读网站。
从零搭建生产级 Kubernetes 集群,覆盖面试高频考点 + 生产实战技能。 不是"会敲命令",而是: 5 台跨地域服务器(3 台洛杉矶 + 2 台香港),模拟真实的多区域部署: | 角色 | IP | 位置 | 配置 | 备注 | |------|-----|------|------|------| | Master | 107.148.176.19
00-学习总纲-仓库评估与专家路线图.md K8s-Lab 学习总纲、仓库评估与专家路线图这份文档回答四个问题: 1. 当前目录里的内容,作为 Kubernetes 学习材料,到底够不够。 2. 这些内容分别在教你什么,为什么这样安排。 3. 如果你的目标不是“会敲命令”,而是“能做架构、能做排障、能带团队搭平台”,还缺哪些关键能力。 4. 你应该怎么学,才能真正把这套内容吃透,而不是学完就忘。 --- 如果你的问题是: “这套内容能不能把我从
01-环境验证与第一课-认识你的真实集群.md 环境验证与第一课:认识你的真实集群很多人学 Kubernetes,一上来就: 然后很快进入一种错觉: “我会了。” 但真正的工程学习,第一步不是敲命令,而是**确认你手上的环境到底是什么**。 原因很简单: 1. 你不清楚环境边界,就不知道后面每个现象是正常还是异常。 2. 你不先确认连通性,后续所有排障都可能混进“环境没配好”的噪音。 3. 你不认识自己的集群,就永远学不到“从真实系统反推
20-第二十课-大模型训练-SFT-LoRA-Checkpoint-Adapter与模型产物原理.md 第二十课:大模型训练、SFT、LoRA、Checkpoint、Adapter 与模型产物原理前一课我们把“数据是什么、样本长什么样、为什么要清洗和版本管理”讲清楚了。 但如果你只知道数据,不知道训练过程到底在做什么,你还是会停留在一种很浅的理解: 这当然不对。 真正的训练过程,本质上是一套非常明确的优化过程: 所以这一课的目标不是教你“会跑一个训练命令”,而是要把下面这些核心问题彻底讲透: 1. 训练到底在优化什么? 2. 一次前向、一次反向、一个
21-第二十一课-大模型推理-量化-KV-Cache-vLLM-吞吐延迟与部署发布链路原理.md 第二十一课:大模型推理、量化、KV Cache、vLLM、吞吐/延迟与部署发布链路原理上一课我们把这些边界已经钉住了: 但到这里,你还没有真正走到“线上服务”。 因为训练结束之后,真正困难的问题才刚刚开始: 1. 为什么一个训练好的模型,不能直接等于线上服务? 2. 为什么同样是一个 7B 模型,有的机器能跑,有的根本装不下? 3. 为什么提示词一长,首 token 延迟就突然变高? 4. 为什么多用户并发一上来,吞吐和延迟会互相打架? 5.
Phase 0
5 篇文档,按阶段阅读。
Phase 1
4 篇文档,按阶段阅读。
Phase 2
4 篇文档,按阶段阅读。
Phase 3
3 篇文档,按阶段阅读。
Phase 4
2 篇文档,按阶段阅读。
资源目录
实验 YAML、训练样例、脚本文件都可以在网页里直接点开查看。