我最近想从头从原理开始学习k8s,所以打算一点点写学习笔记,我的配图和内容很多都来自CNCF和阿里云,仅仅学习分享,如涉及侵权本人将及时删除。
一、资源元信息
1、Kubernetes的资源对象
kubernetes的资源对象主要包括apiVersion、kind、metadata、status和spec五个部分,其中其中apiVersion用来指定api的版本,kind用来指定资源的类型,Status用来描述资源当前的状态,而Spec用来描述资源期望达到的状态。
metadata的部分内容是接下来的内容:
metadata即元数据部分。该部分主要包括了用来识别资源的标签:Labels, 用来描述资源的注解;Annotations, 用来描述多个资源之间相互关系的 OwnerReference。这些元数据在 K8s 运行中有非常重要的作用。
2. labels
资源标签是一种具有标识型的 Key:Value 元数据。标签主要用来筛选资源和组合资源,可以使用类似于 SQL 查询 select,来根据 Label 查询相关的资源。
|
|
3、Selector
讲完了label就是label的使用对象:selector。主要包含以下几种写法:
-
等式选择器(Equality-based Selector):使用等号(=)来匹配标签的具体值。示例:
app=myapp
-
集合选择器(Set-based Selector):使用逗号分隔的多个键值对来匹配标签集合。示例:
app in (app1, app2)
-
存在选择器(Existence-based Selector):使用"key"或者"!key"来判断是否存在指定的标签。示例:
environment
或!environment
-
非选择器(Inequality-based Selector):使用"!=“来匹配不同于指定值的标签。示例:
tier != frontend
-
组合选择器(Combination-based Selector):示例:
app=myapp, environment=dev
,逗号组合之后是逻辑与的关系
4. Annotations
注解一般是系统或者工具用来存储资源的非标示性信息,可以用来 扩展 资源的 spec/status 的描述。
-
它一般来说比Label更大,
-
并且可以包含特殊字符,
-
可以结构化也可以非结构化。
|
|
5、OwnerReference
OwnerReference所有者,一般就是指集合类的资源,比如说 Pod 集合,就有 replicaset、statefulset。集合类资源的控制器会创建对应的归属资源。比如:replicaset 控制器在操作中会创建 Pod,被创建 Pod 的 OwnerReference 就指向了创建 Pod 的 replicaset,OwnerReference 使得用户可以方便地查找一个创建资源的对象,另外,还可以用来实现级联删除的效果。
二、控制器模式
1、控制循环
控制型模式最核心的就是控制循环的概念。在控制循环中包括了 控制器,被控制的系统,以及能够观测系统的传感器,三个逻辑组件。
当然这些组件都是逻辑的,外界通过修改资源 spec 来控制资源,控制器比较资源 spec 和 status,从而计算一个 diff,diff 最后会用来决定执行对系统进行什么样的控制操作,控制操作会使得系统产生新的输出,并被传感器以资源 status 形式上报,控制器的各个组件将都会是独立自主地运行,不断使系统向 spec 表示终态趋近。
2、Sensor
控制循环中逻辑的传感器主要由 Reflector(反射器)、Informer(告密者)、Indexer(索引器) 三个组件构成。
Reflector 通过 List 和 Watch K8s server 来获取资源的数据。List 用来在 Controller 重启以及 Watch 中断的情况下,进行系统资源的全量更新;而 Watch 则在多次 List 之间进行增量的资源更新;Reflector 在获取新的资源数据后,会在 Delta 队列中塞入一个包括 资源对象信息本身 以及 资源对象事件类型 的 Delta 记录,Delta 队列中可以保证同一个对象在队列中仅有一条记录,从而避免 Reflector 重新 List 和 Watch 的时候产生重复的记录。
Informer 组件不断地从 Delta 队列中弹出 delta 记录,然后把资源对象交给 indexer,让 indexer 把资源记录在一个缓存中,缓存在默认设置下是用资源的命名空间来做索引的,并且可以被 Controller Manager 或多个 Controller 所共享。之后,再把这个事件交给事件的回调函数
控制循环中的控制器组件主要由事件处理函数以及 worker 组成,事件处理函数之间会相互关注资源的新增、更新、删除的事件,并根据控制器的逻辑去决定是否需要处理。对需要处理的事件,会把事件关联资源的命名空间以及名字塞入一个工作队列中,并且由后续的 worker 池中的一个 Worker 来处理,工作队列会对存储的对象进行去重,从而避免多个 Woker 处理同一个资源的情况。
Worker 在处理资源对象时,一般需要用资源的名字来重新获得最新的资源数据,用来创建或者更新资源对象,或者调用其他的外部服务,Worker 如果处理失败的时候,一般情况下会把资源的名字重新加入到工作队列中,从而方便之后进行重试。
3、控制循环例子-扩容
ReplicaSet 是一个用来描述无状态应用的扩缩容行为的资源, ReplicaSet controler 通过监听 ReplicaSet 资源来维持应用希望的状态数量,ReplicaSet 中通过 selector 来匹配所关联的 Pod,在这里考虑 ReplicaSet rsA 的,replicas 从 2 被改到 3 的场景。
首先,Reflector 会 watch 到 ReplicaSet 和 Pod 两种资源的变化,为什么我们还会 watch pod 资源的变化稍后会讲到。发现 ReplicaSet 发生变化后,在 delta 队列中塞入了对象是 rsA,而且类型是更新的记录。
Informer 一方面把新的 ReplicaSet 更新到缓存中,并与 Namespace nsA 作为索引。另外一方面,调用 Update 的回调函数,ReplicaSet 控制器发现 ReplicaSet 发生变化后会把字符串的 nsA/rsA 字符串塞入到工作队列中,工作队列后的一个 Worker 从工作队列中取到了 nsA/rsA 这个字符串的 key,并且从缓存中取到了最新的 ReplicaSet 数据。
Worker 通过比较 ReplicaSet 中 spec 和 status 里的数值,发现需要对这个 ReplicaSet 进行扩容,因此 ReplicaSet 的 Worker 创建了一个 Pod,这个 pod 中的 OwnerReference 取向了 ReplicaSet rsA。
然后 Reflector Watch 到的 Pod 新增事件,在 delta 队列中额外加入了 Add 类型的 delta 记录,一方面把新的 Pod 记录通过 Indexer 存储到了缓存中,另一方面调用了 ReplicaSet 控制器的 Add 回调函数,Add 回调函数通过检查 pod ownerReferences 找到了对应的 ReplicaSet,并把包括 ReplicaSet 命名空间和字符串塞入到了工作队列中。
ReplicaSet 的 Woker 在得到新的工作项之后,从缓存中取到了新的 ReplicaSet 记录,并得到了其所有创建的 Pod,因为 ReplicaSet 的状态不是最新的,也就是所有创建 Pod 的数量不是最新的。因此在此时 ReplicaSet 更新 status 使得 spec 和 status 达成一致。
4、控制器模式总结
- Kubernetes 所采用的控制器模式,是由声明式 API 驱动的。确切来说,是基于对 Kubernetes 资源对象的修改来驱动的;
- Kubernetes 资源之后,是关注该资源的控制器。这些控制器将异步的控制系统向设置的终态驱近;
- 这些控制器是自主运行的,使得系统的自动化和无人值守成为可能;
- 因为 Kubernetes 的控制器和资源都是可以自定义的,因此可以方便的扩展控制器模式。特别是对于有状态应用,我们往往通过自定义资源和控制器的方式,来自动化运维操作。这个也就是后续会介绍的 operator 的场景。