在 Linux 启动过程 中我们介绍了 Linux 启动中关键的一步:Init 进程启动系统。作为操作系统的 1 号进程,Init 是一个由内核启动的用户级进程,完成系统引导。早期 Linux 系统的 Init 进程是著名的 SysV Init
,然而由于 SysVInit 进程是串行启动用户程序,启动时间长,而且启动事件复杂,已经慢慢开始退出历史舞台。目前广泛被各大 Linux 发行版采用的 Init 进程是 Systemd。Systemd 作为系统启动和管理的一整套解决方案,取代了 initd
,成为系统的 1 号进程,其他的进程都是其子进程,本文将介绍 Systemd 的设计与使用。
系统管理
Systemd 并不是一个命令,而是一组命令,涉及到系统管理的方方面面。
systemctl
systemctl
是 Systemd 的主命令,用于管理系统。
1 | # 重启系统 |
systemd-analyze
systemd-analyze
命令用于查看启动耗时。
1 | # 查看启动耗时 |
hostnamectl
hostnamectl
命令用于查看当前主机的信息。
1 | # 显示当前主机的信息 |
localectl
localectl
命令用于查看本地化设置。
1 | # 查看本地化设置 |
timedatectl
timedatectl
命令用于查看当前时区设置。
1 | # 查看当前时区设置 |
loginctl
loginctl
命令用于查看当前登录的用户。
1 | # 列出当前session |
关键概念
Unit
Systemd 可以管理所有系统资源,不同的资源统称为 Unit(单位),Unit 一共分成12种。
- Service unit:系统服务
- Target unit:多个 Unit 构成的一个组
- Device Unit:硬件设备
- Mount Unit:文件系统的挂载点
- Automount Unit:自动挂载点
- Path Unit:文件或路径
- Scope Unit:不是由 Systemd 启动的外部进程
- Slice Unit:进程组
- Snapshot Unit:Systemd 快照,可以切回某个快照
- Socket Unit:进程间通信的 socket
- Swap Unit:swap 文件
- Timer Unit:定时器
systemctl list-units
命令可以查看当前系统的所有 Unit 。
1 | # 列出正在运行的 Unit |
Unit 状态
systemctl status
命令用于查看系统状态和单个 Unit 的状态。
1 | # 显示系统状态 |
除了status
命令,systemctl
还提供了三个查询状态的简单方法,主要供脚本内部的判断语句使用。
1 | # 显示某个 Unit 是否正在运行 |
Unit 管理
对于用户来说,最常用的是下面这些命令,用于启动和停止 Unit(主要是 service)。
1 | # 立即启动一个服务 |
依赖关系
Unit 之间存在依赖关系:A 依赖于 B,就意味着 Systemd 在启动 A 的时候,同时会去启动 B。systemctl list-dependencies
命令列出一个 Unit 的所有依赖。
1 | $ systemctl list-dependencies kubelet.service |
上面命令的输出结果之中,有些依赖是 Target 类型,默认不会展开显示。如果要展开 Target,就需要使用--all
参数。
1 | $ systemctl list-dependencies --all kubelet.service |
Target
启动计算机的时候,需要启动大量的 Unit。如果每一次启动,都要一一写明本次启动需要哪些 Unit,显然非常不方便,Systemd 的解决方案就是 Target。
简单说,Target 就是一个 Unit 组,包含许多相关的 Unit 。启动某个 Target 的时候,Systemd 就会启动里面所有的 Unit。从这个意义上说,Target 这个概念类似于 状态点
,启动某个 Target 就好比启动到某种状态。传统的init
启动模式里面,有 RunLevel 的概念,跟 Target 的作用很类似。不同的是,RunLevel 是互斥的,不可能多个 RunLevel 同时启动,但是多个 Target 可以同时启动。
1 | # 查看当前系统的所有 Target |
Target 与 传统 RunLevel 的对应关系如下。
1 | Traditional runlevel New target name Symbolically linked to... |
它与init
进程的主要差别如下。
- 默认的 RunLevel(在
/etc/inittab
文件设置)现在被默认的 Target 取代,位置是/etc/systemd/system/default.target
,通常符号链接到graphical.target
(图形界面)或者multi-user.target
(多用户命令行)。 - 启动脚本的位置,以前是
/etc/init.d
目录,符号链接到不同的 RunLevel 目录 (比如/etc/rc3.d
、/etc/rc5.d
等),现在则存放在/lib/systemd/system
和/etc/systemd/system
目录。 - 配置文件的位置,以前
init
进程的配置文件是/etc/inittab
,各种服务的配置文件存放在/etc/sysconfig
目录。现在的配置文件主要存放在/lib/systemd
目录,在/etc/systemd
目录里面的修改可以覆盖原始设置。
日志管理
Systemd 统一管理所有 Unit 的启动日志。带来的好处就是,可以只用journalctl
一个命令,查看所有日志(内核日志和应用日志)。日志的配置文件是/etc/systemd/journald.conf
。
journalctl
功能强大,用法非常多。
1 | # 查看所有日志(默认情况下 ,只保存本次启动的日志) |
配置管理
每一个 Unit 都有一个配置文件,告诉 Systemd 怎么启动这个 Unit 。
Systemd 默认从目录/etc/systemd/system/
读取配置文件。但是,里面存放的大部分文件都是符号链接,指向目录/usr/lib/systemd/system/
,真正的配置文件存放在那个目录。
systemctl enable
命令用于在上面两个目录之间,建立符号链接关系。
1 | $ sudo systemctl enable clamd@scan.service |
如果配置文件里面设置了开机启动,systemctl enable
命令相当于激活开机启动。
与之对应的,systemctl disable
命令用于在两个目录之间,撤销符号链接关系,相当于撤销开机启动。
1 | $ sudo systemctl disable clamd@scan.service |
配置文件的后缀名,就是该 Unit 的种类,比如sshd.socket
。如果省略,Systemd 默认后缀名为.service
,所以sshd
会被理解成sshd.service
。
配置文件的状态
systemctl list-unit-files
命令用于列出所有配置文件。
1 | # 列出所有配置文件 |
这个命令会输出一个列表。
1 | $ systemctl list-unit-files |
这个列表显示每个配置文件的状态,一共有四种。
- enabled:已建立启动链接
- disabled:没建立启动链接
- static:该配置文件没有
[Install]
部分(无法执行),只能作为其他配置文件的依赖 - masked:该配置文件被禁止建立启动链接
注意,从配置文件的状态无法看出,该 Unit 是否正在运行。这必须执行前面提到的systemctl status
命令。
1 | $ systemctl status bluetooth.service |
一旦修改配置文件,就要让 SystemD 重新加载配置文件,然后重新启动,否则修改不会生效。
1 | $ sudo systemctl daemon-reload |
配置文件的格式
配置文件就是普通的文本文件,可以用文本编辑器打开。systemctl cat
命令可以查看配置文件的内容。
1 | $ systemctl cat kubelet.service |
从上面的输出可以看到,配置文件分成几个区块。每个区块的第一行,是用方括号表示的区别名,比如[Unit]
。注意,配置文件的区块名和字段名,都是大小写敏感的。每个区块内部是一些等号连接的键值对。
1 | [Section] |
注意,键值对的等号两侧不能有空格。
配置文件的区块
Unit 区块
[Unit]
区块通常是配置文件的第一个区块,用来定义 Unit 的元数据,以及配置与其他 Unit 的关系。它的主要字段如下。
Description
:简短描述Documentation
:文档地址Requires
:当前 Unit 依赖的其他 Unit,如果它们没有运行,当前 Unit 会启动失败Wants
:与当前 Unit 配合的其他 Unit,如果它们没有运行,当前 Unit 不会启动失败,弱依赖BindsTo
:与Requires
类似,它指定的 Unit 如果退出,会导致当前 Unit 停止运行,强依赖Before
:如果该字段指定的 Unit 也要启动,那么必须在当前 Unit 之后启动After
:如果该字段指定的 Unit 也要启动,那么必须在当前 Unit 之前启动Conflicts
:这里指定的 Unit 不能与当前 Unit 同时运行Condition...
:当前 Unit 运行必须满足的条件,否则不会运行Assert...
:当前 Unit 运行必须满足的条件,否则会报启动失败
注意,
Wants
字段与Requires
字段只涉及依赖关系,与启动顺序无关,默认情况下是同时启动的。注意,
After
和Before
字段只涉及启动顺序,不涉及依赖关系。
Install 区块
[Install]
通常是配置文件的最后一个区块,用来定义如何启动,以及是否开机启动,它的主要字段如下。
WantedBy
:它的值是一个或多个 Target,当前 Unit 激活时(enable)符号链接会放入/etc/systemd/system
目录下面以 Target 名 +.wants
后缀构成的子目录中。Target
的含义是服务组,表示一组服务。WantedBy=multi-user.target
指的是,sshd 所在的 Target 是multi-user.target
。这个设置非常重要,因为执行systemctl enable sshd.service
命令时,sshd.service
的一个符号链接,就会放在/etc/systemd/system
目录下面的multi-user.target.wants
子目录之中。RequiredBy
:它的值是一个或多个 Target,当前 Unit 激活时,符号链接会放入/etc/systemd/system
目录下面以 Target 名 +.required
后缀构成的子目录中Alias
:当前 Unit 可用于启动的别名Also
:当前 Unit 激活(enable)时,会被同时激活的其他 Unit
上面的结果表示,默认的启动 Target 是multi-user.target
。在这个组里的所有服务,都将开机启动。这就是为什么systemctl enable
命令能设置开机启动的原因。使用 Target 的时候,systemctl list-dependencies
命令和systemctl isolate
命令也很有用。
1 | # 查看 multi-user.target 包含的所有服务 |
一般来说,常用的 Target 有两个:一个是multi-user.target
,表示多用户命令行状态;另一个是graphical.target
,表示图形用户状态,它依赖于multi-user.target
。官方文档有一张非常清晰的 Target 依赖关系图。
Service 区块
[Service]
区块用来 Service 的配置,只有 Service 类型的 Unit 才有这个区块。它的主要字段如下。
启动命令
EnvironmentFile
:指定当前服务的环境参数文件。该文件内部的key=value
键值对,可以用$key
的形式,在当前配置文件中获取。Environment
:指定环境变量ExecStart
:定义启动进程时执行的命令。ExecStartPre
:启动当前服务之前执行的命令ExecStartPost
:启动当前服务之后执行的命令ExecReload
:重启当前服务时执行的命令ExecStop
:停止当前服务时执行的命令ExecStopPost
:停止当其服务之后执行的命令TimeoutSec
:定义 Systemd 停止当前服务之前等待的秒数
上面的例子中,启动sshd
,执行的命令是/usr/sbin/sshd -D $OPTIONS
,其中的变量$OPTIONS
就来自EnvironmentFile
字段指定的环境参数文件。
请看下面的例子:
1 | [Service] |
上面这个配置文件,第二行ExecStart
设为空值,等于取消了第一行的设置,运行结果如下。
1 | execstart2 |
所有的启动设置之前,都可以加上一个连词号(-
),表示”抑制错误”,即发生错误的时候,不影响其他命令的执行。比如,EnvironmentFile=-/etc/sysconfig/sshd
(注意等号后面的那个连词号),就表示即使/etc/sysconfig/sshd
文件不存在,也不会抛出错误。
启动类型
Type
字段定义启动类型,它可以设置的值如下。
Type=simple
:默认值,执行ExecStart
指定的命令,启动主进程Type=forking
:以 fork 方式从父进程创建子进程,创建后父进程会立即退出Type=oneshot
:一次性进程,Systemd 会等当前服务退出,再继续往下执行Type=dbus
:当前服务通过D-Bus启动Type=notify
:当前服务启动完毕,会通知Systemd
,再继续往下执行Type=idle
:若有其他任务执行完毕,当前服务才会运行
下面是一个oneshot
的例子,笔记本电脑启动时,要把触摸板关掉,配置文件可以这样写。
1 | [Unit] |
上面的配置文件,启动类型设为oneshot
,就表明这个服务只要运行一次就够了,不需要长期运行。
如果关闭以后,将来某个时候还想打开,配置文件修改如下。
1 | [Unit] |
上面配置文件中,RemainAfterExit
字段设为yes
,表示进程退出以后,服务仍然保持执行。这样的话,一旦使用systemctl stop
命令停止服务,ExecStop
指定的命令就会执行,从而重新开启触摸板。
重启行为
Service
区块有一些字段,定义了重启行为。
KillMode
字段:定义 Systemd 如何停止 sshd 服务。
上面这个例子中,将KillMode
设为process
,表示只停止主进程,不停止任何sshd 子进程,即子进程打开的 SSH session 仍然保持连接。这个设置不太常见,但对 sshd 很重要,否则你停止服务的时候,会连自己打开的 SSH session 一起杀掉。
KillMode
字段可以设置的值如下。
- control-group(默认值):当前控制组里面的所有子进程,都会被杀掉
- process:只杀主进程
- mixed:主进程将收到 SIGTERM 信号,子进程收到 SIGKILL 信号
- none:没有进程会被杀掉,只是执行服务的 stop 命令。
接下来是Restart
字段。
Restart
字段:定义了 sshd 退出后,Systemd 的重启方式。
上面的例子中,Restart
设为on-failure
,表示任何意外的失败,就将重启sshd。如果 sshd 正常停止(比如执行systemctl stop
命令),它就不会重启。
Restart
字段可以设置的值如下。
- no(默认值):退出后不会重启
- on-success:只有正常退出时(退出状态码为0),才会重启
- on-failure:非正常退出时(退出状态码非0),包括被信号终止和超时,才会重启
- on-abnormal:只有被信号终止和超时,才会重启
- on-abort:只有在收到没有捕捉到的信号终止时,才会重启
- on-watchdog:超时退出,才会重启
- always:不管是什么退出原因,总是重启
对于守护进程,推荐设为on-failure
。对于那些允许发生错误退出的服务,可以设为on-abnormal
。
最后是RestartSec
字段。
RestartSec
字段:表示 Systemd 重启服务之前,需要等待的秒数。上面的例子设为等待42秒。
Target 的配置文件
Target 也有自己的配置文件。
1 | $ systemctl cat multi-user.target |
注意,Target 配置文件里面没有启动命令。
上面输出结果中,主要字段含义如下。
Requires
字段:要求basic.target
一起运行。Conflicts
字段:冲突字段。如果rescue.service
或rescue.target
正在运行,multi-user.target
就不能运行,反之亦然。After
:表示multi-user.target
在basic.target
、rescue.service
、rescue.target
之后启动,如果它们有启动的话。AllowIsolate
:允许使用systemctl isolate
命令切换到multi-user.target
。
修改配置文件后重启
修改配置文件以后,需要重新加载配置文件,然后重新启动相关服务。
1 | # 重新加载配置文件 |
功能实战
开机启动
对于那些支持 Systemd 的软件,安装的时候,会自动在/usr/lib/systemd/system
目录添加一个配置文件。
如果你想让该软件开机启动,就执行下面的命令(以httpd.service
为例)。
1 | $ sudo systemctl enable httpd |
上面的命令相当于在/etc/systemd/system
目录添加一个符号链接,指向/usr/lib/systemd/system
里面的httpd.service
文件。
这是因为开机时,Systemd
只执行/etc/systemd/system
目录里面的配置文件。这也意味着,如果把修改后的配置文件放在该目录,就可以达到覆盖原始配置的效果。
启动服务
设置开机启动以后,软件并不会立即启动,必须等到下一次开机。如果想现在就运行该软件,那么要执行systemctl start
命令。
1 | $ sudo systemctl start httpd |
执行上面的命令以后,有可能启动失败,因此要用systemctl status
命令查看一下该服务的状态。
1 | $ sudo systemctl status httpd |
上面的输出结果含义如下。
Loaded
行:配置文件的位置,是否设为开机启动Active
行:表示正在运行Main PID
行:主进程IDStatus
行:由应用本身(这里是 httpd )提供的软件当前状态CGroup
块:应用的所有子进程- 日志块:应用的日志
停止服务
终止正在运行的服务,需要执行systemctl stop
命令。
1 | $ sudo systemctl stop httpd.service |
有时候,该命令可能没有响应,服务停不下来。这时候就不得不”杀进程”了,向正在运行的进程发出kill
信号。
1 | $ sudo systemctl kill httpd.service |
此外,重启服务要执行systemctl restart
命令。
1 | $ sudo systemctl restart httpd.service |
社区争议
Systemd 的优点是功能强大,使用方便,缺点是体系庞大,非常复杂。事实上,现在还有很多人反对使用 Systemd,理由就是它过于复杂,与操作系统的其他部分强耦合,违反 keep simple, keep stupid
的 Unix 哲学。