diff --git a/README.md b/README.md index fd536cf..e23af50 100644 --- a/README.md +++ b/README.md @@ -2,11 +2,11 @@ > :keyboard: 项目同步维护在 [github](https://github.com/dunwu/linux-tutorial) | [gitee](https://gitee.com/turnon/linux-tutorial) > -> :book: [电子书](https://dunwu.github.io/linux-tutorial/) | [电子书(国内)](http://turnon.gitee.io/linux-tutorial/) +> 📖 [电子书](https://dunwu.github.io/linux-tutorial/) | [电子书(国内)](http://turnon.gitee.io/linux-tutorial/) | :wrench: | :shell: | :memo: | :books: | | :-------------------: | :-------------------: | :---------------: | :-------------------: | -| [软件运维](#软件运维) | [运维脚本](#运维脚本) | [知识点](#知识点) | [学习资源](#学习资源) | +| [软件运维](#软件运维) | [运维和脚本](#运维和脚本) | [知识点](#知识点) | [学习资源](#学习资源) | ## 软件运维 @@ -35,7 +35,7 @@ - [Mongodb 运维](docs/linux/soft/mongodb-ops.md) - [Redis 运维](docs/linux/soft/redis-ops.md) -## 运维脚本 +## 运维和脚本 - [系统运维脚本集合](https://github.com/dunwu/linux-tutorial/tree/master/codes/linux/sys) - [软件运维配置脚本集合](https://github.com/dunwu/linux-tutorial/tree/master/codes/linux/soft) @@ -44,6 +44,7 @@ - [Zsh 应用指南](docs/linux/ops/zsh.md) - [Shell 教程](docs/linux/ops/shell.md) - [Python 教程](docs/linux/ops/python.md) +- [Systemd 入门教程](docs/linux/ops/systemd.md) > 提供一键式运维、配置软件脚本 diff --git a/docs/README.md b/docs/README.md index 88ae81f..8b2f574 100644 --- a/docs/README.md +++ b/docs/README.md @@ -2,11 +2,11 @@ > :keyboard: 项目同步维护在 [github](https://github.com/dunwu/linux-tutorial) | [gitee](https://gitee.com/turnon/linux-tutorial) > -> :book: [电子书](https://dunwu.github.io/linux-tutorial/) | [电子书(国内)](http://turnon.gitee.io/linux-tutorial/) +> 📖 [电子书](https://dunwu.github.io/linux-tutorial/) | [电子书(国内)](http://turnon.gitee.io/linux-tutorial/) | :wrench: | :shell: | :memo: | :books: | | :-------------------: | :-------------------: | :---------------: | :-------------------: | -| [软件运维](#软件运维) | [运维脚本](#运维脚本) | [知识点](#知识点) | [学习资源](#学习资源) | +| [软件运维](#软件运维) | [运维和脚本](#运维和脚本) | [知识点](#知识点) | [学习资源](#学习资源) | ## 软件运维 @@ -35,7 +35,7 @@ - [Mongodb 运维](linux/soft/mongodb-ops.md) - [Redis 运维](linux/soft/redis-ops.md) -## 运维脚本 +## 运维和脚本 - [系统运维脚本集合](https://github.com/dunwu/linux-tutorial/tree/master/codes/linux/sys) - [软件运维配置脚本集合](https://github.com/dunwu/linux-tutorial/tree/master/codes/linux/soft) @@ -44,6 +44,7 @@ - [Zsh 应用指南](linux/ops/zsh.md) - [Shell 教程](linux/ops/shell.md) - [Python 教程](linux/ops/python.md) +- [Systemd 入门教程](linux/ops/systemd.md) > 提供一键式运维、配置软件脚本 diff --git a/docs/linux/ops/systemd.md b/docs/linux/ops/systemd.md new file mode 100644 index 0000000..2e05155 --- /dev/null +++ b/docs/linux/ops/systemd.md @@ -0,0 +1,966 @@ +# Systemd 入门教程 + +> 搬运自:[Systemd 入门教程:命令篇](http://www.ruanyifeng.com/blog/2016/03/systemd-tutorial-commands.html)、[Systemd 入门教程:实战篇](hhttp://www.ruanyifeng.com/blog/2016/03/systemd-tutorial-part-two.html) + +Systemd 是 Linux 系统工具,用来启动[守护进程](http://www.ruanyifeng.com/blog/2016/02/linux-daemon.html),已成为大多数发行版的标准配置。 + +本文介绍它的基本用法,分为上下两篇。今天介绍它的主要命令,[下一篇](http://www.ruanyifeng.com/blog/2016/03/systemd-tutorial-part-two.html)介绍如何用于实战。 + +## 由来 + +历史上,[Linux 的启动](http://www.ruanyifeng.com/blog/2013/08/linux_boot_process.html)一直采用[`init`](https://en.wikipedia.org/wiki/Init)进程。 + +下面的命令用来启动服务。 + +```bash +$ sudo /etc/init.d/apache2 start +# 或者 +$ service apache2 start +``` + +这种方法有两个缺点。 + +一是启动时间长。`init`进程是串行启动,只有前一个进程启动完,才会启动下一个进程。 + +二是启动脚本复杂。`init`进程只是执行启动脚本,不管其他事情。脚本需要自己处理各种 +情况,这往往使得脚本变得很长。 + +## Systemd 概述 + +Systemd 就是为了解决这些问题而诞生的。它的设计目标是,为系统的启动和管理提供一套 +完整的解决方案。 + +根据 Linux 惯例,字母`d`是守护进程(daemon)的缩写。 Systemd 这个名字的含义,就 +是它要守护整个系统。 + +使用了 Systemd,就不需要再用`init`了。Systemd 取代了`initd`,成为系统的第一个进 +程(PID 等于 1),其他进程都是它的子进程。 + +```bash +$ systemctl --version +``` + +上面的命令查看 Systemd 的版本。 + +Systemd 的优点是功能强大,使用方便,缺点是体系庞大,非常复杂。事实上,现在还有很 +多人反对使用 Systemd,理由就是它过于复杂,与操作系统的其他部分强耦合,违反"keep +simple, keep stupid" +的[Unix 哲学](http://www.ruanyifeng.com/blog/2009/06/unix_philosophy.html)。 + +![img](http://www.ruanyifeng.com/blogimg/asset/2016/bg2016030703.png) + +(上图为 Systemd 架构图) + +## 系统管理 + +Systemd 并不是一个命令,而是一组命令,涉及到系统管理的方方面面。 + +### systemctl + +`systemctl`是 Systemd 的主命令,用于管理系统。 + +```bash +# 重启系统 +$ sudo systemctl reboot + +# 关闭系统,切断电源 +$ sudo systemctl poweroff + +# CPU停止工作 +$ sudo systemctl halt + +# 暂停系统 +$ sudo systemctl suspend + +# 让系统进入冬眠状态 +$ sudo systemctl hibernate + +# 让系统进入交互式休眠状态 +$ sudo systemctl hybrid-sleep + +# 启动进入救援状态(单用户状态) +$ sudo systemctl rescue +``` + +### systemd-analyze + +`systemd-analyze`命令用于查看启动耗时。 + +```bash +# 查看启动耗时 +$ systemd-analyze + +# 查看每个服务的启动耗时 +$ systemd-analyze blame + +# 显示瀑布状的启动过程流 +$ systemd-analyze critical-chain + +# 显示指定服务的启动流 +$ systemd-analyze critical-chain atd.service +``` + +### hostnamectl + +`hostnamectl`命令用于查看当前主机的信息。 + +```bash +# 显示当前主机的信息 +$ hostnamectl + +# 设置主机名。 +$ sudo hostnamectl set-hostname rhel7 +``` + +### localectl + +`localectl`命令用于查看本地化设置。 + +```bash +# 查看本地化设置 +$ localectl + +# 设置本地化参数。 +$ sudo localectl set-locale LANG=en_GB.utf8 +$ sudo localectl set-keymap en_GB +``` + +### timedatectl + +`timedatectl`命令用于查看当前时区设置。 + +```bash +# 查看当前时区设置 +$ timedatectl + +# 显示所有可用的时区 +$ timedatectl list-timezones + +# 设置当前时区 +$ sudo timedatectl set-timezone America/New_York +$ sudo timedatectl set-time YYYY-MM-DD +$ sudo timedatectl set-time HH:MM:SS +``` + +### loginctl + +`loginctl`命令用于查看当前登录的用户。 + +```bash +# 列出当前session +$ loginctl list-sessions + +# 列出当前登录用户 +$ loginctl list-users + +# 列出显示指定用户的信息 +$ loginctl show-user ruanyf +``` + +## Unit + +### 含义 + +Systemd 可以管理所有系统资源。不同的资源统称为 Unit(单位)。 + +Unit 一共分成 12 种。 + +- Service unit:系统服务 +- Target unit:多个 Unit 构成的一个组 +- Device Unit:硬件设备 +- Mount Unit:文件系统的挂载点 +- Automount Unit:自动挂载点 +- Path Unit:文件或路径 +- Scope Unit:不是由 Systemd 启动的外部进程 +- Slice Unit:进程组 +- Snapshot Unit:Systemd 快照,可以切回某个快照 +- Socket Unit:进程间通信的 socket +- Swap Unit:swap 文件 +- Timer Unit:定时器 + +`systemctl list-units`命令可以查看当前系统的所有 Unit 。 + +```bash +# 列出正在运行的 Unit +$ systemctl list-units + +# 列出所有Unit,包括没有找到配置文件的或者启动失败的 +$ systemctl list-units --all + +# 列出所有没有运行的 Unit +$ systemctl list-units --all --state=inactive + +# 列出所有加载失败的 Unit +$ systemctl list-units --failed + +# 列出所有正在运行的、类型为 service 的 Unit +$ systemctl list-units --type=service +``` + +### Unit 的状态 + +`systemctl status`命令用于查看系统状态和单个 Unit 的状态。 + +```bash +# 显示系统状态 +$ systemctl status + +# 显示单个 Unit 的状态 +$ sysystemctl status bluetooth.service + +# 显示远程主机的某个 Unit 的状态 +$ systemctl -H root@rhel7.example.com status httpd.service +``` + +除了`status`命令,`systemctl`还提供了三个查询状态的简单方法,主要供脚本内部的判 +断语句使用。 + +```bash +# 显示某个 Unit 是否正在运行 +$ systemctl is-active application.service + +# 显示某个 Unit 是否处于启动失败状态 +$ systemctl is-failed application.service + +# 显示某个 Unit 服务是否建立了启动链接 +$ systemctl is-enabled application.service +``` + +### Unit 管理 + +对于用户来说,最常用的是下面这些命令,用于启动和停止 Unit(主要是 service)。 + +```bash +# 立即启动一个服务 +$ sudo systemctl start apache.service + +# 立即停止一个服务 +$ sudo systemctl stop apache.service + +# 重启一个服务 +$ sudo systemctl restart apache.service + +# 杀死一个服务的所有子进程 +$ sudo systemctl kill apache.service + +# 重新加载一个服务的配置文件 +$ sudo systemctl reload apache.service + +# 重载所有修改过的配置文件 +$ sudo systemctl daemon-reload + +# 显示某个 Unit 的所有底层参数 +$ systemctl show httpd.service + +# 显示某个 Unit 的指定属性的值 +$ systemctl show -p CPUShares httpd.service + +# 设置某个 Unit 的指定属性 +$ sudo systemctl set-property httpd.service CPUShares=500 +``` + +### 依赖关系 + +Unit 之间存在依赖关系:A 依赖于 B,就意味着 Systemd 在启动 A 的时候,同时会去启 +动 B。 + +`systemctl list-dependencies`命令列出一个 Unit 的所有依赖。 + +```bash +$ systemctl list-dependencies nginx.service +``` + +上面命令的输出结果之中,有些依赖是 Target 类型(详见下文),默认不会展开显示。如 +果要展开 Target,就需要使用`--all`参数。 + +```bash +$ systemctl list-dependencies --all nginx.service +``` + +## Unit 的配置文件 + +### 概述 + +每一个 Unit 都有一个配置文件,告诉 Systemd 怎么启动这个 Unit 。 + +Systemd 默认从目录`/etc/systemd/system/`读取配置文件。但是,里面存放的大部分文件 +都是符号链接,指向目录`/usr/lib/systemd/system/`,真正的配置文件存放在那个目录。 + +`systemctl enable`命令用于在上面两个目录之间,建立符号链接关系。 + +```bash +$ sudo systemctl enable clamd@scan.service +# 等同于 +$ sudo ln -s '/usr/lib/systemd/system/clamd@scan.service' '/etc/systemd/system/multi-user.target.wants/clamd@scan.service' +``` + +如果配置文件里面设置了开机启动,`systemctl enable`命令相当于激活开机启动。 + +与之对应的,`systemctl disable`命令用于在两个目录之间,撤销符号链接关系,相当于 +撤销开机启动。 + +```bash +$ sudo systemctl disable clamd@scan.service +``` + +配置文件的后缀名,就是该 Unit 的种类,比如`sshd.socket`。如果省略,Systemd 默认 +后缀名为`.service`,所以`sshd`会被理解成`sshd.service`。 + +### 配置文件的状态 + +`systemctl list-unit-files`命令用于列出所有配置文件。 + +```bash +# 列出所有配置文件 +$ systemctl list-unit-files + +# 列出指定类型的配置文件 +$ systemctl list-unit-files --type=service +``` + +这个命令会输出一个列表。 + +```bash +$ systemctl list-unit-files + +UNIT FILE STATE +chronyd.service enabled +clamd@.service static +clamd@scan.service disabled +``` + +这个列表显示每个配置文件的状态,一共有四种。 + +- enabled:已建立启动链接 +- disabled:没建立启动链接 +- static:该配置文件没有`[Install]`部分(无法执行),只能作为其他配置文件的依赖 +- masked:该配置文件被禁止建立启动链接 + +注意,从配置文件的状态无法看出,该 Unit 是否正在运行。这必须执行前面提到 +的`systemctl status`命令。 + +```bash +$ systemctl status bluetooth.service +``` + +一旦修改配置文件,就要让 SystemD 重新加载配置文件,然后重新启动,否则修改不会生 +效。 + +```bash +$ sudo systemctl daemon-reload +$ sudo systemctl restart httpd.service +``` + +### 配置文件的格式 + +配置文件就是普通的文本文件,可以用文本编辑器打开。 + +`systemctl cat`命令可以查看配置文件的内容。 + +```bash +$ systemctl cat atd.service + +[Unit] +Description=ATD daemon + +[Service] +Type=forking +ExecStart=/usr/bin/atd + +[Install] +WantedBy=multi-user.target +``` + +从上面的输出可以看到,配置文件分成几个区块。每个区块的第一行,是用方括号表示的区 +别名,比如`[Unit]`。注意,配置文件的区块名和字段名,都是大小写敏感的。 + +每个区块内部是一些等号连接的键值对。 + +```bash +[Section] +Directive1=value +Directive2=value + +. . . +``` + +注意,键值对的等号两侧不能有空格。 + +### 配置文件的区块 + +`[Unit]`区块通常是配置文件的第一个区块,用来定义 Unit 的元数据,以及配置与其他 +Unit 的关系。它的主要字段如下。 + +- `Description`:简短描述 +- `Documentation`:文档地址 +- `Requires`:当前 Unit 依赖的其他 Unit,如果它们没有运行,当前 Unit 会启动失败 +- `Wants`:与当前 Unit 配合的其他 Unit,如果它们没有运行,当前 Unit 不会启动失败 +- `BindsTo`:与`Requires`类似,它指定的 Unit 如果退出,会导致当前 Unit 停止运行 +- `Before`:如果该字段指定的 Unit 也要启动,那么必须在当前 Unit 之后启动 +- `After`:如果该字段指定的 Unit 也要启动,那么必须在当前 Unit 之前启动 +- `Conflicts`:这里指定的 Unit 不能与当前 Unit 同时运行 +- `Condition...`:当前 Unit 运行必须满足的条件,否则不会运行 +- `Assert...`:当前 Unit 运行必须满足的条件,否则会报启动失败 + +`[Install]`通常是配置文件的最后一个区块,用来定义如何启动,以及是否开机启动。它 +的主要字段如下。 + +- `WantedBy`:它的值是一个或多个 Target,当前 Unit 激活时(enable)符号链接会放 + 入`/etc/systemd/system`目录下面以 Target 名 + `.wants`后缀构成的子目录中 +- `RequiredBy`:它的值是一个或多个 Target,当前 Unit 激活时,符号链接会放 + 入`/etc/systemd/system`目录下面以 Target 名 + `.required`后缀构成的子目录中 +- `Alias`:当前 Unit 可用于启动的别名 +- `Also`:当前 Unit 激活(enable)时,会被同时激活的其他 Unit + +`[Service]`区块用来 Service 的配置,只有 Service 类型的 Unit 才有这个区块。它的 +主要字段如下。 + +- `Type`:定义启动时的进程行为。它有以下几种值。 +- `Type=simple`:默认值,执行`ExecStart`指定的命令,启动主进程 +- `Type=forking`:以 fork 方式从父进程创建子进程,创建后父进程会立即退出 +- `Type=oneshot`:一次性进程,Systemd 会等当前服务退出,再继续往下执行 +- `Type=dbus`:当前服务通过 D-Bus 启动 +- `Type=notify`:当前服务启动完毕,会通知`Systemd`,再继续往下执行 +- `Type=idle`:若有其他任务执行完毕,当前服务才会运行 +- `ExecStart`:启动当前服务的命令 +- `ExecStartPre`:启动当前服务之前执行的命令 +- `ExecStartPost`:启动当前服务之后执行的命令 +- `ExecReload`:重启当前服务时执行的命令 +- `ExecStop`:停止当前服务时执行的命令 +- `ExecStopPost`:停止当其服务之后执行的命令 +- `RestartSec`:自动重启当前服务间隔的秒数 +- `Restart`:定义何种情况 Systemd 会自动重启当前服务,可能的值包括`always`(总是 + 重启)、`on-success`、`on-failure`、`on-abnormal`、`on-abort`、`on-watchdog` +- `TimeoutSec`:定义 Systemd 停止当前服务之前等待的秒数 +- `Environment`:指定环境变量 + +Unit 配置文件的完整字段清单,请参 +考[官方文档](https://www.freedesktop.org/software/systemd/man/systemd.unit.html)。 + +## Target + +启动计算机的时候,需要启动大量的 Unit。如果每一次启动,都要一一写明本次启动需要 +哪些 Unit,显然非常不方便。Systemd 的解决方案就是 Target。 + +简单说,Target 就是一个 Unit 组,包含许多相关的 Unit 。启动某个 Target 的时候 +,Systemd 就会启动里面所有的 Unit。从这个意义上说,Target 这个概念类似于"状态点 +",启动某个 Target 就好比启动到某种状态。 + +传统的`init`启动模式里面,有 RunLevel 的概念,跟 Target 的作用很类似。不同的是 +,RunLevel 是互斥的,不可能多个 RunLevel 同时启动,但是多个 Target 可以同时启动 +。 + +```bash +# 查看当前系统的所有 Target +$ systemctl list-unit-files --type=target + +# 查看一个 Target 包含的所有 Unit +$ systemctl list-dependencies multi-user.target + +# 查看启动时的默认 Target +$ systemctl get-default + +# 设置启动时的默认 Target +$ sudo systemctl set-default multi-user.target + +# 切换 Target 时,默认不关闭前一个 Target 启动的进程, +# systemctl isolate 命令改变这种行为, +# 关闭前一个 Target 里面所有不属于后一个 Target 的进程 +$ sudo systemctl isolate multi-user.target +``` + +Target 与 传统 RunLevel 的对应关系如下。 + +```bash +Traditional runlevel New target name Symbolically linked to... + +Runlevel 0 | runlevel0.target -> poweroff.target +Runlevel 1 | runlevel1.target -> rescue.target +Runlevel 2 | runlevel2.target -> multi-user.target +Runlevel 3 | runlevel3.target -> multi-user.target +Runlevel 4 | runlevel4.target -> multi-user.target +Runlevel 5 | runlevel5.target -> graphical.target +Runlevel 6 | runlevel6.target -> reboot.target +``` + +它与`init`进程的主要差别如下。 + +**(1)默认的 RunLevel**(在`/etc/inittab`文件设置)现在被默认的 Target 取代, +位置是`/etc/systemd/system/default.target`,通常符号链接到`graphical.target`( +图形界面)或者`multi-user.target`(多用户命令行)。 + +**(2)启动脚本的位置**,以前是`/etc/init.d`目录,符号链接到不同的 RunLevel 目 +录 (比如`/etc/rc3.d`、`/etc/rc5.d`等),现在则存放 +在`/lib/systemd/system`和`/etc/systemd/system`目录。 + +**(3)配置文件的位置**,以前`init`进程的配置文件是`/etc/inittab`,各种服务的 +配置文件存放在`/etc/sysconfig`目录。现在的配置文件主要存放在`/lib/systemd`目录 +,在`/etc/systemd`目录里面的修改可以覆盖原始设置。 + +## 日志管理 + +Systemd 统一管理所有 Unit 的启动日志。带来的好处就是,可以只用`journalctl`一个命 +令,查看所有日志(内核日志和应用日志)。日志的配置文件 +是`/etc/systemd/journald.conf`。 + +`journalctl`功能强大,用法非常多。 + +```bash +# 查看所有日志(默认情况下 ,只保存本次启动的日志) +$ sudo journalctl + +# 查看内核日志(不显示应用日志) +$ sudo journalctl -k + +# 查看系统本次启动的日志 +$ sudo journalctl -b +$ sudo journalctl -b -0 + +# 查看上一次启动的日志(需更改设置) +$ sudo journalctl -b -1 + +# 查看指定时间的日志 +$ sudo journalctl --since="2012-10-30 18:17:16" +$ sudo journalctl --since "20 min ago" +$ sudo journalctl --since yesterday +$ sudo journalctl --since "2015-01-10" --until "2015-01-11 03:00" +$ sudo journalctl --since 09:00 --until "1 hour ago" + +# 显示尾部的最新10行日志 +$ sudo journalctl -n + +# 显示尾部指定行数的日志 +$ sudo journalctl -n 20 + +# 实时滚动显示最新日志 +$ sudo journalctl -f + +# 查看指定服务的日志 +$ sudo journalctl /usr/lib/systemd/systemd + +# 查看指定进程的日志 +$ sudo journalctl _PID=1 + +# 查看某个路径的脚本的日志 +$ sudo journalctl /usr/bin/bash + +# 查看指定用户的日志 +$ sudo journalctl _UID=33 --since today + +# 查看某个 Unit 的日志 +$ sudo journalctl -u nginx.service +$ sudo journalctl -u nginx.service --since today + +# 实时滚动显示某个 Unit 的最新日志 +$ sudo journalctl -u nginx.service -f + +# 合并显示多个 Unit 的日志 +$ journalctl -u nginx.service -u php-fpm.service --since today + +# 查看指定优先级(及其以上级别)的日志,共有8级 +# 0: emerg +# 1: alert +# 2: crit +# 3: err +# 4: warning +# 5: notice +# 6: info +# 7: debug +$ sudo journalctl -p err -b + +# 日志默认分页输出,--no-pager 改为正常的标准输出 +$ sudo journalctl --no-pager + +# 以 JSON 格式(单行)输出 +$ sudo journalctl -b -u nginx.service -o json + +# 以 JSON 格式(多行)输出,可读性更好 +$ sudo journalctl -b -u nginx.serviceqq + -o json-pretty + +# 显示日志占据的硬盘空间 +$ sudo journalctl --disk-usage + +# 指定日志文件占据的最大空间 +$ sudo journalctl --vacuum-size=1G + +# 指定日志文件保存多久 +$ sudo journalctl --vacuum-time=1years +``` + +## 实战 + +### 开机启动 + +对于那些支持 Systemd 的软件,安装的时候,会自动在`/usr/lib/systemd/system`目录添 +加一个配置文件。 + +如果你想让该软件开机启动,就执行下面的命令(以`httpd.service`为例)。 + +``` +$ sudo systemctl enable httpd +``` + +上面的命令相当于在`/etc/systemd/system`目录添加一个符号链接,指 +向`/usr/lib/systemd/system`里面的`httpd.service`文件。 + +这是因为开机时,`Systemd`只执行`/etc/systemd/system`目录里面的配置文件。这也意味 +着,如果把修改后的配置文件放在该目录,就可以达到覆盖原始配置的效果。 + +### 启动服务 + +设置开机启动以后,软件并不会立即启动,必须等到下一次开机。如果想现在就运行该软件 +,那么要执行`systemctl start`命令。 + +``` +$ sudo systemctl start httpd +``` + +执行上面的命令以后,有可能启动失败,因此要用`systemctl status`命令查看一下该服务 +的状态。 + +``` +$ sudo systemctl status httpd + +httpd.service - The Apache HTTP Server +Loaded: loaded (/usr/lib/systemd/system/httpd.service; enabled) +Active: active (running) since 金 2014-12-05 12:18:22 JST; 7min ago +Main PID: 4349 (httpd) +Status: "Total requests: 1; Current requests/sec: 0; Current traffic: 0 B/sec" +CGroup: /system.slice/httpd.service + ├─4349 /usr/sbin/httpd -DFOREGROUND + ├─4350 /usr/sbin/httpd -DFOREGROUND + ├─4351 /usr/sbin/httpd -DFOREGROUND + ├─4352 /usr/sbin/httpd -DFOREGROUND + ├─4353 /usr/sbin/httpd -DFOREGROUND + └─4354 /usr/sbin/httpd -DFOREGROUND + +12月 05 12:18:22 localhost.localdomain systemd[1]: Starting The Apache HTTP Server... +12月 05 12:18:22 localhost.localdomain systemd[1]: Started The Apache HTTP Server. +12月 05 12:22:40 localhost.localdomain systemd[1]: Started The Apache HTTP Server. +``` + +上面的输出结果含义如下。 + +- `Loaded`行:配置文件的位置,是否设为开机启动 +- `Active`行:表示正在运行 +- `Main PID`行:主进程 ID +- `Status`行:由应用本身(这里是 httpd )提供的软件当前状态 +- `CGroup`块:应用的所有子进程 +- 日志块:应用的日志 + +### 停止服务 + +终止正在运行的服务,需要执行`systemctl stop`命令。 + +``` +$ sudo systemctl stop httpd.service +``` + +有时候,该命令可能没有响应,服务停不下来。这时候就不得不"杀进程"了,向正在运行的 +进程发出`kill`信号。 + +``` +$ sudo systemctl kill httpd.service +``` + +此外,重启服务要执行`systemctl restart`命令。 + +``` +$ sudo systemctl restart httpd.service +``` + +### 读懂配置文件 + +一个服务怎么启动,完全由它的配置文件决定。下面就来看,配置文件有些什么内容。 + +前面说过,配置文件主要放在`/usr/lib/systemd/system`目录,也可能 +在`/etc/systemd/system`目录。找到配置文件以后,使用文本编辑器打开即可。 + +`systemctl cat`命令可以用来查看配置文件,下面以`sshd.service`文件为例,它的作用 +是启动一个 SSH 服务器,供其他用户以 SSH 方式登录。 + +``` +$ systemctl cat sshd.service + +[Unit] +Description=OpenSSH server daemon +Documentation=man:sshd(8) man:sshd_config(5) +After=network.target sshd-keygen.service +Wants=sshd-keygen.service + +[Service] +EnvironmentFile=/etc/sysconfig/sshd +ExecStart=/usr/sbin/sshd -D $OPTIONS +ExecReload=/bin/kill -HUP $MAINPID +Type=simple +KillMode=process +Restart=on-failure +RestartSec=42s + +[Install] +WantedBy=multi-user.target +``` + +可以看到,配置文件分成几个区块,每个区块包含若干条键值对。 + +下面依次解释每个区块的内容。 + +### [Unit] 区块:启动顺序与依赖关系。 + +`Unit`区块的`Description`字段给出当前服务的简单描述,`Documentation`字段给出文档 +位置。 + +接下来的设置是启动顺序和依赖关系,这个比较重要。 + +> `After`字段:表示如果`network.target`或`sshd-keygen.service`需要启动,那 +> 么`sshd.service`应该在它们之后启动。 + +相应地,还有一个`Before`字段,定义`sshd.service`应该在哪些服务之前启动。 + +注意,`After`和`Before`字段只涉及启动顺序,不涉及依赖关系。 + +举例来说,某 Web 应用需要 postgresql 数据库储存数据。在配置文件中,它只定义要在 +postgresql 之后启动,而没有定义依赖 postgresql 。上线后,由于某种原因 +,postgresql 需要重新启动,在停止服务期间,该 Web 应用就会无法建立数据库连接。 + +设置依赖关系,需要使用`Wants`字段和`Requires`字段。 + +> `Wants`字段:表示`sshd.service`与`sshd-keygen.service`之间存在"弱依赖"关系,即 +> 如果"sshd-keygen.service"启动失败或停止运行,不影响`sshd.service`继续执行。 + +`Requires`字段则表示"强依赖"关系,即如果该服务启动失败或异常退出,那 +么`sshd.service`也必须退出。 + +注意,`Wants`字段与`Requires`字段只涉及依赖关系,与启动顺序无关,默认情况下是同 +时启动的。 + +### [Service] 区块:启动行为 + +`Service`区块定义如何启动当前服务。 + +#### 启动命令 + +许多软件都有自己的环境参数文件,该文件可以用`EnvironmentFile`字段读取。 + +> `EnvironmentFile`字段:指定当前服务的环境参数文件。该文件内部的`key=value`键值 +> 对,可以用`$key`的形式,在当前配置文件中获取。 + +上面的例子中,sshd 的环境参数文件是`/etc/sysconfig/sshd`。 + +配置文件里面最重要的字段是`ExecStart`。 + +> `ExecStart`字段:定义启动进程时执行的命令。 + +上面的例子中,启动`sshd`,执行的命令是`/usr/sbin/sshd -D $OPTIONS`,其中的变 +量`$OPTIONS`就来自`EnvironmentFile`字段指定的环境参数文件。 + +与之作用相似的,还有如下这些字段。 + +- `ExecReload`字段:重启服务时执行的命令 +- `ExecStop`字段:停止服务时执行的命令 +- `ExecStartPre`字段:启动服务之前执行的命令 +- `ExecStartPost`字段:启动服务之后执行的命令 +- `ExecStopPost`字段:停止服务之后执行的命令 + +请看下面的例子。 + +``` +[Service] +ExecStart=/bin/echo execstart1 +ExecStart= +ExecStart=/bin/echo execstart2 +ExecStartPost=/bin/echo post1 +ExecStartPost=/bin/echo post2 +``` + +上面这个配置文件,第二行`ExecStart`设为空值,等于取消了第一行的设置,运行结果如 +下。 + +``` +execstart2 +post1 +post2 +``` + +所有的启动设置之前,都可以加上一个连词号(`-`),表示"抑制错误",即发生错误的时 +候,不影响其他命令的执行。比如,`EnvironmentFile=-/etc/sysconfig/sshd`(注意等号 +后面的那个连词号),就表示即使`/etc/sysconfig/sshd`文件不存在,也不会抛出错误。 + +#### 启动类型 + +`Type`字段定义启动类型。它可以设置的值如下。 + +- simple(默认值):`ExecStart`字段启动的进程为主进程 +- forking:`ExecStart`字段将以`fork()`方式启动,此时父进程将会退出,子进程将成 +为主进程 +- oneshot:类似于`simple`,但只执行一次,Systemd 会等它执行完,才启动其他服务 +- dbus:类似于`simple`,但会等待 D-Bus 信号后启动 +- notify:类似于`simple`,启动结束后会发出通知信号,然后 Systemd 再启动其他服 +务 +- idle:类似于`simple`,但是要等到其他任务都执行完,才会启动该服务。一种使用场 +合是为让该服务的输出,不与其他服务的输出相混合 + +下面是一个`oneshot`的例子,笔记本电脑启动时,要把触摸板关掉,配置文件可以这样写 +。 + +``` +[Unit] +Description=Switch-off Touchpad + +[Service] +Type=oneshot +ExecStart=/usr/bin/touchpad-off + +[Install] +WantedBy=multi-user.target +``` + +上面的配置文件,启动类型设为`oneshot`,就表明这个服务只要运行一次就够了,不需要 +长期运行。 + +如果关闭以后,将来某个时候还想打开,配置文件修改如下。 + +``` +[Unit] +Description=Switch-off Touchpad + +[Service] +Type=oneshot +ExecStart=/usr/bin/touchpad-off start +ExecStop=/usr/bin/touchpad-off stop +RemainAfterExit=yes + +[Install] +WantedBy=multi-user.target +``` + +上面配置文件中,`RemainAfterExit`字段设为`yes`,表示进程退出以后,服务仍然保持执 +行。这样的话,一旦使用`systemctl stop`命令停止服务,`ExecStop`指定的命令就会执行 +,从而重新开启触摸板。 + +#### 重启行为 + +`Service`区块有一些字段,定义了重启行为。 + +> `KillMode`字段:定义 Systemd 如何停止 sshd 服务。 + +上面这个例子中,将`KillMode`设为`process`,表示只停止主进程,不停止任何 sshd 子 +进程,即子进程打开的 SSH session 仍然保持连接。这个设置不太常见,但对 sshd 很重 +要,否则你停止服务的时候,会连自己打开的 SSH session 一起杀掉。 + +`KillMode`字段可以设置的值如下。 + +- control-group(默认值):当前控制组里面的所有子进程,都会被杀掉 +- process:只杀主进程 +- mixed:主进程将收到 SIGTERM 信号,子进程收到 SIGKILL 信号 +- none:没有进程会被杀掉,只是执行服务的 stop 命令。 + +接下来是`Restart`字段。 + +> `Restart`字段:定义了 sshd 退出后,Systemd 的重启方式。 + +上面的例子中,`Restart`设为`on-failure`,表示任何意外的失败,就将重启 sshd。如果 +sshd 正常停止(比如执行`systemctl stop`命令),它就不会重启。 + +`Restart`字段可以设置的值如下。 + +- no(默认值):退出后不会重启 +- on-success:只有正常退出时(退出状态码为 0),才会重启 +- on-failure:非正常退出时(退出状态码非 0),包括被信号终止和超时,才会重启 +- on-abnormal:只有被信号终止和超时,才会重启 +- on-abort:只有在收到没有捕捉到的信号终止时,才会重启 +- on-watchdog:超时退出,才会重启 +- always:不管是什么退出原因,总是重启 + +对于守护进程,推荐设为`on-failure`。对于那些允许发生错误退出的服务,可以设 +为`on-abnormal`。 + +最后是`RestartSec`字段。 + +> `RestartSec`字段:表示 Systemd 重启服务之前,需要等待的秒数。上面的例子设为等 +> 待 42 秒。 + +### [Install] 区块 + +`Install`区块,定义如何安装这个配置文件,即怎样做到开机启动。 + +`WantedBy`字段:表示该服务所在的 Target。 + +`Target`的含义是服务组,表示一组服务。`WantedBy=multi-user.target`指的是,sshd +所在的 Target 是`multi-user.target`。 + +这个设置非常重要,因为执行`systemctl enable sshd.service`命令时 +,`sshd.service`的一个符号链接,就会放在`/etc/systemd/system`目录下面 +的`multi-user.target.wants`子目录之中。 + +Systemd 有默认的启动 Target。 + +``` +$ systemctl get-default +multi-user.target +``` + +上面的结果表示,默认的启动 Target 是`multi-user.target`。在这个组里的所有服务, +都将开机启动。这就是为什么`systemctl enable`命令能设置开机启动的原因。 + +使用 Target 的时候,`systemctl list-dependencies`命令和`systemctl isolate`命令也 +很有用。 + +``` +# 查看 multi-user.target 包含的所有服务 +$ systemctl list-dependencies multi-user.target + +# 切换到另一个 target +# shutdown.target 就是关机状态 +$ sudo systemctl isolate shutdown.target +``` + +一般来说,常用的 Target 有两个:一个是`multi-user.target`,表示多用户命令行状态 +;另一个是`graphical.target`,表示图形用户状态,它依赖于`multi-user.target`。官 +方文档有一张非常清晰的 +[Target 依赖关系图](https://www.freedesktop.org/software/systemd/man/bootup.html#System%20Manager%20Bootup)。 + +### Target 的配置文件 + +Target 也有自己的配置文件。 + +``` +$ systemctl cat multi-user.target + +[Unit] +Description=Multi-User System +Documentation=man:systemd.special(7) +Requires=basic.target +Conflicts=rescue.service rescue.target +After=basic.target rescue.service rescue.target +AllowIsolate=yes +``` + +注意,Target 配置文件里面没有启动命令。 + +上面输出结果中,主要字段含义如下。 + +- `Requires`字段:要求`basic.target`一起运行。 +- `Conflicts`字段:冲突字段。如果`rescue.service`或`rescue.target`正在运行 + ,`multi-user.target`就不能运行,反之亦然。 +- `After`:表示`multi-user.target`在`basic.target` 、 `rescue.service`、 + `rescue.target`之后启动,如果它们有启动的话。 +- `AllowIsolate`:允许使用`systemctl isolate`命令切换到`multi-user.target`。 + +### 修改配置文件后重启 + +修改配置文件以后,需要重新加载配置文件,然后重新启动相关服务。 + +``` +# 重新加载配置文件 +$ sudo systemctl daemon-reload + +# 重启相关服务 +$ sudo systemctl restart foobar +``` + +## 参考资料 + +- [Systemd 入门教程:命令篇](http://www.ruanyifeng.com/blog/2016/03/systemd-tutorial-commands.html) +- [Systemd 入门教程:实战篇](hhttp://www.ruanyifeng.com/blog/2016/03/systemd-tutorial-part-two.html) diff --git a/docs/linux/soft/mysql-ops.md b/docs/linux/soft/mysql-ops.md index f454836..d4d4821 100644 --- a/docs/linux/soft/mysql-ops.md +++ b/docs/linux/soft/mysql-ops.md @@ -490,4 +490,4 @@ Query OK, 0 rows affected (0.00 sec) ## :door: 传送门 -| [技术文档归档](https://github.com/dunwu/blog) | [数据库教程系列](https://github.com/dunwu/db-tutorial/codes) | +| [我的 Github 博客](https://github.com/dunwu/blog) | [db-tutorial 首页](https://github.com/dunwu/db-tutorial) | diff --git a/docs/linux/soft/redis-ops.md b/docs/linux/soft/redis-ops.md index c331ad5..dec2e90 100644 --- a/docs/linux/soft/redis-ops.md +++ b/docs/linux/soft/redis-ops.md @@ -1,18 +1,31 @@ -# Redis 安装 +# Redis 运维 > **Redis** 是一个高性能的 key-value 数据库。 > > SET 操作每秒钟 110000 次;GET 操作每秒钟 81000 次。 - + - [安装](#安装) - [Window 下安装](#window-下安装) - [Linux 下安装](#linux-下安装) - [Ubuntu 下安装](#ubuntu-下安装) - - [启动 Redis](#启动-redis) - - [查看 redis 是否启动?](#查看-redis-是否启动) + - [开机启动](#开机启动) + - [开放防火墙端口](#开放防火墙端口) +- [Redis 使用和配置](#redis-使用和配置) + - [启动](#启动) + - [常见配置](#常见配置) + - [设为守护进程](#设为守护进程) + - [远程访问](#远程访问) + - [设置密码](#设置密码) +- [Redis 集群使用和配置](#redis-集群使用和配置) + - [集群规划](#集群规划) + - [部署](#部署) +- [Redis 命令](#redis-命令) +- [压力测试](#压力测试) +- [客户端](#客户端) - [脚本](#脚本) +- [参考资料](#参考资料) @@ -26,51 +39,37 @@ Redis 支持 32 位和 64 位。这个需要根据你系统平台的实际情况 打开一个 **cmd** 窗口 使用 cd 命令切换目录到 **C:\redis** 运行 **redis-server.exe redis.windows.conf** 。 -如果想方便的话,可以把 redis 的路径加到系统的环境变量里,这样就省得再输路径了,后面的那个 redis.windows.conf 可以省略,如果省略,会启用默认的。输入之后,会显示如下界面: +如果想方便的话,可以把 redis 的路径加到系统的环境变量里,这样就省得再输路径了,后面的那个 redis.windows.conf 可以省略,如果省略,会启用默认的。 这时候另启一个 cmd 窗口,原来的不要关闭,不然就无法访问服务端了。 切换到 redis 目录下运行 **redis-cli.exe -h 127.0.0.1 -p 6379** 。 -设置键值对 **set myKey abc** - -取出键值对 **get myKey** - ### Linux 下安装 **下载地址:** http://redis.io/download,下载最新文档版本。 -本教程使用的最新文档版本为 2.8.17,下载并安装: +下载、解压、编译 Redis ``` -$ wget -O /opt/redis/redis-4.0.8.tar.gz http://download.redis.io/releases/redis-4.0.8.tar.gz -$ cd /opt/redis -$ tar zxvf redis-4.0.8.tar.gz +$ wget http://download.redis.io/releases/redis-5.0.4.tar.gz +$ tar xzf redis-5.0.4.tar.gz +$ cd redis-5.0.4 +$ make ``` -make 完后 redis-2.8.17 目录下会出现编译后的 redis 服务程序 redis-server,还有用于测试的客户端程序 redis-cli,两个程序位于安装目录 src 目录下: +为了编译 Redis 源码,你需要 gcc-c++和 tcl。如果你的系统是 CentOS,可以直接执行命令:`yum install -y gcc-c++ tcl` 来安装。 -下面启动 redis 服务. +进入到解压后的 `src` 目录,通过如下命令启动 Redis: ``` -$ cd src -$ ./redis-server +$ src/redis-server ``` -注意这种方式启动 redis 使用的是默认配置。也可以通过启动参数告诉 redis 使用指定配置文件使用下面命令启动。 +您可以使用内置的客户端与 Redis 进行交互: ``` -$ cd src -$ ./redis-server redis.conf -``` - -redis.conf 是一个默认的配置文件。我们可以根据需要使用自己的配置文件。 - -启动 redis 服务进程后,就可以使用测试客户端程序 redis-cli 和 redis 服务交互了。 比如: - -``` -$ cd src -$ ./redis-cli +$ src/redis-cli redis> set foo bar OK redis> get foo @@ -86,23 +85,35 @@ $sudo apt-get update $sudo apt-get install redis-server ``` -### 启动 Redis +### 开机启动 + +- 开机启动配置:`echo "/usr/local/bin/redis-server /etc/redis.conf" >> /etc/rc.local` + +### 开放防火墙端口 + +- 添加规则:`iptables -I INPUT -p tcp -m tcp --dport 6379 -j ACCEPT` +- 保存规则:`service iptables save` +- 重启 iptables:`service iptables restart` + +## Redis 使用和配置 + +### 启动 **启动 redis 服务** ``` -cd /opt/redis/redis-4.0.8/src +cd /opt/redis/redis-5.0.4/src ./redis-server ``` **启动 redis 客户端** ``` -cd /opt/redis/redis-4.0.8/src +cd /opt/redis/redis-5.0.4/src ./redis-cli ``` -### 查看 redis 是否启动? +**查看 redis 是否启动** ``` $ redis-cli @@ -121,10 +132,127 @@ redis 127.0.0.1:6379> ping PONG ``` -以上说明我们已经成功安装了 redis。 +以上说明我们已经成功启动了 redis。 + +### 常见配置 + +> Redis 默认的配置文件是根目录下的 `redis.conf` 文件。 +> +> 如果需要指定特定文件作为配置文件,需要使用命令: `./redis-server -c xxx.conf` +> +> 每次修改配置后,需要重启才能生效。 +> +> Redis 官方默认配置: +> +> - 自描述文档 [redis.conf for Redis 2.8](https://raw.githubusercontent.com/antirez/redis/2.8/redis.conf) +> - 自描述文档 [redis.conf for Redis 2.6](https://raw.githubusercontent.com/antirez/redis/2.6/redis.conf). +> - 自描述文档 [redis.conf for Redis 2.4](https://raw.githubusercontent.com/antirez/redis/2.4/redis.conf). +> +> 自 Redis2.6 起就可以直接通过命令行传递 Redis 配置参数。这种方法可以用于测试。自 Redis2.6 起就可以直接通过命令行传递 Redis 配置参数。这种方法可以用于测试。 + +### 设为守护进程 + +Redis 默认以非守护进程方式启动,而通常我们会将 Redis 设为守护进程启动方式,配置:`daemonize yes` + +#### 远程访问 + +Redis 默认绑定 127.0.0.1,这样就只能本机才能访问,若要 Redis 允许远程访问,需要配置:`bind 0.0.0.0` + +#### 设置密码 + +Redis 默认访问不需要密码,如果需要设置密码,需要如下配置: + +- `protected-mode yes` +- `requirepass <密码>` + +## Redis 集群使用和配置 + +Redis 3.0 后支持集群模式。 + +### 集群规划 + +`Redis` 集群一般由 **多个节点** 组成,节点数量至少为 `6` 个,才能保证组成 **完整高可用** 的集群。 + +
+ +理想情况当然是所有节点各自在不同的机器上,首先于资源,本人在部署 Redis 集群时,只得到 3 台服务器。所以,我的基本规划是满足两个条件: + +- 每台服务器上部署一个主节点、一个从节点。 +- 每个主节点所对应的从节点,必须在另外一台服务器上。 + +
+ +> 为集群内 **所有节点** 统一目录,一般划分三个目录:`conf`、`data`、`log`,分别存放 **配置**、**数据** 和 **日志** 相关文件。把 `6` 个节点配置统一放在 `conf` 目录下。 + +### 部署 + +Redis 集群节点的安装与单节点服务相同,差异仅在于部署方式。 + +假设三台服务器地址如下: + +- 服务 A:127.0.0.1 +- 服务 B:127.0.0.2 +- 服务 C:127.0.0.3 + +分配如下: + +| 服务器 | 127.0.0.1 | 127.0.0.2 | 127.0.0.3 | +| ------ | -------------- | -------------- | -------------- | +| 主节点 | 127.0.0.1:6380 | 127.0.0.2:6381 | 127.0.0.3:6382 | +| 从节点 | 127.0.0.1:6382 | 127.0.0.2:6380 | 127.0.0.3:6381 | + +## Redis 命令 + +> 命令详细用法,请参考 [**Redis 命令官方文档**](https://redis.io/commands) +> +> 搬迁两张 cheat sheet 图,原址:https://www.cheatography.com/tasjaevan/cheat-sheets/redis/ + +
+ +
+ +## 压力测试 + +> 参考官方文档:[How fast is Redis?](https://redis.io/topics/benchmarks) + +Redis 自带了一个性能测试工具:`redis-benchmark` + +**(1)基本测试** + +``` +$ redis-benchmark -q -n 100000 +``` + +- `-q` 表示静默(quiet)执行 +- `-n 100000` 请求 10 万次 + +**(2)测试指定读写指令** + +``` +$ redis-benchmark -t set,lpush -n 100000 -q +SET: 74239.05 requests per second +LPUSH: 79239.30 requests per second +``` + +**(3)测试 pipeline 模式下指定读写指令** + +``` +redis-benchmark -n 1000000 -t set,get -P 16 -q +SET: 403063.28 requests per second +GET: 508388.41 requests per second +``` + +## 客户端 + +推荐使用 [**RedisDesktopManager**](https://github.com/uglide/RedisDesktopManager) ## 脚本 以上两种安装方式,我都写了脚本去执行: | [安装脚本](https://github.com/dunwu/linux-tutorial/tree/master/codes/linux/soft) | + +## 参考资料 + +- [Redis 官方文档](https://redis.io) +- [深入剖析 Redis 系列(三) - Redis 集群模式搭建与原理详解](https://juejin.im/post/5b8fc5536fb9a05d2d01fb11)