Linux

2020-03-08

操作系统

字数统计: 7.8k字 | 阅读时长≈ 30分钟

Linux的总结

常用操作及概念

快捷键

Tab：命令和文件名补全
Ctrl+C：中断正在运行的程序
Ctrl+D：结束键盘输入（EOF）

求助

–help

指令的基本用法与选项介绍

man

将指令的具体信息显示出来

info

与man类似，做了分页处理

doc

/usr/share/doc存放着软件的一整套说明文件

关机

who

查看在线用户

sync

内存磁盘同步操作

shutdown

-k 不会关机，只发送警告

-r 将系统服务停掉后重启

-h 将系统服务停掉后关机

-c 取消正在进行的shutdown

PATH

可以在环境变量中声明可执行文件的路径，路径间以：分割

1	/usr/local/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/home/dmtsai/.local/bin:/home/dmtsai/bin

sudo

sudo允许一般用户使用root可执行的命令

包管理工具

RPM依赖管理和软件升级
DPKG与RPM相似

VIM三个模式

一般指令模式：VIM默认模式，可用游标查看内容
编辑模式：按下i键后进入，可对文本进行编辑
指令列模式：按下:键进入，用于保存退出等操作

在指令列模式下，有以下命令用于离开或者保存文件

命令	作用
:w	写入磁盘
:w!	当文件为只读时，强制写入磁盘。到底能不能写入，与用户对该文件的权限有关
:q	离开
:q!	强制离开不保存
:wq	写入磁盘后离开
:wq!	强制写入磁盘后离开

磁盘

磁盘接口

IDE
SATA
SCSI
SAS

磁盘的文件名

Linux 中每个硬件都被当做一个文件，包括磁盘。磁盘以磁盘接口类型进行命名，常见磁盘的文件名如下：

IDE 磁盘：/dev/hd[a-d]
SATA/SCSI/SAS 磁盘：/dev/sd[a-p]

其中文件名后面的序号的确定与系统检测到磁盘的顺序有关，而与磁盘所插入的插槽位置无关

分区

分区表

MBR

MBR 中，第一个扇区最重要，里面有主要开机记录（Master boot record, MBR）及分区表（partition table），其中主要开机记录占 446 bytes，分区表占 64 bytes。

分区表只有 64 bytes，最多只能存储 4 个分区，这 4 个分区为主分区（Primary）和扩展分区（Extended）。其中扩展分区只有一个，它使用其它扇区来记录额外的分区表，因此通过扩展分区可以分出更多分区，这些分区称为逻辑分区。

Linux 也把分区当成文件，分区文件的命名方式为：磁盘文件名 + 编号，例如 /dev/sda1。注意，逻辑分区的编号从 5 开始。

GPT

扇区是磁盘的最小存储单位，旧磁盘的扇区大小通常为 512 bytes，而最新的磁盘支持 4 k。GPT 为了兼容所有磁盘，在定义扇区上使用逻辑区块地址（Logical Block Address, LBA），LBA 默认大小为 512 bytes。

GPT 第 1 个区块记录了主要开机记录（MBR），紧接着是 33 个区块记录分区信息，并把最后的 33 个区块用于对分区信息进行备份。这 33 个区块第一个为 GPT 表头纪录，这个部份纪录了分区表本身的位置与大小和备份分区的位置，同时放置了分区表的校验码 (CRC32)，操作系统可以根据这个校验码来判断 GPT 是否正确。若有错误，可以使用备份分区进行恢复。

GPT 没有扩展分区概念，都是主分区，每个 LBA 可以分 4 个分区，因此总共可以分 4 * 32 = 128 个分区。

MBR 不支持 2.2 TB 以上的硬盘，GPT 则最多支持到 233 TB = 8 ZB。

开机检测程序

BIOS：不可以读取GPT分区表
UEFI：可用读取GPT分区表

文件系统

分区与文件系统

对分区进行格式化是为了在分区上建立文件系统。一个分区通常只能格式化为一个文件系统，但是磁盘阵列等技术可以将一个分区格式化为多个文件系统

组成

inode：一个文件占有一个inode，记录文件属性，同时记录此文件的内容所在的block编号
block：记录文件内容，文件太大时会占用多个block
superblock：记录文件系统的整体信息，包括inode和block的总量、使用量、剩余量、以及文件系统的格式与相关信息
block bitmap：记录block是否被使用的位图

文件读取

Ext2文件系统：现在indoe中查找文件内容所在的block，然后把所有block内容读取出来
FAT文件系统：每个block中存储下一个block的编号

磁盘碎片

指一个文件内容所在的block过于分散，导致磁盘磁头移动距离过大，从而降低磁盘读写性能

block

在Ext2文件系统中支持block的大小有1K、2K、4K三种，不同大小限制了单个文件和文件系统的最大大小

大小	1KB	2KB	4KB
最大单一文件	16GB	256GB	2TB
最大文件系统	2TB	8TB	16TB

一个block只能被一个文件使用，未使用部分直接浪费

inode

具体信息包含：

权限
拥有者与群组
容量
建立或状态改变的时间
最近读取时间
最近修改时间
定义文件特性的旗标（flag），如SetUID
该文件真正内容指向

inode特点：

每个indoe大小固定128 bytes
每个文件只占有一个indoe
indoe通过间接引用让block记录引用信息（下一个block）

日志

如果突然断电，那么文件系统会发生错误，例如断电前只修改了 block bitmap，而还没有将数据真正写入 block 中。

ext3/ext4 文件系统引入了日志功能，可以利用日志来修复文件系统

挂载

挂载利用目录作为文件系统的进入点，也就是说，进入目录之后就可以读取文件系统的数据。

目录配置

为了使不同 Linux 发行版本的目录结构保持一致性，Filesystem Hierarchy Standard (FHS) 规定了 Linux 的目录结构。最基础的三个目录如下：

/ (root, 根目录)
/usr (unix software resource)：所有系统默认软件都会安装到这个目录；
/var (variable)：存放系统或程序运行过程中的数据文件。

文件

文件属性

用户分为三种：文件拥有者、群组以及其它人，对不同的用户有不同的文件权限。

使用 ls 查看一个文件时，会显示一个文件的信息，例如 drwxr-xr-x 3 root root 17 May 6 00:14 .config，对这个信息的解释如下：

drwxr-xr-x：文件类型以及权限，第 1 位为文件类型字段，后 9 位为文件权限字段
3：链接数
root：文件拥有者
root：所属群组
17：文件大小
May 6 00:14：文件最后被修改的时间
.config：文件名

常见的文件类型及其含义有：

d：目录
-：文件
l：链接文件

9 位的文件权限字段中，每 3 个为一组，共 3 组，每一组分别代表对文件拥有者、所属群组以及其它人的文件权限。一组权限中的 3 位分别为 r、w、x 权限，表示可读、可写、可执行。

文件时间有以下三种：

modification time (mtime)：文件的内容更新就会更新；
status time (ctime)：文件的状态（权限、属性）更新就会更新；
access time (atime)：读取文件时就会更新。

文件与目录的基本操作

ls

列出文件或者目录的信息，目录的信息就是其中包含的文件。

1	# ls [-aAdfFhilnrRSt] file\|dir
2	-a ：列出全部的文件
3	-d ：仅列出目录本身
4	-l ：以长数据串行列出，包含文件的属性与权限等等数据

cd

更换当前目录。

1	cd [相对路径或绝对路径]

mkdir

创建目录。

1	# mkdir [-mp] 目录名称
2	-m ：配置目录权限
3	-p ：递归创建目录

rmdir

1	rmdir [-p] 目录名称
2	-p ：递归删除目录

touch

更新文件时间或者建立新文件。

1	# touch [-acdmt] filename
2	-a ：更新 atime
3	-c ：更新 ctime，若该文件不存在则不建立新文件
4	-m ：更新 mtime
5	-d ：后面可以接更新日期而不使用当前日期，也可以使用 --date="日期或时间"
6	-t ：后面可以接更新时间而不使用当前时间，格式为[YYYYMMDDhhmm]

cp

复制文件。如果源文件有两个以上，则目的文件一定要是目录才行。

1	cp [-adfilprsu] source destination
2	-a ：相当于 -dr --preserve=all
3	-d ：若来源文件为链接文件，则复制链接文件属性而非文件本身
4	-i ：若目标文件已经存在时，在覆盖前会先询问
5	-p ：连同文件的属性一起复制过去
6	-r ：递归复制
7	-u ：destination 比 source 旧才更新 destination，或 destination 不存在的情况下才复制
8	--preserve=all ：除了 -p 的权限相关参数外，还加入 SELinux 的属性, links, xattr 等也复制了

rm

删除文件。

1	# rm [-fir] 文件或目录
2	-r ：递归删除

mv

移动文件。

1	# mv [-fiu] source destination
2	# mv [options] source1 source2 source3 .... directory
3	-f ： force 强制的意思，如果目标文件已经存在，不会询问而直接覆盖

修改权限

可以将一组权限用数字来表示，此时一组权限的 3 个位当做二进制数字的位，从左到右每个位的权值为 4、2、1，即每个权限对应的数字权值为 r : 4、w : 2、x : 1。

1	# chmod [-R] xyz dirname/filenameCopy to clipboardErrorCopied

示例：将 .bashrc 文件的权限修改为 -rwxr-xr–。

1	# chmod 754 .bashrcCopy to clipboardErrorCopied

也可以使用符号来设定权限。

1	# chmod [ugoa] [+-=] [rwx] dirname/filename
2	- u：拥有者
3	- g：所属群组
4	- o：其他人
5	- a：所有人
6	- +：添加权限
7	- -：移除权限
8	- =：设定权限Copy to clipboardErrorCopied

示例：为 .bashrc 文件的所有用户添加写权限。

1	# chmod a+w .bashrc

默认权限

文件默认权限：文件默认没有可执行权限，因此为 666，也就是 -rw-rw-rw- 。
目录默认权限：目录必须要能够进入，也就是必须拥有可执行权限，因此为 777 ，也就是 drwxrwxrwx。

可以通过 umask 设置或者查看默认权限，通常以掩码的形式来表示，例如 002 表示其它用户的权限去除了一个 2 的权限，也就是写权限，因此建立新文件时默认的权限为 -rw-rw-r–。

目录的权限

文件名不是存储在一个文件的内容中，而是存储在一个文件所在的目录中。因此，拥有文件的 w 权限并不能对文件名进行修改。

目录存储文件列表，一个目录的权限也就是对其文件列表的权限。因此，目录的 r 权限表示可以读取文件列表；w 权限表示可以修改文件列表，具体来说，就是添加删除文件，对文件名进行修改；x 权限可以让该目录成为工作目录，x 权限是 r 和 w 权限的基础，如果不能使一个目录成为工作目录，也就没办法读取文件列表以及对文件列表进行修改了

链接

实体链接

在目录下创建一个条目，记录着文件名与 inode 编号，这个 inode 就是源文件的 inode。

删除任意一个条目，文件还是存在，只要引用数量不为 0。

有以下限制：不能跨越文件系统、不能对目录进行链接。

符号链接

符号链接文件保存着源文件所在的绝对路径，在读取时会定位到源文件上，可以理解为 Windows 的快捷方式。

当源文件被删除了，链接文件就打不开了。

因为记录的是路径，所以可以为目录建立符号链接。

获取文件内容

cat

取得文件内容。

1	# cat [-AbEnTv] filename
2	-n ：打印出行号，连同空白行也会有行号，-b 不会

tac

是 cat 的反向操作，从最后一行开始打印。

和 cat 不同的是它可以一页一页查看文件内容，比较适合大文件的查看。

less

和 more 类似，但是多了一个向前翻页的功能。

head

取得文件前几行。

1	# head [-n number] filename
2	-n ：后面接数字，代表显示几行的意思

tail

是 head 的反向操作，只是取得是后几行。

od

以字符或者十六进制的形式显示二进制文件。

指令与文件搜索

which

指令搜索。

1	# which [-a] command
2	-a ：将所有指令列出，而不是只列第一个

whereis

文件搜索。速度比较快，因为它只搜索几个特定的目录。

1	# whereis [-bmsu] dirname/filename

locate

文件搜索。可以用关键字或者正则表达式进行搜索。

locate 使用 /var/lib/mlocate/ 这个数据库来进行搜索，它存储在内存中，并且每天更新一次，所以无法用 locate 搜索新建的文件。可以使用 updatedb 来立即更新数据库。

1	# locate [-ir] keyword
2	-r：正则表达式

find

文件搜索。可以使用文件的属性和权限进行搜索。

1	# find [basedir] [option]
2	example: find . -name "shadow*"Copy to clipboardErrorCopied

① 与时间有关的选项

1	-mtime n ：列出在 n 天前的那一天修改过内容的文件
2	-mtime +n ：列出在 n 天之前 (不含 n 天本身) 修改过内容的文件
3	-mtime -n ：列出在 n 天之内 (含 n 天本身) 修改过内容的文件
4	-newer file ：列出比 file 更新的文件Copy to clipboardErrorCopied

+4、4 和 -4 的指示的时间范围如下：

② 与文件拥有者和所属群组有关的选项

-uid n
-gid n
-user name
-group name
-nouser ：搜索拥有者不存在 /etc/passwd 的文件
-nogroup：搜索所属群组不存在于 /etc/group 的文件Copy to clipboardErrorCopied

③ 与文件权限和名称有关的选项

1	-name filename
2	-size [+-]SIZE：搜寻比 SIZE 还要大 (+) 或小 (-) 的文件。这个 SIZE 的规格有：c: 代表 byte，k: 代表 1024bytes。所以，要找比 50KB 还要大的文件，就是 -size +50k
3	-type TYPE
4	-perm mode ：搜索权限等于 mode 的文件
5	-perm -mode ：搜索权限包含 mode 的文件
6	-perm /mode ：搜索权限包含任一 mode 的文件

压缩与打包

压缩文件名

Linux 底下有很多压缩文件名，常见的如下：

扩展名	压缩程序
*.Z	compress
*.zip	zip
*.gz	gzip
*.bz2	bzip2
*.xz	xz
*.tar	tar 程序打包的数据，没有经过压缩
*.tar.gz	tar 程序打包的文件，经过 gzip 的压缩
*.tar.bz2	tar 程序打包的文件，经过 bzip2 的压缩
*.tar.xz	tar 程序打包的文件，经过 xz 的压缩

压缩指令

gzip

gzip 是 Linux 使用最广的压缩指令，可以解开 compress、zip 与 gzip 所压缩的文件。

经过 gzip 压缩过，源文件就不存在了。

有 9 个不同的压缩等级可以使用。

可以使用 zcat、zmore、zless 来读取压缩文件的内容。

1	$ gzip [-cdtv#] filename
2	-c ：将压缩的数据输出到屏幕上
3	-d ：解压缩
4	-t ：检验压缩文件是否出错
5	-v ：显示压缩比等信息
6	-# ： # 为数字的意思，代表压缩等级，数字越大压缩比越高，默认为 6

bzip2

提供比 gzip 更高的压缩比。

查看命令：bzcat、bzmore、bzless、bzgrep。

1	$ bzip2 [-cdkzv#] filename
2	-k ：保留源文件

xz

提供比 bzip2 更佳的压缩比。

可以看到，gzip、bzip2、xz 的压缩比不断优化。不过要注意的是，压缩比越高，压缩的时间也越长。

查看命令：xzcat、xzmore、xzless、xzgrep。

1	$ xz [-dtlkc#] filename

打包

压缩指令只能对一个文件进行压缩，而打包能够将多个文件打包成一个大文件。tar 不仅可以用于打包，也可以使用 gzip、bzip2、xz 将打包文件进行压缩。

1	$ tar [-z\|-j\|-J] [cv] [-f 新建的 tar 文件] filename... ==打包压缩
2	$ tar [-z\|-j\|-J] [tv] [-f 已有的 tar 文件] ==查看
3	$ tar [-z\|-j\|-J] [xv] [-f 已有的 tar 文件] [-C 目录] ==解压缩
4	-z ：使用 zip；
5	-j ：使用 bzip2；
6	-J ：使用 xz；
7	-c ：新建打包文件；
8	-t ：查看打包文件里面有哪些文件；
9	-x ：解打包或解压缩的功能；
10	-v ：在压缩/解压缩的过程中，显示正在处理的文件名；
11	-f : filename：要处理的文件；
12	-C 目录：在特定目录解压缩。

使用方式	命令
打包压缩	tar -jcv -f filename.tar.bz2 要被压缩的文件或目录名称
查看	tar -jtv -f filename.tar.bz2
解压缩	tar -jxv -f filename.tar.bz2 -C 要解压缩的目录

Bash

可以通过 Shell 请求内核提供服务，Bash 正是 Shell 的一种。

特性

命令历史：记录使用过的命令
命令与文件补全：快捷键：tab
命名别名：例如 ll 是 ls -al 的别名
shell scripts
通配符：例如 ls -l /usr/bin/X* 列出 /usr/bin 下面所有以 X 开头的文件

变量操作

对一个变量赋值直接使用 =。

对变量取用需要在变量前加上 $ ，也可以用 ${} 的形式；

输出变量使用 echo 命令。

1	$ x=abc
2	$ echo $x
3	$ echo ${x}Copy to clipboardErrorCopied

变量内容如果有空格，必须使用双引号或者单引号。

双引号内的特殊字符可以保留原本特性，例如 x=”lang is $LANG”，则 x 的值为 lang is zh_TW.UTF-8；
单引号内的特殊字符就是特殊字符本身，例如 x=’lang is $LANG’，则 x 的值为 lang is $LANG。

可以使用 指令 或者 $(指令) 的方式将指令的执行结果赋值给变量。例如 version=$(uname -r)，则 version 的值为 4.15.0-22-generic。

可以使用 export 命令将自定义变量转成环境变量，环境变量可以在子程序中使用，所谓子程序就是由当前 Bash 而产生的子 Bash。

Bash 的变量可以声明为数组和整数数字。注意数字类型没有浮点数。如果不进行声明，默认是字符串类型。变量的声明使用 declare 命令：

$ declare [-aixr] variable
-a ： 定义为数组类型
-i ： 定义为整数类型
-x ： 定义为环境变量
-r ： 定义为 readonly 类型Copy to clipboardErrorCopied

使用 [ ] 来对数组进行索引操作：

1	$ array[1]=a
2	$ array[2]=b
3	$ echo ${array[1]}

指令搜索顺序

以绝对或相对路径来执行指令，例如 /bin/ls 或者 ./ls ；
由别名找到该指令来执行；
由 Bash 内置的指令来执行；
按 $PATH 变量指定的搜索路径的顺序找到第一个指令来执行。

数据流重定向

重定向指的是使用文件代替标准输入、标准输出和标准错误输出。

1	代码	运算符
标准输入 (stdin)	0	< 或 <<
标准输出 (stdout)	1	> 或 >>
标准错误输出 (stderr)	2	2> 或 2>>

其中，有一个箭头的表示以覆盖的方式重定向，而有两个箭头的表示以追加的方式重定向。

可以将不需要的标准输出以及标准错误输出重定向到 /dev/null，相当于扔进垃圾箱。

如果需要将标准输出以及标准错误输出同时重定向到一个文件，需要将某个输出转换为另一个输出，例如 2>&1 表示将标准错误输出转换为标准输出。

1	$ find /home -name .bashrc > list 2>&1

管道命令

管道是将一个命令的标准输出作为另一个命令的标准输入，在数据需要经过多个步骤的处理之后才能得到我们想要的内容时就可以使用管道。

在命令之间使用 | 分隔各个管道命令。

1	$ ls -al /etc \| less

提取指令

cut 对数据进行切分，取出想要的部分。

切分过程一行一行地进行。

1	$ cut
2	-d ：分隔符
3	-f ：经过 -d 分隔后，使用 -f n 取出第 n 个区间
4	-c ：以字符为单位取出区间Copy to clipboardErrorCopied

示例 1：last 显示登入者的信息，取出用户名。

1	$ last
2	root pts/1 192.168.201.101 Sat Feb 7 12:35 still logged in
3	root pts/1 192.168.201.101 Fri Feb 6 12:13 - 18:46 (06:33)
4	root pts/1 192.168.201.254 Thu Feb 5 22:37 - 23:53 (01:16)
5
6	$ last \| cut -d ' ' -f 1Copy to clipboardErrorCopied

示例 2：将 export 输出的信息，取出第 12 字符以后的所有字符串。

$ export
declare -x HISTCONTROL="ignoredups"
declare -x HISTSIZE="1000"
declare -x HOME="/home/dmtsai"
declare -x HOSTNAME="study.centos.vbird"
.....(其他省略).....

$ export | cut -c 12-

排序指令

sort 用于排序。

1	$ sort [-fbMnrtuk] [file or stdin]
2	-f ：忽略大小写
3	-b ：忽略最前面的空格
4	-M ：以月份的名字来排序，例如 JAN，DEC
5	-n ：使用数字
6	-r ：反向排序
7	-u ：相当于 unique，重复的内容只出现一次
8	-t ：分隔符，默认为 tab
9	-k ：指定排序的区间Copy to clipboardErrorCopied

示例：/etc/passwd 文件内容以 : 来分隔，要求以第三列进行排序。

$ cat /etc/passwd | sort -t ':' -k 3
root:x:0:0:root:/root:/bin/bash
dmtsai:x:1000:1000:dmtsai:/home/dmtsai:/bin/bash
alex:x:1001:1002::/home/alex:/bin/bash
arod:x:1002:1003::/home/arod:/bin/bashCopy to clipboardErrorCopied

uniq 可以将重复的数据只取一个。

1	$ uniq [-ic]
2	-i ：忽略大小写
3	-c ：进行计数Copy to clipboardErrorCopied

示例：取得每个人的登录总次数

$ last | cut -d ' ' -f 1 | sort | uniq -c
1
6 (unknown
47 dmtsai
4 reboot
7 root
1 wtmp

双向输出重定向

输出重定向会将输出内容重定向到文件中，而 tee 不仅能够完成这个功能，还能保留屏幕上的输出。也就是说，使用 tee 指令，一个输出会同时传送到文件和屏幕上。

1	$ tee [-a] file

字符转换指令

tr 用来删除一行中的字符，或者对字符进行替换。

1	$ tr [-ds] SET1 ...
2	-d ：删除行中 SET1 这个字符串Copy to clipboardErrorCopied

示例，将 last 输出的信息所有小写转换为大写。

1	$ last \| tr '[a-z]' '[A-Z]'Copy to clipboardErrorCopied

col 将 tab 字符转为空格字符。

1	$ col [-xb]
2	-x ：将 tab 键转换成对等的空格键Copy to clipboardErrorCopied

expand 将 tab 转换一定数量的空格，默认是 8 个。

1	$ expand [-t] file
2	-t ：tab 转为空格的数量Copy to clipboardErrorCopied

join 将有相同数据的那一行合并在一起。

1	$ join [-ti12] file1 file2
2	-t ：分隔符，默认为空格
3	-i ：忽略大小写的差异
4	-1 ：第一个文件所用的比较字段
5	-2 ：第二个文件所用的比较字段Copy to clipboardErrorCopied

paste 直接将两行粘贴在一起。

1	$ paste [-d] file1 file2
2	-d ：分隔符，默认为 tab

分区指令

split 将一个文件划分成多个文件。

1	$ split [-bl] file PREFIX
2	-b ：以大小来进行分区，可加单位，例如 b, k, m 等
3	-l ：以行数来进行分区。
4	- PREFIX ：分区文件的前导名称

正则表达式

grep

g/re/p（globally search a regular expression and print)，使用正则表示式进行全局查找并打印。

1	$ grep [-acinv] [--color=auto] 搜寻字符串 filename
2	-c ：统计匹配到行的个数
3	-i ：忽略大小写
4	-n ：输出行号
5	-v ：反向选择，也就是显示出没有搜寻字符串内容的那一行
6	--color=auto ：找到的关键字加颜色显示Copy to clipboardErrorCopied

示例：把含有 the 字符串的行提取出来（注意默认会有 –color=auto 选项，因此以下内容在 Linux 中有颜色显示 the 字符串）

$ grep -n 'the' regular_express.txt
8:I can't finish the test.
12:the symbol '*' is represented as start.
15:You are the best is mean you are the no. 1.
16:The world Happy is the same with "glad".
18:google is the best tools for search keywordCopy to clipboardErrorCopied

示例：正则表达式 a{m,n} 用来匹配字符 a m~n 次，这里需要将 { 和 } 进行转义，因为它们在 shell 是有特殊意义的。

1	$ grep -n 'a\{2,5\}' regular_express.txt

printf

用于格式化输出。它不属于管道命令，在给 printf 传数据时需要使用 $( ) 形式。

1	$ printf '%10s %5i %5i %5i %8.2f \n' $(cat printf.txt)
2	DmTsai 80 60 92 77.33
3	VBird 75 55 80 70.00
4	Ken 60 90 70 73.33

awk

是由 Alfred Aho，Peter Weinberger 和 Brian Kernighan 创造，awk 这个名字就是这三个创始人名字的首字母。

awk 每次处理一行，处理的最小单位是字段，每个字段的命名方式为：$n，n 为字段号，从 1 开始，$0 表示一整行。

示例：取出最近五个登录用户的用户名和 IP。首先用 last -n 5 取出用最近五个登录用户的所有信息，可以看到用户名和 IP 分别在第 1 列和第 3 列，我们用 $1 和 $3 就能取出这两个字段，然后用 print 进行打印。

1	$ last -n 5
2	dmtsai pts/0 192.168.1.100 Tue Jul 14 17:32 still logged in
3	dmtsai pts/0 192.168.1.100 Thu Jul 9 23:36 - 02:58 (03:22)
4	dmtsai pts/0 192.168.1.100 Thu Jul 9 17:23 - 23:36 (06:12)
5	dmtsai pts/0 192.168.1.100 Thu Jul 9 08:02 - 08:17 (00:14)
6	dmtsai tty1 Fri May 29 11:55 - 12:11 (00:15)Copy to clipboardErrorCopied
7	$ last -n 5 \| awk '{print $1 "\t" $3}'Copy to clipboardErrorCopied

可以根据字段的某些条件进行匹配，例如匹配字段小于某个值的那一行数据。

1	$ awk '条件类型 1 {动作 1} 条件类型 2 {动作 2} ...' filenameCopy to clipboardErrorCopied

示例：/etc/passwd 文件第三个字段为 UID，对 UID 小于 10 的数据进行处理。

1	$ cat /etc/passwd \| awk 'BEGIN {FS=":"} $3 < 10 {print $1 "\t " $3}'
2	root 0
3	bin 1
4	daemon 2Copy to clipboardErrorCopied

awk 变量：

变量名称	代表意义
NF	每一行拥有的字段总数
NR	目前所处理的是第几行数据
FS	目前的分隔字符，默认是空格键

示例：显示正在处理的行号以及每一行有多少字段

$ last -n 5 | awk '{print $1 "\t lines: " NR "\t columns: " NF}'
dmtsai lines: 1 columns: 10
dmtsai lines: 2 columns: 10
dmtsai lines: 3 columns: 10
dmtsai lines: 4 columns: 10
dmtsai lines: 5 columns: 9

进程管理

查看进程

ps

查看某个时间点的进程信息。

示例：查看自己的进程

1	# ps -lCopy to clipboardErrorCopied

示例：查看系统所有进程

1	# ps auxCopy to clipboardErrorCopied

示例：查看特定的进程

1	# ps aux \| grep threadx

pstree

查看进程树。

示例：查看所有进程树

1	# pstree -A

top

实时显示进程信息。

示例：两秒钟刷新一次

1	# top -d 2

netstat

查看占用端口的进程

示例：查看特定端口的进程

1	# netstat -anp \| grep port

进程状态

状态	说明
R	running or runnable (on run queue) 正在执行或者可执行，此时进程位于执行队列中。
D	uninterruptible sleep (usually I/O) 不可中断阻塞，通常为 IO 阻塞。
S	interruptible sleep (waiting for an event to complete) 可中断阻塞，此时进程正在等待某个事件完成。
Z	zombie (terminated but not reaped by its parent) 僵死，进程已经终止但是尚未被其父进程获取信息。
T	stopped (either by a job control signal or because it is being traced) 结束，进程既可以被作业控制信号结束，也可能是正在被追踪。

SIGCHLD

当一个子进程改变了它的状态时（停止运行，继续运行或者退出），有两件事会发生在父进程中：

得到 SIGCHLD 信号；
waitpid() 或者 wait() 调用会返回。

其中子进程发送的 SIGCHLD 信号包含了子进程的信息，比如进程 ID、进程状态、进程使用 CPU 的时间等。

在子进程退出时，它的进程描述符不会立即释放，这是为了让父进程得到子进程信息，父进程通过 wait() 和 waitpid() 来获得一个已经退出的子进程的信息。

wait()

1	pid_t wait(int *status)Copy to clipboardErrorCopied

父进程调用 wait() 会一直阻塞，直到收到一个子进程退出的 SIGCHLD 信号，之后 wait() 函数会销毁子进程并返回。

如果成功，返回被收集的子进程的进程 ID；如果调用进程没有子进程，调用就会失败，此时返回 -1，同时 errno 被置为 ECHILD。

参数 status 用来保存被收集的子进程退出时的一些状态，如果对这个子进程是如何死掉的毫不在意，只想把这个子进程消灭掉，可以设置这个参数为 NULL

waitpid()

1	pid_t waitpid(pid_t pid, int *status, int options)Copy to clipboardErrorCopied

作用和 wait() 完全相同，但是多了两个可由用户控制的参数 pid 和 options。

pid 参数指示一个子进程的 ID，表示只关心这个子进程退出的 SIGCHLD 信号。如果 pid=-1 时，那么和 wait() 作用相同，都是关心所有子进程退出的 SIGCHLD 信号。

options 参数主要有 WNOHANG 和 WUNTRACED 两个选项，WNOHANG 可以使 waitpid() 调用变成非阻塞的，也就是说它会立即返回，父进程可以继续执行其它任务。

孤儿进程

一个父进程退出，而它的一个或多个子进程还在运行，那么这些子进程将成为孤儿进程。

孤儿进程将被 init 进程（进程号为 1）所收养，并由 init 进程对它们完成状态收集工作。

由于孤儿进程会被 init 进程收养，所以孤儿进程不会对系统造成危害

僵尸进程

一个子进程的进程描述符在子进程退出时不会释放，只有当父进程通过 wait() 或 waitpid() 获取了子进程信息后才会释放。如果子进程退出，而父进程并没有调用 wait() 或 waitpid()，那么子进程的进程描述符仍然保存在系统中，这种进程称之为僵尸进程。

僵尸进程通过 ps 命令显示出来的状态为 Z（zombie）。

系统所能使用的进程号是有限的，如果产生大量僵尸进程，将因为没有可用的进程号而导致系统不能产生新的进程。

要消灭系统中大量的僵尸进程，只需要将其父进程杀死，此时僵尸进程就会变成孤儿进程，从而被 init 进程所收养，这样 init 进程就会释放所有的僵尸进程所占有的资源，从而结束僵尸进程

参考资料

CS-Notes

1	$ declare [-aixr] variable
2	-a ：定义为数组类型
3	-i ：定义为整数类型
4	-x ：定义为环境变量
5	-r ：定义为 readonly 类型Copy to clipboardErrorCopied

1	-uid n
2	-gid n
3	-user name
4	-group name
5	-nouser ：搜索拥有者不存在 /etc/passwd 的文件
6	-nogroup：搜索所属群组不存在于 /etc/group 的文件Copy to clipboardErrorCopied

1	$ export
2	declare -x HISTCONTROL="ignoredups"
3	declare -x HISTSIZE="1000"
4	declare -x HOME="/home/dmtsai"
5	declare -x HOSTNAME="study.centos.vbird"
6	.....(其他省略).....
7
8	$ export \| cut -c 12-

1	$ cat /etc/passwd \| sort -t ':' -k 3
2	root:x:0:0:root:/root:/bin/bash
3	dmtsai:x:1000:1000:dmtsai:/home/dmtsai:/bin/bash
4	alex:x:1001:1002::/home/alex:/bin/bash
5	arod:x:1002:1003::/home/arod:/bin/bashCopy to clipboardErrorCopied

1	$ last \| cut -d ' ' -f 1 \| sort \| uniq -c
2	1
3	6 (unknown
4	47 dmtsai
5	4 reboot
6	7 root
7	1 wtmp

1	$ grep -n 'the' regular_express.txt
2	8:I can't finish the test.
3	12:the symbol '*' is represented as start.
4	15:You are the best is mean you are the no. 1.
5	16:The world Happy is the same with "glad".
6	18:google is the best tools for search keywordCopy to clipboardErrorCopied

1	$ last -n 5 \| awk '{print $1 "\t lines: " NR "\t columns: " NF}'
2	dmtsai lines: 1 columns: 10
3	dmtsai lines: 2 columns: 10
4	dmtsai lines: 3 columns: 10
5	dmtsai lines: 4 columns: 10
6	dmtsai lines: 5 columns: 9