为各发行版构建本地仓库

20210201T22:36:08.008Z

来由

容器化应用在构建时经常因为下载包而花费很多时间（有时遇到网络抽风，一个版本要多次构建才能成功），而大多依赖包几乎又都是不变更的。于是我有这样一个构建镜像的优化思路：

用一个最小化的容器，将所需的包提前下载到本地，再将这些包构建成一个个的本地仓库。在需要构建的容器中，把软件源替换成本地仓库，就可以节省构建容器的时间（数量级的）。

这里之所以将其记下来，写成博客，还有一个原因：虽然这里用到的全都是现成的工具和软件，但是除了自身的手册和 --help，其他有帮助的文档实在过于分散，而且据我搜索一圈下来，这些现成的工具总会碰到一些文档中未提及，甚至 Stack Overflow 之类网站都很少碰到的小“坑”，而解决这些“坑”才是最耗时的。

TL;DR

我之后会在 github 上将其部分开源出来，放在这里（TODO）

目前经过测试兼容的发行版有:

centos 6 / 7 / 8
fedora 31 / 32 / 33
amazonlinux 1 / 2
ubuntu trusty (14.04) / xenial (16.04) / bionic (18.04) / focal (20.04)
debian jessie (8) / stretch (9) / buster (10)
opensuse leap 15

流程

基于该发行版最小化的容器，添加一些需要用到的软件源。
针对不同的发行版，使用对应的包管理工具，下载所需软件包列表的所有软件包以及其依赖包
将这些包按发行版放置在对应的目录下，使用容器中创建软件仓库的命令来构建本地仓库
使用一个简单的静态 web server，监听一个本地端口。这样一个本地的 http 软件仓库就搭起来了
将本地的软件源添加到需要经常更新构建的容器 Dockerfile 中。这里需要注意的是，本地的软件仓库一般没有做签名校验或者 https 之类，需要手动添加信任。

这里只对较为繁琐的步骤进行说明

0x02. 软件包下载

yum / dnf

1
2


$ cd /path/to/dir \
    && yumdownloader --resolve pkg-1 pkg-2 ...

这里首选 yumdownloader，前一个方案试过 dnf install --downloadonly，发现这里的未知的坑不少，其中一个是下载完成后，已经下载到本地的包偶尔会被删掉，感觉是 dnf / yum 本身有一些存储优化策略。
--resolve 选项是为了指定让 yumdownloader 下载指定软件包的依赖包
--installroot 不推荐使用这个选项来指定下载路径，使用该选项后，软件源配置文件中的宏(变量)都不自动解析了。比如常见的 $releasever 变量，需要额外手动指定。
yumdownloader 会直接将包下载到工作目录，直接用 cd 提前切换工作目录即可

apt-get

1
2
3
4
5


$ cd /path/to/dir \
    && apt-get download \
    $(apt-cache depends --recurse --no-recommends --no-suggests \
        --no-conflicts --no-breaks --no-replaces --no-enhances \
        pkg-1 pkg-2 ... | grep "^\w")

如果使用 apt-get install --donwload-only --reinstall 来下载包，那么依赖包如果是当前容器中已经存在的包就不会再下载了。

如 downloader-container (用于下载的容器) 中已存在 ca-certificates 和 openssl 两个软件包，此时再执行接下来的命令，结果就是：由于 --reinstall 选项 ca-certificates 会被下载，但是 openssl 作为 ca-certificates 的依赖包，就会被忽略了。

1
2
3
4


$ apt-get download \
        $(apt-cache depends --recurse --no-recommends --no-suggests \
        --no-conflicts --no-breaks --no-replaces --no-enhances \
        ca-certificates | grep "^\w")

这里使用的是 apt-get download 而不是 apt-get --install --donwload-only，主要原因是在子命令 apt-cache depends 中，查询到的依赖包，会有首选和次选（替代），而这两者往往是冲突的，就算 apt-get install 使用了 --donwload-only 也会导致包下载失败，因为无法解决冲突。

下面列举一个 apt-cache depends 的结果，其中 pinentry-curses 是的更优先选择。详细说明可以参见 https://www.thecodeship.com/gnu-linux/understanding-apt-cache-depends-output/

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16


$ apt-cache depends --recurse --no-recommends \
    --no-suggests --no-conflicts --no-breaks \
    --no-replaces --no-enhances --no-pre-depends \
    gnupg2 | grep -E '^gnupg-agent:i386' -A10

gnupg-agent:i386
 |Depends: pinentry-curses:i386
  Depends: 
    mew-beta-bin:i386
    mew-bin:i386
    pinentry-curses:i386
    pinentry-gnome3:i386
    pinentry-gtk2:i386
    pinentry-qt:i386
    pinentry-tty:i386
  Depends: libassuan0:i386

apt-get download 也是直接将软件包下载到当前目录的，所以提前用 cd 命令切换工作目录即可

zypper

1
2
3
4


$ zypper --no-gpg-checks --non-interactive \
    --pkg-cache-dir /path/to/dir \
    install -y -f --download-only \
    pkg-1 pkg-2 ...

--non-interactive 主要用于脚本中，防止 zypper 等待用户输入直到超时
--pkg-cache-dir 用来指定下载目录
-f 用来强制下载已经安装的包。这里其实会遇到和 apt-get install --download-only 中一样的问题，就是依赖包如果已经安装，则不会下载。目前我暂时这样写，有缺少的基础包就手动加上了。
对于 zypper 要区分 global arguments 和 subcommand arguments，具体到这条命令就是 install 前面为 global arguments，而后面是 subcommand arguments

0x03. 目录结构

yum

yum 仓库的目录结构如下：

1
2
3
4
5
6
7


base/
├── amazonlinux-1
│   └── x86_64
|       ├── audit-libs-2.6.5-3.28.amzn2.i686.rpm
|       ├── ...
│       └── repodata
...

说明：yum 仓库的结构比较简单，在发行版子目录 -> CPU架构目录下，存放下载的 rpm 包，然后在同目录下创建本地仓库索引。

创建 yum 仓库索引的命令如下：

1
2


cd /path/to/dir \
    && createrepo --update ./

其中，createrepo 还有一个 c 版本的 createrepo_c，速度会更快，使用方法相同。推荐较新的发行版直接使用，比如 centos 8 / fedora 31+ / amazonlinux

1
2


cd /path/to/dir \
    && createrepo_c --update ./

较新的发行版某些包是用 modularity ¹的方式构建的，如果想针对这些包构建本地仓库需要额外的命令：

文档详见：https://docs.fedoraproject.org/en-US/modularity/hosting-modules/

1
2
3
4


cd /path/to/dir \
    && createrepo_c --update ./ \
    && repo2module -s stable -n REPO_NAME -d ./ ./repodata/modules \
    && modifyrepo_c --mdtype=modules ./repodata/modules.yaml ./repodata

其中 REPO_NAME 是本地仓库的名字

这里一个值得注意的命令是 repo2module（来自 https://github.com/rpm-software-management/modulemd-tools），因为在上述文档中并未提及如何生成 modules.yaml 文件。

fedora 或者 centos 8 (需要额外添加 epel 仓库) 可以通过 dnf install -y python3-gobject modulemd-tools 来安装 repo2module 命令

apt

apt 仓库的目录结构如下：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13


ubuntu/
├── dists
│   ├── bionic
│   │   └── base
│   │       └── main
│   │           └── binary-amd64
|  ...
└── pool
    ├── bionic
    │   └── base
    │       └── main
    │           └── binary-amd64
   ...

说明： apt 仓库分 dists/ 和 pool/ 两个子目录，dists/ 子目录下存放索引，pool/ 子目录下存放软件包。

创建 apt 仓库索引的命令如下：

这里本地仓库就不再使用 gpg 签名 Release 了，完整命令详见：https://medium.com/sqooba/create-your-own-custom-and-authenticated-apt-repository-1e4a4cf0b864#35dd

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11


cd /path/to/dir

apt-ftparchive --arch amd64 packages \
    pool/bionic/base/main/binary-amd64 \
    > dists/base/main/binary-amd64/Packages

gzip -k -c \
    -f dists/base/main/binary-amd64/Packages \
    > dists/base/main/binary-amd64/Packages.gz

apt-ftparchive release dists/bionic/base > dists/bionic/Release

其中 base 是自定义的仓库子目录，这里方便之后扩展。 apt-ftparchive 命令可以通过 apt-get install -y dpkg-dev 安装。

0x05. 添加本地仓库

下面的 host.docker.internal 是通过 docker build 的 --add-host 添加的域名，4891 为本地 openresty 监听的端口

yum

1
2
3
4
5
6
7
8


printf "[local-base]\n\
name=Local Base Repo\n\
baseurl=http://host.docker.internal:4891/base/centos-7/x86_64/\n\
skip_if_unavailable=True\n\
gpgcheck=0\n\
repo_gpgcheck=0\n\
enabled=1\n\
enabled_metadata=1" > /etc/yum.repos.d/local-base.repo

zypper

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12


printf "[local-base]\n\
name=Local Base Repo\n\
baseurl=http://host.docker.internal:4891/base/sles-12/x86_64/\n\
skip_if_unavailable=True\n\
gpgcheck=0\n\
repo_gpgcheck=0\n\
enabled=1\n\
enabled_metadata=1" > /root/local-base.repo \
    && zypper -n ar --check --refresh -G file:///root/local-base.repo \
    && zypper -n mr --gpgcheck-allow-unsigned-repo local-base \
    && zypper -n mr --gpgcheck-allow-unsigned-package local-base \
    && rm -f /root/local-base.repo

apt

1

echo "deb [trusted=yes] http://host.docker.internal:4891/ubuntu bionic/base main" > /etc/apt/sources.list

https://docs.pagure.org/modularity/ ↩︎

旧版本内核与 AMD Family 17h 系列 CPU 的兼容性问题

20201113T17:20:00.008Z

最近同事在我司某底层软件在各版本内核上的兼容性时，遇到了诡异的问题：使用 kvm 启动特定版本内核的 CentOS 7 的时候，发生了致命错误，导致系统无法启动。

这些内核的版本号如下：

3.10.0-123
3.10.0-229

TL;DR

这里其实是一个 AMD Family-17h 架构的 CPU 与较老版本的内核之间的一个兼容性 bug，该 bug 已经在更新版本的内核中修复：

https://git.kernel.org/pub/scm/linux/kernel/git/tip/tip.git/commit/?id=e40ed1542dd779e5037a22c6b534e57127472365

解决过程

LVM ?

kvm 中的操作系统无法启动后，使用 vnc 连接上该机器，发现报错：

1

dracut-initqueue timeout and could not boot – warning /dev/centos/root-lv does not exist

这个错误我见过很多次，在搜索引擎输入关键字也能找到一堆解决方法。不过大都是 UUID 对不上导致的错误，我这里是 LVM，所以我怀疑是内核启动时不识别 lvm 的分区导致的系统无法启动。

然后我尝试使用标准分区来代替 LVM，重装系统，报错依旧，无法启动。

XFS/EXT4/EXT2 ?

这时我开始怀疑 boot 分区的文件系统，重装后的系统使用的是 XFS，而我印象中很老版本的内核只支持 ext2 / ext3 / ext4 的文件系统，于是我又重装了两次操作系统，/boot 分区分别使用 ext4 和 ext2，依然没有解决问题。

GRUB2 ?

这时我又开始怀疑 grub 2 的参数问题，由于在使用标准分区后，指定启动硬盘的语句就变成了 linux16 ... root=UUID=xxxx，这里的 root=UUID=xxx 是不是也有可能是老的内核版本不支持的呢？于是我在 /etc/default/grub 文件中加入了 GRUB_DISABLE_LINUX_UUID=true，再执行：

1
2


# 注意，kvm 没有用 efi 启动
grub2-mkconfig -o /boot/grub2/grub.cfg

更新之后，再重启试试

…

还是不行

VIRTIO ?

我开始怀疑内核启动后压根没找到设备，于是开始找 kvm 的疑点：virtio。virtio 是 kvm 提供的硬盘总线 (bus)，应该需要对应的驱动才行，于是我执行 lsinitrd 命令来查找是否有对应的驱动：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10


# sudo lsinitrd /boot/initramfs-3.10.0-229.7.2.el7.x86_64.img | grep virtio

-rw-r--r--   1 root     root        27885 Jun 24  2015 usr/lib/modules/3.10.0-229.7.2.el7.x86_64/kernel/drivers/block/virtio_blk.ko
-rw-r--r--   1 root     root        52861 Jun 24  2015 usr/lib/modules/3.10.0-229.7.2.el7.x86_64/kernel/drivers/char/virtio_console.ko
-rw-r--r--   1 root     root        50501 Jun 24  2015 usr/lib/modules/3.10.0-229.7.2.el7.x86_64/kernel/drivers/net/virtio_net.ko
-rw-r--r--   1 root     root        29125 Jun 24  2015 usr/lib/modules/3.10.0-229.7.2.el7.x86_64/kernel/drivers/scsi/virtio_scsi.ko
drwxr-xr-x   2 root     root            0 Nov 13 16:19 usr/lib/modules/3.10.0-229.7.2.el7.x86_64/kernel/drivers/virtio
-rw-r--r--   1 root     root        15797 Jun 24  2015 usr/lib/modules/3.10.0-229.7.2.el7.x86_64/kernel/drivers/virtio/virtio.ko
-rw-r--r--   1 root     root        21253 Jun 24  2015 usr/lib/modules/3.10.0-229.7.2.el7.x86_64/kernel/drivers/virtio/virtio_pci.ko
-rw-r--r--   1 root     root        25541 Jun 24  2015 usr/lib/modules/3.10.0-229.7.2.el7.x86_64/kernel/drivers/virtio/virtio_ring.ko

结果是：驱动找得到，和可正常启动的较新版内核没差别。

AMD Family-17h !

这时还有一个疑点，就是开机时一闪而过的一句提示（我重启了很多次，最终是截图才看清这句话）：core perfctr but no constraints; unknown hardware!

用这个关键词，Google 查了一下，结果豁然开朗：这个是 AMD Family-17h 与较老版本内核之间的一个兼容性问题。可以引用下面这句话解释：

In family-17h, there is no PMC-event constraint. All events, irrespective of the type, can be measured using any of the six generic performance counters.

而这里的 AMD family-17h 对应的是 zen / zen+ / zen2 架构的 CPU，和正在使用的这台虚拟机母机对应得上，也能刚好解释之前在 Intel 平台上可以正常使用该版本内核启动机器。

当然这个问题的解决办法就是升级内核，在几年前各大操作系统已经应用了这个修复。

Yubikey 的 polkit 配置

20200414T10:13:00.008Z

由于工作中有存储 GPG 密钥的需求，又不是很想把密钥存在云服务或者 Git 服务中，去年 2 月购买了 Yubikey5 Nano 版。

总体下来还是很满意的，虽然在使用过程中确实遇到些问题，也基本 Google 解决了。

当时还打算写一下相关踩坑教程，可惜都搁置了，这篇文章基本能覆盖你碰到的大部分问题：https://mechanus.io/ke-neng-shi-zui-hao-de-yubikey-gpg-ssh-zhi-neng-qia-jiao-cheng/

这篇主要说一下 Yubikey 和 polkit 工具集之间配合的坑：

重现

环境：fedora 30 / 31 （两台虚拟机都遇到过）

插入 Yubikey，非 root 用户执行 gpg2 --card-status 发现没有找到设备，提示：

1
2


gpg: selecting card failed: No such device
gpg: OpenPGP card not available: No such device

执行 journalctl -xe 发现有类似以下的日志：

1
2
3
4
5
6
7
8


pcscd[13141]: 00000000 ifdhandler.c:150:CreateChannelByNameOrChannel() failed
pcscd[13141]: 00000071 readerfactory.c:1105:RFInitializeReader() Open Port 0x200000 Failed (usb:1050/0407:libudev:0:/dev/bus/usb/003/006)
pcscd[13141]: 00000004 readerfactory.c:376:RFAddReader() Yubico YubiKey OTP+FIDO+CCID init failed.
pcscd[13141]: 00004720 ifdhandler.c:150:CreateChannelByNameOrChannel() failed
pcscd[13141]: 00000023 readerfactory.c:1105:RFInitializeReader() Open Port 0x200000 Failed (usb:1050/0407:libudev:1:/dev/bus/usb/003/006)
pcscd[13141]: 00000004 readerfactory.c:376:RFAddReader() Yubico YubiKey OTP+FIDO+CCID init failed.
pcscd[13141]: 00143849 auth.c:135:IsClientAuthorized() Process 13120 (user: 1000) is NOT authorized for action: access_pcsc
pcscd[13141]: 00000140 winscard_svc.c:335:ContextThread() Rejected unauthorized PC/SC client

分析

仔细分析这个日志可以看出来，这是一个异常调用栈的输出，而这里的症结是 user: 1000 没有 access_pcsc 权限。

通过查看 polkit 文档，我们知道，polkit 是为了使低优先级进程 (pcscd) 和高优先级进程(驱动程序)通信而设计出的权限管理工具集。

解决

想要授予权限，需要新增配置文件 051-org.debian.pcsc-lite.rules (文件名可自定义，以 .rules 结尾即可) 到 /etc/polkit-1/rules.d/ 目录。其中 050 为默认规则，050 之后为自定义规则，050 之前是需要对默认规则的补充

配置文件如下：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15


polkit.addRule(function(action, subject) {
    // 这里我把 wheel 组的用户都赋予了 access_pcsc 的权限
    if (action.id == "org.debian.pcsc-lite.access_pcsc" &&
        subject.isInGroup("wheel")) {
        return polkit.Result.YES;
    }
});

polkit.addRule(function(action, subject) {
    // ditto ...
    if (action.id == "org.debian.pcsc-lite.access_card" &&
        subject.isInGroup("wheel")) {
        return polkit.Result.YES;
    }
});

调试技巧

polkit 配置文件的语法和 JS 十分相似，这里可以使用 polkit.log 来做调试输出，其他的方法和说明在 polkit 文档中说的很清楚¹。

调试过程中需要多注意日志，如果出现 Error compiling script 这样的关键字，就说明有编译错误，此次更改不会生效。

Polkit 文档 ↩︎

countu 游泳计数器 (安利)

20190812T22:32:00.008Z

前言

在学会自由泳后，小米手环在使用过 8 次之后光荣的出故障了。

选项

于是在 JD 和 TB 上寻找靠谱的替代品：

Moov Now 游泳智能手环：￥399.00
Swimovate PoolMate2 标准版：￥790.00
Swimovate PoolMate Live 灵动版 + Swimovate PoolMate Live灵动版USB数据夹：￥945.00 + ￥335.00
GARMIN Forerunner735：￥2280.00
COUNTU 2018：￥ 288.17
SportCount：￥ 238.00

最终的选择如标题所示，COUNTU 2018

理由

Moov Now 本是首选，不过在看了几篇测评之后，发现其测试精准度依然一般。因为有小米手环的前车之鉴，就 PASS 掉了。

Swimovate 的两款单独列出来是因为价格和功能，在理论上，这两款表的测量精准度达到了专业级别，Live 版多了一个数据导出的功能，但是要配合买一个 USB 数据夹。只考虑测量准确性的话，买 Swimovate PoolMate2 标准版就足够了。待定。

GARMIN Forerunner735 是专业的铁人三项用表了，只是价格不太美丽，PASS。

还剩两款非手环形态的选项：COUNTU 和 SportCount，这两款其实是在全网能买到的指套型计数器中针对游泳的唯二选择。其中 SportCount 的操作和显示据说比较蠢，而 COUNTU 作为一个国产品牌做了很多人性化的小优化。

最终就是在 Swimovate 和 COUNTU 中选择了一个更硬核更便宜的一个：COUNTU。

自由泳的学习回顾

20190714T15:06:00.008Z

简介

夏天来了，工作之余打算通过游泳保持日常的运动量。

当然这个选择也不算是破天荒，还在北京工作时，当时的 leader 就申请了游泳卡，带我们在公司旁边的游泳馆每周去一锻炼一次。每每想起，还能回忆起那时游泳完就在公司后面吃点煎饼果子再回去工作的样子。

基础

这时有必要提一下我的游泳经历了：

高考后，亲戚买了一些当地的游泳票送我，我那个暑假大概就去了十几次
大二时游泳课，办了学校的游泳馆的年卡（后来主要用来洗澡了）
北京工作后，leader 带着去游泳馆锻炼

这里可以看出，我接触游泳很晚，而且去泳池基本就是打个酱油。至今仍然在浅水区学习。

现在的公司说是给报销一定的健身费用，于是我报了家附近的游泳班，接下来就说一下我在游泳班中，以及游泳班后的练习经历。

学习

在游泳馆报了成人班学蛙泳，时间是每周一至周五的晚上七点半到八点半授课。而我计划的学习时间是每周一、二、四的下班后。

第一周，带着陌生感去上课。跟教练说明了自己的水平，在教练面前游了一小段「蛙泳」。教练看后摇摇头：你还是学自由泳吧，你的蹬腿像蝶泳。

于是我就开始了自由泳的学习：

扶岸打腿
扶漂浮板打腿
扶漂浮板打腿 + 单侧划手
扶漂浮板打腿 + 划手 + 高肘移臂
扶漂浮板打腿 + 单侧划手 + 换气
扶漂浮板打腿 + 划手 + 换气
漂浮板 + 配合
脱板配合练习 9-12. 配合练习

除了在游泳班中的学习，我也在视频网站上寻找些视频教程。我目前在看的就是「梦觉教游泳 – “自由泳入门第二版”（含字幕）」受益匪浅。

其中几个对我比较重要的知识点：

侧身打腿
换气
训练计划

这里解释一下「训练计划」这个知识点，对游泳水平的提高很有帮助：即每次下水前，将本次游泳要进行的训练先规划出来，比如我目前是 200 米打腿训练 + 针对动作训练 + 1.5km - 2km 的配合训练。

这样有计划的训练，比单纯的每次练习配合游或者冲刺游高效得多，也不会太枯燥，使得水平可以有肉眼可见的提高。

成果

目前按照每周两次的频率去游泳，每次 1500-2000 米左右的配合训练。目前由于换气还不够顺畅（会分心），单次游超过 100 米还有困难。但换气的呛水和假呼吸已经得到改善，单次游 50 米已经不再有障碍 :)

OpenResty 开发速览

20190124T21:42:02.008Z

简介

Openresty 是一个基于 Nginx 和 Lua 的高性能 Web 平台。其主要组成部分为：

Nginx¹
Lua 虚拟机
lua-nginx-module: 将 Lua 虚拟机嵌入 Nginx 中，并提供Nginx API 供 Lua 调用的项目。在 Lua 层面可以通过使用这些 API 达到非阻塞的效果，这主要归功于 cosocket 和 nginx event 模型
stream-lua-nginx-module: 与 lua-nginx-module 功能相似，区别是 lua-nginx-module 提供的是 nginx 的 http 模块的 API，而 stream-lua-nginx-module 提供的是 nginx 的 stream 模块的 API。
lua-resty-core: 使用 FFI，提供了一系列 Lua 层面通用的 API
lua-resty-*: 在以上几个模块的基础上，封装了一系列常用服务的模块。如: lua-resty-redis/lua-resty-mysql/lua-resty-http

开发

在基于 Openresty 的开发中，要同时了解 Nginx 和 Lua 的工作原理，再去进一步了解 lua-nginx-module 的原理。这样才能有一个在性能与可维护性之间良好的平衡的项目。

1. Nginx

在基于 Openresty 的开发中，首先要认清 Nginx 在整个项目中的角色。典型的角色有如下几种：

反向代理服务器
Web Server 本身
正向代理服务器

考虑到使用 Openresty 开发的项目一般偏向服务端，故在这里只讨论前两种情况

1.1 反向代理

这是 Nginx 的典型用法，即作为网关或者负载均衡的前端，直接接收外部请求，做简单处理后，使用 upstream 功能将流量代理至后端。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17


+---------+---------+    +------------------------+
|         |         |    |                        |
|         |         |    |    Web server          |
|         |         |    |                        |
|         |         |    +------------------------+
|         |         |
|         |         |    +------------------------+
|         |         |    |                        |
|   Lua   |Upstream |    |    Web server          |
|         |         |    |                        |
|         |         |    +------------------------+
|         |         |
|         |         |    +------------------------+
|         |         |    |                        |
|         |         |    |    Web server          |
|         |         |    |                        |
+---------+---------+    +------------------------+

画一个典型的角色框架图。其中将 Openresty 的部分抽象为由 Lua 负责的网关逻辑层面，和由 Nginx 负责的 Upstream 功能的层面。

这里还是着重讲 Nginx 在这种架构中的作用：

接受请求
1. 若 nginx 工作在 master-worker 多进程模式下，多个 worker 进程监听同一端口，就要面临一个 “惊群”问题：即多个进程同时被连接事件唤醒，但实际处理连接的只是其中一个进程。这里 nginx 采用了 ngx_accept_mutex 同步锁的机制来解决该问题。²
2. 多进程之间的负载均衡问题：使用负载阈值来表示进程的负载情况，从而动态平衡多进程之间的负载
简单的路由功能：这里主要指的是 nginx 配置文件中设置的多个等级的关键字，如 http/server/location，提供简单的路由功能（当然也可以设置复杂的路由，不过我倾向于将复杂的路由部分交给 Lua 代码来完成）
提供hook 点，供 lua-nginx-module 载入 lua 虚拟机及代码：这里就是指 Nginx 的模块挂载点了。这些挂载点将请求的声明周期细分为多个阶段，每个阶段又有明确的作用，方便程序的模块化管理。³上述的阶段细分是提供给 nginx module 开发者的，nginx module 在进行一个模块的具体功能开发前大致有几样要做的事情：初始化配置指令数据结构、模块上下文、处理配置指令冲突、注册模块，然后这时才能开始开发模块的具体功能。而 openresty 在提供了多个 hook 点，并在相应的 hook 点暴露了适当的 API 之后，开发的成本大幅降低
upstream 功能

1.2 Web Server

在这种架构中，我一般的做法是：

将简单的路由部分交给 Nginx 配置文件，再将响应用户请求的 Lua 程序通过 lua-nginx-module 提供的挂载点运行起来

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11


server {
    listen 80;
    server_name example.com;

    location /backend/ {
        content_by_lua_block {
            local handler = require "handler"
            handler.go()
        }
    }
}

如果这里需要使用现成的 web 框架的话，可能会看到 Vanilla 之类的框架。

我个人还是更倾向于多种轻量级的模块综合：

路由部分使用简单的 lua table
在渲染页面或者结果时使用 openresty/lemplate
访问数据库或者发起 http 请求的话就使用 lua-resty-* 系列的模块

这样开发出来的 web server 优点如下：

打包方便，可以不用 luarocks 工具（其实 openresty 官方提供了 opm 工具来解决 lua-resty-* 的依赖）
部署方便
简单的模块化

2. Lua

这里有 Lua 源码的简单解析，就不再赘述了。

lua 源码系列文章:

使用 table.new 来申请已知大小的 lua 表，因为 table.new 调用的 lua_createtable() 函数在 LuaJIT 中是可以被优化的。还有一个优点是预分配了表的大小，防止了表在增长时的资源消耗。
使用本地变量将由 lua-nginx-module 或 lua-resty-core 提供的 API 返回的结果缓存。可以通过减少不必要的栈操作来减少消耗。
注意 lua 中的 __gc 元表方法在某些模块中的应用，防止由于触发 __gc 而导致的奇特BUG⁴
注意在 openresty 中，lua 层面的代码应当避免IO的阻塞：如使用 lua 原生的 os 库读写本地文件、系统调用，这会影响整个 nginx worker 的运行

3. lua-nginx-module

这里主要讲的是 lua-nginx-module 中的一些重要配置。

lua_code_cache: on|off: 关掉代码缓存的结果就是每个请求运行一个单独的 Lua VM 实例，即对 lua 代码的改动可以即时生效。这个特性建议仅在调试时打开。有些模块的功能可能会依赖于代码的缓存
lua_package_path / lua_package_cpath 这两个指令直接决定了 nginx 是否能找到你要引用的 lua 模块，所以非常重要

其他的指令文档也可以通过 openresty/lua-nginx-module 官方文档清晰的看到。

4. 工具

openresty/openresty-devel-utils: 在这个库里有许多 openresty 相关开发过程中要使用的一些方便的小工具，如：
1. lua-releng: 对 luac 命令行的一个封装，将多个 openresty 提供的全局变量纳入正确范畴内
2. reindex: 主要是针对基于 Test::Nginx模块下的测试文件的一个语法格式检查
spacewander/luacov-console: 与 luacov 工具结合，在终端生成彩色的代码覆盖率，稍作处理就可以当做 CI 工具链中的代码覆盖率数据来源
Test::Nginx: 是 openresty 官方在用的数据驱动的测试框架

Hugo 迁移记录

20190118T15:40:05.008Z

前提

前几天想实现一个在博客的 front-matter 中加入一个标签来区分生活类文章和技术类文章，在首页的表现为链接的颜色不同的功能。

问题

在 Hexo 官网及 Google 中寻找解决方案的过程中发现了几个问题：

Hexo 使用的默认模板 paularmstrong/swig 已经不再维护了¹
在 Hexo 官网看文档时依然简陋，

之前在 hexo + gitlab 服务隐藏静态文件中提到的：

之前有过使用 hexo 的经验，又加上 node 的生态在个人博客这里又异常繁荣（大量node相关的第三方插件可用），还是决定迁移过来了。

其实也是造成问题一的原因之一。关于问题一在 hexo 的 github issue 中也有讨论：Why not totally replace Swig with Nunjucks? #1593，其中 mozilla/nunjucks² 作为 Swig 模板的升级，可以作为 Swig 不再维护后的替代品。但 hexo 项目这边对默认模板的替换就没那么迅速了。³

问题 2 则是由来已久，对主题开发者不友好的程度有点高。这里可以看其中一位主题开发者的感受 https://blessing.studio/get-hexo-posts-by-category-or-tag/ :

今天在将博客主题移植至 Hexo 时，想要获取某个分类（Category）或者标签（Tag）下的所有文章（准确来说是想获得文章总数），在使用中文关键词搜索时，没有获得任何有用的信息（或许是我搜索姿势不对）。换用英文关键词「hexo category all posts」后搜索到了所需的信息，遂决定写一篇文章记录一下，希望能帮到后来人。~~~~

这里不得不吐槽一下，Hexo 的文档真是太烂了，太烂了。写个主题，有时候想要实现一个功能还要疯狂看 Hexo 源码，说不出话。

解决方案

我的解决方案如下：

方案1：保持 swig 模板不变，通过搜索引擎寻找类似的实现方法。
方案2：使用 nunjucks 插件使 hexo 支持该模板，再实现该功能。
方案3：更换至 Hexo 支持的其他模板引擎，如 hexojs/hexo-renderer-ejs、https://github.com/hexojs/hexo-renderer-haml、hexojs/hexo-renderer-jade，重新实现主题之后，顺便实现该功能
方案4：更换至其他静态博客生成平台

我的解决过程正好是按照我列举的顺序来的

方案 1

由于 hexo 对 front-matter 自定义的部分需要涉及 hexo 引入脚本，而我并不想在 hexo 这个框架本身花费过多时间。于是放弃。 在过程中，我使用了另一种方法：用一个不常用的 front-matter 字段用来标识链接颜色（我使用的是 layout 这个变量）。实际效果也实现了类似的效果，可是代码看上去很容易让人困惑。⁴

方案 2

nunjucks 只有几个 hexo 相关插件，hexo-renderer-nunjucks 和 hexo-nunjucks，打开来看就知道这两个项目的最后更新时间都锁定在三年前。于是放弃。

方案 3

这几个模板引擎直接由 Hexo 官方的支持，然而在实际使用的时候，还是觉得那个过了时的 swig 会稍好一点（主要是符合我对模板的印象）。于是放弃。

方案 4

先列一下备选项：⁵

JavaScript: Next.js & Gatsby (for React), Nuxt & VuePress (for Vue), Hexo, Eleventy, GitBook, Metalsmith, Harp, Spike.
Python: Pelican, MkDocs, Cactus.
Ruby: Jekyll, Middleman, Nanoc, Octopress.
Go: Hugo, InkPaper.
.NET: Wyam, pretzel.

我最终在这些中选择了 Hugo，主要是因为最近正好在学习 Go。而 Hugo 使用的 “text/template” 也算是一个 Golang 的一个标准扩展模块了，应该不会像 Hexo 那样多模板之间来回跳转^(问题1)^。 Hugo 的官方文档也是肉眼可见的多^(问题2)^。

实现

确定了解决方案，再理一下选择当前解决方案后要做的事：

文章迁移
模板迁移⁶
功能实现
部署方案

1. 文章迁移

其中，由于同是 markdown 写的文章，迁移大概就是一条 cp 命令。这里就不详述了。

2. 模板迁移

在模板的部分，基本就是像素级的 COPY：将 swig 模板实现的功能按行级别的使用 text/template 实现。当然语法风格是按照 Hugo 官方文档中的来写。在过程中还是遇到了几个小难点，这里将解决方案也一并贴出来：

在实现 /tags/ 页面的时候，需要先将文章按照标签分组，再依次将各组标签中的文章遍历出来。在 text/template 中，变量的作用域非常奇怪，代码如下：

1
2
3
4
5


{{ $v := "init" }}
{{ if true }}
    {{ $v := "changed" }}
{{ end }}
v: {{ $v }} {{/* => init */}}

这一段代码以直觉判断，$v应该是输出 "changed"。然而实际结果有点意外。我对此情况的理解：在 text/template 的实现中，每个代码块拥有独立的作用域，这个作用域在遇到嵌套时也不会发生继承。这样实现起来的代码应该是最干净并简单的。遇到这种情况，官方的建议是使用 .Scratch 来创建一个页面级作用域可读可写的变量，然而这对于主题模板来说有点重了。

在 Google 的帮助下，找到这样一段 gist: https://gist.github.com/Xeoncross/203d8b1459463a153a3c734c98b342a9

1
2
3
4
5
6
7


         <ul class="tags">
            {{ range $name, $taxonomy := .Site.Taxonomies.tags }}
              <li><a style="text-transform: capitalize" href="#{{ $name | urlize}}">{{ $name }}a>
                
              li>
            {{ end }}
          ul>

在有目录的文章中，发现自动渲染出的目录会有空的 · 出现。

在某些文章中，我的小标题是以

来标识的，而自动生成目录的模板却没弄自动去掉未使用的

和

1
2


·    ·    · 三级标题 1
          · 三级标题 2

这在 Hugo 的 Github Issue 中也有体现：Heading levels in Markdown table of contents #1778，而这里又牵涉到另外一个问题，就是 Hugo 使用的 markdown 渲染模板 russross/blackfriday 在 Hugo 中还是 v1 的版本，而 v1 版本解析 markdown 后的输出结果是一段 HTML，因为这个，在生成 .TableOfContents 的时候有这样一段很丑陋低效的代码：https://github.com/gohugoio/hugo/blob/master/helpers/content.go#L416

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37


func ExtractTOC(content []byte) (newcontent []byte, toc []byte) {
    if !bytes.Contains(content, []byte("")) {
        return content, nil
    }
    origContent := make([]byte, len(content))
    copy(origContent, content)
    first := []byte(`
`)

    last := []byte(`
`)

    replacement := []byte(`
`)

    startOfTOC := bytes.Index(content, first)

    peekEnd := len(content)
    if peekEnd > 70+startOfTOC {
        peekEnd = 70 + startOfTOC
    }

    if startOfTOC < 0 {
        return stripEmptyNav(content), toc
    }
    // Need to peek ahead to see if this nav element is actually the right one.
    correctNav := bytes.Index(content[startOfTOC:peekEnd], []byte(`))
    if correctNav < 0 { // no match found
        return content, toc
    }
    lengthOfTOC := bytes.Index(content[startOfTOC:], last) + len(last)
    endOfTOC := startOfTOC + lengthOfTOC

    newcontent = append(content[:startOfTOC], content[endOfTOC:]...)
    toc = append(replacement, origContent[startOfTOC+len(first):endOfTOC]...)
    return
}

在这里是用处理字符串的方法来解析 .Content 中的内容，再将其要生成的内容拼凑成几块，再加到原内容中。这个问题在 blackfriday.v2 中得以解决，即输出一个 AST 再交由其他程序处理，这样也能保证后续版本的兼容性。但在 Hugo 中，作者也是多次推迟该特性的里程碑 Upgrade to Blackfriday v2 #3949⁷。

但是在 Issue 讨论中，各路大神也提出了自己的解决方案，可以点进 Heading levels in Markdown table of contents #1778 中去查看详情。我采用了这其中的模板解决方案：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13


            {{ $toc := .TableOfContents }}
            {{ $toc := (replace $toc "\n\n" "") }}
            {{ $toc := (replace $toc "\n\n" "") }}
            {{ $toc := (replace $toc "\n\n" "") }}
            {{ $toc := (replace $toc "\n" "
") }}
            {{ $toc := (replace $toc "\n" "
") }}
            {{ $toc := (replace $toc "\n" "
") }}
            
            
            {{ if gt (len (split $toc "")) 2 }}
              {{ safeHTML $toc }}
            {{ end }}
          {{ end }}

这个方案在日后的特性版本合并后可以简单的移除模板中的相应部分。算是比较简便的一种。

3. 功能实现

模板迁移完成之后，就开始把最初想实现的功能实现出来。在 Hexo 中，front-matter 可以填写用户自定义的字段（文档见：https://gohugo.io/variables/page/#page-level-params）。我这里选择使用 linkcolor 字段。

1
2
3
4


---
title: test
linkcolor: #7076c7
---

再在主页遍历标题的地方加入该变量的判断：

1
2
3
4
5
6


{{ if .Params.linkcolor }}
{{ $color := .Params.linkcolor }}
<a href="{{ .Permalink }}" class="post-list-item" style="color:{{ $color }};">
{{ else }}
                    <a href="{{ .Permalink }}" class="post-list-item">
{{ end }}

我觉得每次写一个抽象的颜色 #7076c7 看起来不好看，又在 data/color.toml 目录中加入以下内容（文档见：https://gohugo.io/templates/data-templates/）

1
2


[link]
blue = "#7076c7"

修改主页模板

1
2
3
4
5
6


{{ if .Params.linkcolor }}
{{ $color := index .Site.Data.color.link .Params.linkcolor }}
<a href="{{ .Permalink }}" class="post-list-item" style="color:{{ $color }};">
{{ else }}
                    <a href="{{ .Permalink }}" class="post-list-item">
{{ end }}

这样在 front-matter 中只需要写 linkcolor: blue 就可以达到相同的效果了。之后想有其他的颜色相关扩展功能，也可以方便的实现。

4. 部署方案

这里官方文档讲的很详细，我是使用 Netlify 平台发布博客的，文档在 https://gohugo.io/hosting-and-deployment/hosting-on-netlify/ 其他常用平台在文档中也有讲到。

这里主要是讲对老博客的提交记录的迁移，我这里使用了将 Hexo 博客的文件及目录放入一个单独目录 hexo_archive 中，将 Hugo 平台的代码放在项目根目录中，这样，之前的提交记录和文件得以保留，又留下了一个对于 Hugo 相对干净的目录。

Friends

https://printempw.github.io/: PRIN BLOG。半吊子全栈开发者的日常。
https://nachtzug.xyz/: Nachtzug 「夜行列車」
https://blog.rexskz.info/: 音游狗、安全狗、攻城狮、业余设计师、段子手、苦学日语的少年。

TCP/IP 知识串联

20181217T09:44:08.008Z

这里主要采用文字叙述，来试图阐释这个过程，用来梳理知识点和查缺补漏。如果其中的叙述不准确，还请谅解。

Q: 浏览器输入地址敲回车开始，到收到响应为止的过程，阐述其中的细节。

前提

复杂的程序都需要分层。

概览

按照OSI七层协议来讲这个过程，重点是OSI的二层–数据链路层（以下简称MAC层）、三层–网络层（以下简称IP层）、四层–传输层以及应用层中的表现。到达应用层后，讲一下CDN的原理与常用架构。再简单讲一下数据中心的架构。

OSI 七层 vs TCP/IP 四层

OSI 的七层模型是一个开放式系统互联的参考模型，而 TCP/IP 协议簇是一组用于实现网络互联的通信协议。 OSI 的七层分别为: 物理层、数据链路层、网络层、传输层、会话层、表示层、应用层。记忆口诀： All People Seem To Need Data Processing

TCP/IP 的四层分别为：接口层、网际层、传输层、应用层。其中TCP/IP模型中的接口层对应着物理层和数据链路层，而应用层对应着会话层、表示层、应用层。

数据链路层

每个联网的设备都有一个唯一的硬件地址，即我们常说的 Mac 地址，Mac 地址用于在广播域中寻找对应的设备。Mac 地址虽然有唯一性，但是没有可定位性，所以出了广播域后则使用 IP 协议来进行通讯。

二层设备可以进行Mac地址与端口对应设备关系的缓存，可以缓存同一广播域内的设备。其中Mac地址与IP地址的对应关系可以缓存在本地路由设备中，称之为路由表。而在已知IP未知Mac地址时，可以发起ARP请求来查询Mac地址。

网际层/网络层

浏览器中输入的一般是域名，域名通过 DNS 解析为IP。

首先判断对应IP是否在同一网段内，即通过CIDR来判断，若对应IP不在同一网段，则请求通过网关利用路由协议去寻找对应的网络和设备。当经过中间的路由设备（三层）时，先比对Mac地址是否一致，再比对IP地址是否一致，看是否为发给自己的包还是需要转发出去。

路由协议

路由分为动态路由和静态路由。这里的路由协议即动态路由协议。

距离向量路由协议

基于Bellman-Ford算法, 路由器将部分或全部的路由表传递给与其相邻的路由器

RIP: 1. 使用跳数作为度量值 2. 最大跳数为 15 3. RIP v1 中会定期同步整个路由表

BGP: BGP可以看作一个高级距离向量路由协议。在BGP系统中，可以将网络分为多个自治系统。自治系统内部使用iBGP来同步路由信息，而自治系统之间使用eBGP广播路由。自治系统：一个(或多个)实体管辖下的所有IP网络和路由器的全体。自治系统由IANA分配一个ASN(自治系统编号)，从而在互联网的ISP之间运行BGP协议。 ASN: 一个16位的编号，现在已经有32位的写法：<高十六位的十进制数字>.<低十六位的十进制数字>

自治系统分类： 1. Multihomed As(多出口自治系统)：多与一个连接的自治系统。这类系统不允许其他自治系统穿过它去访问另一个自治系统。 2. Sub As(末端自治系统)：仅与一个其他自治系统相连的自治系统。 3. Transit As(中转自治系统)：一个自治系统通过自己提供将几个隔开的网络连通的服务。这就是 ISP 的实质。

BGP 的使用条件： 1. 需要支持存储大型路由表的路由器 2. 需要多个连接 3. 有足够的带宽传送所需数据（包括路由表）

最短路径优先算法

基于 Dijkstra 算法, 路由器将链路状态信息传递给在同一区域内的所有路由器

OSPF: 1. 使用组播发送链路状态更新，在链路状态变化时使用触发更新，提高了带宽的利用率 2. 无最大跳数限制，且以延迟和开销的作为度量值

IGP 与 IBGP 的区别与联系

IGP 包括了 OSPF/RIP 等协议，是在自治系统内部使用的路由协议，其主要作用是发现与计算路由。而 IBGP 也是在路由系统内部使用的路由协议。两者的区别是： 1. IBGP 会将路由发现的工作全交给 IGP，而其本身着重于路由的控制。 2. IGP 对于大型路由表的处理能力很差，而IBGP则可以将其分层处理。 3. 若直接将 BGP 的路由信息交给 IGP 处理，会丢失其中的路由属性，从而有路由环路的隐患。而IBGP可以处理这些路由属性(第一条)

网关

第一种，在出网关之后目标Mac地址变为下一跳设备的Mac地址，而来源IP和目的IP始终不变，直到到达指定设备。该方法适用于无冲突IP地址的场景，而在IP地址重叠时就需要另一种NAT网关了。

第二种，即NAT网关，在请求出了网关之后，来源IP和Mac都变为网关的，而目的IP不变，到达下一跳。当响应到达时，再将目的IP和Mac映射回去。

DNS

DNS 是一个用来做域名与IP地址转换的分布式数据查询系统。在客户端发起DNS查询之后，会先查询本地DNS服务器，即运营商或路由器上配置的DNS server，如果没有记录则会查询根域名服务器，根服务器会将顶级域名的服务器地址返回，顶级域名服务器将权威域名服务器地址返回。其中客户端向本地服务器发起的是递归查询，而本地dns服务器向上查询则是迭代查询。

传输层

在 IP 包头中标识着传输层的协议类型，常见的有 UDP 和 TCP。

UDP

UDP 是不面向连接的协议。其继承了 IP 协议的大部分特点：如按包发送、无状态、无序、无拥塞控制。简单来说，就是一个不维护状态的传输协议。在 UDP 的包头中，只有源端口号和目的端口号来标识连接。在简单的环境、内网及允许丢包的场景中可以使用。也可以在应用层实现状态的维护，从而变成一个可靠的连接。

TCP

TCP 是面向连接的协议。所谓连接即一系列状态的更替。维护了一个复杂的状态机之后，使连接变得有序、可靠、控制拥塞等功能。但 TCP 的底层 IP 协议是无连接和无序的，所以 TCP 实现这些特性大量使用了重传算法和拥塞控制算法。

三次握手：请求端发起SYN包想建立连接（SYN_SENT），接收端收到SYN包之后返回 ACK + SYN 包(SYN_RCVD)，请求端收到 ACK 包之后(ESTABLISHED)，再响应对端的 SYN 请求一个 ACK，对端收到 ACK 包，则状态变更为 ESTABLISHED。此时，两端均完成了一次收发包，状态为 ESTABLISHED，连接建立成功。

四次挥手：请求端发起 FIN 包想要终止连接(FIN_WAIT_1)，接收端在收到 FIN 包后返回 ACK(CLOSE_WAIT)，发起端接收到 ACK(seq=k+1) 则进入 (FIN_WAIT_2)，当接收端处理完毕上层逻辑后，返回 FIN + ACK 包（seq=k+1），发起终止连接(LAST_ACK)，发送端在收到这两个包之后，响应 ACK 包，并进入 TIME_WAIT 状态，等待两个 MSL 后关闭连接。而接收端在收到 ACK 后也关闭连接。TIME_WAIT 状态是为了防止接收端没收到最后一个 ACK 包，从而发起 FIN + ACK 重试。

应用层

http

看网页一般使用的是 http 协议来传输数据。http 是基于 tcp 应用的协议，在http中请求与响应的报文均为明文。请求报文分为：请求行、请求头、请求体，其中请求行可以细分为请求方法和请求地址。响应报文分为：响应状态、响应头和响应体。其中响应状态分为响应码和原因。

常用的请求方法有: GET/POST/PUT/DELETE/OPTION 常见的响应码有: 200 OK/201 Created/301/302/403 Forbidden/404 Not Found/405 Not Allowed/500 Internal Error/502 Bad GateWay/503 Service Unavaliable/504 Gateway Timeout

keepalive

其中 TCP 协议中有 keepalive 概念，在 http 中也有 keepalive 概念且在 http/1.1 后会默认开启。其中 http 的 keep-alive 是允许客户端通过同一个 tcp 连接发送多条请求，而 tcp 的 keep-alive 则是通过心跳来让 tcp 连接保活的一种机制。两者没有直接的联系。

https

由于 http 的请求和响应报文均为明文，在对安全要求高的场景就不适用了。这时就引入了 https。 https 是使用非对称加密交换密钥，交换密钥后使用对称加密的基于 http 的协议。双方进行握手的流程是这样的：

由客户端发起 client hello，主要是用来商议加密协议版本、压缩算法、一个随机数c1以及SNI等信息
服务端响应 server hello，告知客户端采用的加密协议版本、压缩算法、以及在服务端生成的随机数s1，这时会将客户端生成的 c1 存起来备用
服务端还会响应 server certificate 即服务端的证书信息供客户端查验。
最后响应 server hello done 包告诉客户端 hello 信息结束
客户端在校验证书合法后（将证书的信息做一个散列计算和CA上的签名用CA提供的公钥解密后对比），生成 pre-master-key 即对称加密的密钥。
将随机的 pre-master-key 传输给服务端，即 client key exchange
客户端发起 change cipher spec，即更改加密协议，由不对称加密改为对称加密
客户端发起 encrypted handshake message，即使用 c1 + s1 + pre-master-key 加密过的信息传输给服务端
服务端也发起 change cipher spec
服务端同样发起 encrypted handshake message 这样双方的 ssl 握手就完毕了。开始传输加密数据了

漂

20181109T08:34:57.008Z

从毕业后到2018年，搬家已有8次，算是真实的漂泊一族了，其中在2015年从北漂换成了深漂。在这里记录我第八次搬家的一些情况：

找房

几乎在我开始待业的同时，我就开始关注租房子的事情。大体要求是：

房间较大，大一居或者小两居
户型正常
小区安静
离地铁两公里以内或者有班车经过
预算较去年的房租多100元
与房东直签、且房东好沟通

按照这样的要求找了三天，有三个备选项：

房屋A：优点是小区安静、房租便宜。缺点是离地铁2.6公里，且周围没有任何商业区。
房屋B：优点是房子较新。缺点是空屋无家电，若需要配齐则每月房租要加1k左右。
房屋C：优点是小区安静、房间大、房东好沟通。缺点是房屋较老，无电梯、某些家具老化严重。

最终在各种取舍下，选择了房屋C。

搬家

回顾整个搬家的过程，正好用了一周时间。

周一：租车将简单衣物和床垫床单及清洁用品搬来。将床垫床单晾晒，备用。周二：在家中整理物品，待搬。周三：将锅碗瓢盆等易碎物品搬来。周四：将部分小件物品搬来。将沙发罩清洗晾晒。办理宽带移机。周五：预约搬家公司，将所有物品打包整理。家具清空。房屋C这边打扫干净并消毒。周六：上午跟随搬家公司将物品搬至房屋C。下午则日租了共享汽车，将剩余物品分三次搬往新家。期间将衣柜与收家具的奸商谈好价格，并在第二次搬家的间隙预约师傅将电视挂在墙上。三次搬完后，已经是凌晨1点多了。周日：上午又搬了一次厨房用品和冰箱食物，将衣柜售出。更换浴室淋浴头，洗澡休息。晚上吃了波龙，收工。

收获

租房方面：租房子要求明确的话，快速筛选出两三套合适的，然后在其中做取舍。开车方面：考完驾照后其实很少开车，自己又胆怯。但这次搬家，开车往返七趟，并在小区的严酷环境中穿梭。开车时的胆怯已经不见，甚至在拥挤的车潮中，还会听广播来放松了。可喜可贺。整理方面：多准备纸箱，如果是楼梯房的话需要大小适中，不然一个沉甸甸的箱子搬上楼，会腰酸背痛。

搬家方面：在观察搬家小哥的过程中，突然体会到工作的重要性。

我自己之前也搬了几次东西上下楼，对比起搬家小哥的效率，差了一大截。

一方面是各种工具的运用，还有就是身体素质的不同。只有「工作」这个概念才能把这样一批专业的人聚集在一起，而在重复工作的过程中，又会总结出许多提高工作效率的技巧。

负责开货车的师傅呢，只是负责把车开进开出，及操作货箱升降，并不去搬家。

工作分工的不同，可以使人们在垂直领域有更多时间深耕，避免了学习精力被分散。

假期

20181030T22:29:10.008Z

裸辞后，久违的假期让我如临大敌，相比在工作时的忙忙碌碌，心中却更不轻松些。在我的视野范围内，发生了一波一波的离职潮。可这些人终将又该去向何处呢？像跳槽太急，就是从一个坑跳进另一个坑这样的老生长谈般的文章¹，也算是看过不少了，其中有一条建议很中肯：

也是想给各位跳槽的朋友敲个警钟，如果你要跳槽，哪怕多讨厌现在的工作，都不要随便跳进其他工作里。一定要明白自己为什么跳，思考自己想要的是什么。如果确实想走，又确实没有找到适合的，宁愿裸辞，贫穷一小会儿，也不要让自己进入一个新的坑。因为新的坑，会让你感到更绝望，同时也破坏了自己的职业稳定性。

希望我能在这潮水中保持初心，等到真正合适自己的【坑】。

在这里列一下假期中在做的事：

总结之前工作中的知识点，将其沉淀成文字。并把其中模糊的部分通过学习，弄明白。
找房子租：目前的房子租期将至，希望能找到住起来舒心的房子。
休息 :)

还望忽略其中塔罗牌的部分，这也是我在浏览时目光自动跳过的部分 ↩︎

老博客文章迁移

20181010T19:14:00.008Z

由 http://yihui.name/cn/2018/09/countryman/ 文章中的 http://disq.us/p/1wev2g5 这条评论想到

哈哈，十三年前的日志是回忆当时三年前的事。所以就算是为了这种酷，也要坚持写博客啊。

我在不同博客平台¹ 之间辗转过多次，也因为域名主机等问题放弃维护了一些文章，而目前可查的文章居然是 2013-2014 年在 github 上留底的 jekyll 搭建博客期间的文章。算一算竟也是 5年前了。

动手把文章迁移过来，以增加博客的历史厚重感，可以在博客的页脚看到 since 2013 了 :)

Wordpress -> jekyll -> bitcron -> hexo ↩︎

tmux 与 vim 开启 true-color 支持

20180929T11:23:02.008Z

受 http://blog.acgtyrant.com/%E5%9C%A8-Linux-%E4%B8%8B%E5%85%A8%E9%9D%A2%E4%BD%BF%E7%94%A8%E7%9C%9F%E5%BD%A9.html 这篇文章启发，知道了在终端的世界里有高于256色的True-Color的存在¹。对于常年不离开终端的重度Vim用户来讲，这种多色彩的支持的吸引力也是致命的。

概览

想要真正的多色彩支持，需要 模拟终端 + tmux + vim 三重的支持。这里说明下我的编程环境：windows 虚拟机(Ubuntu 18.04) + SecureCrt + Tmux + Vim 8.1。于是我要做的就是在这几点上分别做True-Color支持。

模拟终端

我在Windows上偏爱使用的模拟终端是 SecureCrt，但，我在查阅 True-Color 支持列表时https://gist.github.com/XVilka/8346728#now-supporting-truecolour却发现 SecureCrt 不在支持之列。在试了几个Windows支持的虚拟终端之后，最终选定了 MobaXTerm。

至于原因，无外乎其与 SecureCrt 相似的操作逻辑，以及提供 Personal Edition。

至于配色偏好，我依然选了墨绿色背景的 solarized 主题。²

tmux

这里采用网上常规的方法没有行得通，经多方搜寻，找到了 http://lists.gnu.org/archive/html/emacs-devel/2017-02/msg00635.html 更改 terminfo 使得 tmux 支持 Tc (True-Color) 的方法。（这里我采用了git上最新的 tmux 源码编译的 tmux）

常规方法，更改 $HOME/.tmux.conf 文件：

1
2
3


# ！！！importent！！！ 开启24 bit color 其他方式都无效
set -g default-terminal "tmux-256color"
set -ga terminal-overrides ",*256col*:Tc"

更改 Terminfo 方法（实测有效）:

1
2
3


/usr/bin/infocmp > /tmp/.infocmp
echo "  Tc," >> /tmp/.infocmp
/usr/bin/tic -x /tmp/.infocmp

校验 True-Color 的方法：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13


awk 'BEGIN{
    s="/\\/\\/\\/\\/\\"; s=s s s s s s s s;
    for (colnum = 0; colnum<77; colnum++) {
        r = 255-(colnum*255/76);
        g = (colnum*510/76);
        b = (colnum*255/76);
        if (g>255) g = 510-g;
        printf "\033[48;2;%d;%d;%dm", r,g,b;
        printf "\033[38;2;%d;%d;%dm", 255-r,255-g,255-b;
        printf "%s\033[0m", substr(s,colnum+1,1);
    }
    printf "\n";
}'

效果图：

vim

这里要改的点主要有三个：

按照文档中方法的更改 .vimrc 文件

1
2
3
4
5
6
7
8


if has("termguicolors")
    " fix bug for vim
    let &t_8f = "\[38;2;%lu;%lu;%lum"
    let &t_8b = "\[48;2;%lu;%lu;%lum"

    " enable true color
    set termguicolors
endif

安装适合自己的支持真彩色的vim 主题，我这里选用的是相同配色的 solarized8 主题

1
2
3
4
5
6


Plugin 'lifepillar/vim-solarized8'

" 这里增强了对比度
set background=dark
colorscheme solarized8_high
let g:solarized_extra_hi_groups=1

在进入 vim 的 VISUAL 模式后，发现选定的行不能反色显示，而仅是失去了高亮，这很容易看不清选中的具体字符（比如注释也是没有高亮的，这里就很容易找不到选中边界）。搜寻的结果则是终端的支持问题，无法识别 hi Visual gui=reverse 这个反色指令，于是手动调整了被选中文字的配色。

1

hi Visual gui=reverse guifg=Black guibg=Grey

（依然在 .vimrc 文件中修改，具体位置则是紧接着主题配色后面）

before:

after:

这里同样是选中 358-363 行

补充

在使用过程中，还发现了 vim 8.1 中支持的 termdebug 与 true-color 的一个冲突：在 packadd termdebug 之后做了 set termguicolors 的操作的话，在实际调试代码时，正在执行的行就没办法高亮了。而正确的做法则是将 packadd termdebug 放在 set termguicolors 之后。

意义

由 256 色支持到 16万色支持，字面意义上就是颜色过渡更平滑了。而在 vim 中，就是代码看着更舒服了（不知道这里的代码颜色高亮有没有相应的True-color扩展）

8-bit color 又名 256 color, 24-bit color 又名 true color，一共有 16,777,216 colors ↩︎
与这款配色的渊源要回溯到 https://blog.csdn.net/zklth/article/details/8937905 这篇文章了，可惜文章中的图已经挂了大半，还好我有本地保存的 Evernote 版。 ↩︎

偏头痛和利扎曲坦

20180926T14:58:42.008Z

这可能是最近一件让我豁然开朗的大事：确诊了偏头痛和了解到了利扎曲坦。

偏头痛

偏头痛（英语：Migraine）是一种出现反复轻度或重度头痛的慢性疾病，通常伴有各种自主神经系统症状。偏头痛的英文“Migraine”一词源于希腊语ἡμικρανία（hemikrania），意为“头部一侧的疼痛”，其中，ἡμι- （hemi-），意为“一半”，κρανίον（kranion），意为“颅骨”。

通常这种头痛为单侧性质（仅涉及一侧头部），并伴有搏动，可持续2-72小时。相关症状可能包括恶心、呕吐、对光线更加敏感、对声音更加敏感，且肢体活动会加重疼痛的感觉。三分之一的偏头痛患者均能感到病症先兆：短暂的视觉、感觉、语言或肢体障碍都意味着头痛即将发作。 (引用自 https://zh.wikipedia.org/wiki/%E5%81%8F%E9%A0%AD%E7%97%9B)

利扎曲坦

利扎曲坦（英语：Rizatriptan，或译为利扎曲普坦）是一种曲坦类5-HT1激动剂，由默克药厂为治疗偏头痛而开发，商品名Maxalt。 (引用自 https://zh.wikipedia.org/wiki/%E5%88%A9%E6%89%8E%E6%9B%B2%E5%9D%A6)

我的经历

在不定期发作的 “不适”¹，如头痛、胃痛、畏光、胸闷气短、鼻炎发作等的轮番轰炸下，我几乎每个月要去医院检查一次身体。当然这些检查无外乎神经内科、耳鼻喉科、眼科、消化内科的常规检查。在这些检查后，医生也会开对应症状的药，有些医生甚至还会开 “中成药”²。而在一次次的发作后，我也感到了这些方法的无力。

医院之外的互联网上，维基百科中，也看到了对偏头痛症状的描述，把我的症状与之对应发现其重合度较高。而对于非医学专业的我，自然不会因为一段描述而对自己确诊，因这有可能是一种 “疑病症”³。

在一次次的就医过程中，在某医生的建议下，得以知道某个眩晕学专家的就诊时间，而最终也是专家确诊了偏头痛。在医生的建议中，提到了国际上认可的偏头痛治疗药物：利扎曲坦。虽然当时医院中并没有该处方药，可在我的请求下，医生还是把药品名称写在了纸上，供我查找。

又一次借助互联网的情况下，在某东医生上挂了号，并开具了处方，买到了利扎曲坦。

使用效果

在最近一次的偏头疼发作时（已经出现了症状，但还较轻），服用了利扎曲坦，在不排除安慰剂效应的情况下，症状消失。

在借助过替代医疗⁴多年的我，终于得以用现代科学的方法战胜该种慢性病⁵，豁然开朗。

这里用 “不适” 来表明确诊的困难，主要体现在症状的不确定 ↩︎
中成药对于医院、医生创收的意义远大于其实际意义 ↩︎
疑病症又称疑病性神经症，目前归类为躯体形式障碍中，主要指患者担心或相信患有一种或多种严重躯体疾病，病人诉躯体症状，反复就医，尽管经反复医学检查显示阴性以及医生给予没有相应疾病的医学解释也不能打消病人的顾虑，常伴有焦虑或抑郁 ↩︎
这里指中医的针灸、艾灸等，一般在偏头痛发作时，会有一定的效果 ↩︎
这里的“战胜”是指，在偏头痛发作时，可以使用药物将症状消除 ↩︎

NexT & izhengfan 结合主题

20180912T17:49:19.008Z

一直很眼馋 yinwang.org¹ 的超简主题，看起来就像某种高级存档。在找了相关的 hexo 主题 mickeyouyou/yinwang² 并试用了之后，发现并不满意（主要不满意字体，排版和代码高亮）。而 Hexo 用户基本都知道 NexT 主题，定制功能强大，找到适合的排版、字体高亮、第三方插件很容易，可无奈太多人在用了，而且显得有些重。

在搜索 vim termdebug 问题时，无意中发现了 https://fzheng.me 的博客，其极简的思路和漂亮的字体让我特别想试用一下相关主题。去 github 上看了相关源码是 Jekyll 的模版，花了点时间转换成 hexo 的模版，在转换的过程中，顺手把几个 NexT 主题中用的顺手的扩展功能移植过来了（因为只有三个页面模版，工作量很小）。

移植过来的几个功能是：

disqus 评论。我这里做了改造，选择 lazyload 的话，不是滚动触发，而是点击按钮触发（原谅我不会做按钮的 hover 效果）
baidu / google / bing 等网站的认证及统计功能
社交网络按钮
网站采用的协议
自定义网站页脚

主题项目地址是：https://github.com/wukra/izhengfan.github.io.git

王垠博客地址：http://www.yinwang.org/ ↩︎
仿王垠博客主题的项目地址： https://github.com/mickeyouyou/yinwang ↩︎

perl 关于 do { local $/; } 语法糖

20180907T11:17:27.008Z

1
2
3


open FILEHANDLE, '/etc/hosts' or die $!;
my $string = do { local $/;  };
print($string);

该 perl 代码运行的输出结果大概是：

1
2
3
4
5
6


127.0.0.1       localhost

# The following lines are desirable for IPv6 capable hosts
::1     localhost ip6-localhost ip6-loopback
ff02::1 ip6-allnodes
ff02::2 ip6-allrouters

即，/etc/hosts 的全部文件内容。

Q&A

其中，难理解的是第二行，在 perl 的常规写法中，读取文件的完整内容应该是用一个 while 循环逐行读取：

1
2
3
4
5


open FILEHANDLE, '/etc/hosts' or die $!;
my $string;
while () {
    $string .= $_;
}

这里详细的来解释一下第二行：

do { } 是 perl 中的代码块，函数的返回结果即最后一个语句。
是上述 do { } 中的最后一个语句，即返回结果。而在 perl 中，的返回结果根据不同的上下文，有两种不同的返回结果，即：

1
2


my $scalar = ;    # 等号左边为标量时，返回文件的单行内容
my @array  = ;    # 等号左边为数组时，返回文件的全部内容（文件的每行对应数组的每个元素）

$/ 变量的设置为该语法糖的关键。 $/ 变量是 输入的分隔符 (input record seperator)，默认情况下是换行符。即在标量上下文时，返回单行文件内容的默认表现是由 $/ 变量决定的。而 local $/ 相当于 local $/ = undef
local 和 my 的区别：my 是创建一个新变量，而 local 则是临时改变一个变量的值（在作用域内）

整体解析下来就是，通过 do {} 创建一个临时的作用域，在作用域中改变 $\ 的值，改变了在标量上下文中的分隔符（由 \n 变为 undef），达到了读取整个文件内容的目的。

参考文章

The difference between my and local https://www.perlmonks.org/?node_id=94007
Perl Idioms Explained - my $string = do { local $/; }; https://www.perlmonks.org/?node_id=287647

DNS 基础知识

20180830T22:10:05.008Z

本文主要内容是 RFC 1035 的解读。

Zone

DNS 的区域 (zone) 由两部分组成：Resource Records (RRs) 和 Directives

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14


; zone file for example.com
$TTL 2d    ; 172800 secs default TTL for zone
$ORIGIN example.com.
@             IN      SOA   ns1.example.com. hostmaster.example.com. (
                        2003080800 ; se = serial number
                        12h        ; ref = refresh
                        15m        ; ret = update retry
                        3w         ; ex = expiry
                        3h         ; min = minimum
                        )
              IN      NS      ns1.example.com.
              IN      MX  10  mail.example.net.
joe           IN      A       192.168.254.3
www           IN      CNAME   joe

一个DNS区域文件由注释、指令(Directives) 和记录（RRs）组成
注释是由 ; 开头直至行尾
指令(Directives) 是由 $ 开头的，其中 $ORIGIN 和 $INCLUDE 是在 RFC 1035 中定义的，而 $GENERATE 则是由 BIND 提供的非标准指令。
$TTL 指令需要出现在第一个 RR 之前
第一个出现的 RR 必须是 SOA (Start of Authority)

DNS Message

这里的消息是指在 Resolver 和 DNS 系统之间的消息协议。

格式如下：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11


    +---------------------+
    |        Header       |
    +---------------------+
    |       Question      | the question for the name server
    +---------------------+
    |        Answer       | RRs answering the question
    +---------------------+
    |      Authority      | RRs pointing toward an authority
    +---------------------+
    |      Additional     | RRs holding additional information
    +---------------------+

(图自 RFC-1035)

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15


                                    1  1  1  1  1  1
      0  1  2  3  4  5  6  7  8  9  0  1  2  3  4  5
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    |                      ID                       |
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    |QR|   Opcode  |AA|TC|RD|RA|   Z    |   RCODE   |
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    |                    QDCOUNT                    |
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    |                    ANCOUNT                    |
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    |                    NSCOUNT                    |
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    |                    ARCOUNT                    |
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+

(图自 RFC-1035)

ID: 一个16位的请求 ID，响应中原样返回，用于表示请求的唯一性
QR: 请求响应标识位。请求设置为 0, 响应设置为 1
OPCODE:
- 0: QUERY. 标准请求
- 1: IQUERY. 反向请求 (可选支持)
- 2: STATUS. DNS 的状态
- 3-15: 保留
AA(res only): Authoritative Answer 权威回答. 即zone拥有者返回的响应为权威回答，其他如其他DNS服务器根据缓存给出的响应为非权威回答。
TC: 截断. 当消息体大于最大可传输大小时即截断消息
RD: Recursion Desired . 请求消息中要求递归查询位，如果服务器支持递归查询，则置位，否则则置零
RA(res only): Recursion Available. 该NS服务器是否支持递归查询
Z: 保留位，在请求和响应中必须都为 0
RCODE(res only): 标识服务器的响应类型 (类似错误码)
- 0: 无错误
- 1: 格式错误: 服务器无法解析请求
- 2: 服务器错误：由于某种原因导致服务器出错，因此暂时无法响应
- 3: 对于不支持递归查询的服务器(authority only)没查到相应域名时的响应
- 4: 未实现：不支持当前的查询类型
- 5: 拒绝：由于策略或其他原因，拒绝服务
QDCOUNT: 16位无符号整型，用于标识 Question Section 条目数量
ANCOUNT: 16位无符号整型，用于标识 Answer Section 中 RR 条目数量
NSCOUNT: 16位无符号整型，用于标识 Authority Section 的条目数量
ARCOUNT: 16位无符号整型，用于标识 Additional Section 的条目数量

Question

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11


                                    1  1  1  1  1  1
      0  1  2  3  4  5  6  7  8  9  0  1  2  3  4  5
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    |                                               |
    /                     QNAME                     /
    /                                               /
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    |                     QTYPE                     |
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    |                     QCLASS                    |
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+

(图自 RFC-1035)

说明：每个请求通常只有一个 Question Section，但其实可以通过 QDCOUNT 来指定任意个数的 Question Section

QNAME: 查询的域名。格式为：no. of chars domain name no. of chars domain name … 其中 no. of chars 为相邻 domain name 字符串长度例：

1
2
3
4


08 6D 79 64 6F 6D 61 69 6E 03 63 6F 6D 00
// printable
 !  m  y  d  o  m  a  i  n  !  c  o  m  !
// note ! = unprintable

(图自zytrax.open)

QTYPE: 查询的类型。即对应 RR 的 TYPE
QCLASS: 查询的类(Class)。最常用的值为 x'0001 代表 IN or Internet

Answer

Answer / Authority / Additional Section / RR 都采用相同的格式

RR / Answer 格式:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20


                                    1  1  1  1  1  1
      0  1  2  3  4  5  6  7  8  9  0  1  2  3  4  5
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    |                                               |
    /                                               /
    /                      NAME                     /
    |                                               |
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    |                      TYPE                     |
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    |                     CLASS                     |
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    |                      TTL                      |
    |                                               |
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    |                   RDLENGTH                    |
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--|
    /                     RDATA                     /
    /                                               /
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+

(图自 RFC-1035)

NAME: 响应的域名.
- 格式一：label 格式。同上述 QNAME
- 格式二：Pointer 格式。经过数据压缩的格式。一个十六位的值: 前两位固定为 1 (与 label 格式区分，由于 lable 格式最大值限制为 63)，OFFSET 位的值为相对于信息开始位置的偏移量。其中 0 代表着 ID 的第一位。

1
2
3


    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    | 1  1|                OFFSET                   |
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+

(图自 RFC-1035)

TYPE: RR 的类型。
- x'0001(1): A 记录
- x'0002(2): NS 记录
- x'0005(5): CNAME 记录
- x'0006(6): SOA 记录
- x'000B(11): WKS 记录 – Well Known Source 用来描述互联网上的使用特定协议(如TCP(6)) RFC1010的通用服务(如 SMTP)
- x'000C(12): PTR 记录. A 记录与 AAAA 记录的反向记录（IP指向域名）
- x'000F(15): MX 记录. SMTP 的 Agent 用来收件的域名
- x'0021(33): SRV 记录. RFC 2782 MX 记录是其特殊情况。SRV 记录是用来被其他特定服务使用的记录字段(如 OpenLDAP)
- x'001C(28): AAAA 记录. ipv6 地址
CLASS: RR 的类。如：Internet Chaos
TTL: 记录应被缓存时间(秒)
RDLENGTH: RDATA 的长度
RDATA: 每种不同类型的RR数据有特定的格式。
- SOA: SOA 记录控制着域名记录的更新策略

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21


    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    /                     MNAME                     /
    /                                               /
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    /                     RNAME                     /
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    |                    SERIAL                     |
    |                                               |
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    |                    REFRESH                    |
    |                                               |
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    |                     RETRY                     |
    |                                               |
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    |                    EXPIRE                     |
    |                                               |
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    |                    MINIMUM                    |
    |                                               |
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+

	- Primary NS: 主 NS 服务器. 长度可变. label/pointer/混合
	- Admin MB: 管理员邮箱. 长度可变. label/pointer/混合
	- Serial Number: 序列号. 32位无符号整型. 格式为 "YYYYMMDDnn"
	- Refresh interval: 刷新间隔. 32位无符号整型. 二级NS服务器检查 zone file 的更新的间隔
	- Retry interval: 重试间隔. 32位无符号整型. 当主 NS 服务器无法连接时，重试间隔.
	- Expiration Limit: 过期限制. 32位无符号整型. DNS resolver 可缓存时长，对于某些 DNS server 来说则是对 resolver 响应的缓存时长
	- Minimum TTL: 32位无符号整型. 字段意义取决于 NS 的实现，有以下三种可能：
		- NS 对该域名最小缓存时长，几乎没有服务器这样使用(官方遗弃)
		- 默认的 TTL 值。（无 TTL 记录时使用该值）
		- 定义了当该域无记录时，缓存的时长（区别于有记录时缓存的时长 `TTL`）[RFC 2308](https://www.ietf.org/rfc/rfc2308.txt) (官方推荐)
- MX:

1
2
3
4
5
6


    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    |                  PREFERENCE                   |
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
    /                   EXCHANGE                    /
    /                                               /
    +--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+

	- PREFERENCE: 优先级. 值越小优先级越高. 一般使用 `0`(max)作为邮件服务器记录，使用 `10` 用来验证域名的所有权
	- Mail Exchanger: 提供服务的域名. 长度可变. label/pointer/混合
- A: 32位无符号整型，IP地址
- AAAA: 16个八进制，IPv6地址
- PTR, NS: 地址. label/pointer/混合

Authority: (res only) 在请求中该字段值为 0. 格式同 Answer. 数据一般为 NS 类型的 RR
Additional: (res only) 在请求中该字段值为 0. 格式同 Answer. 理论上，任意类型的 RR 都是合法的。实际上，此字段用于提供在 Authority Section 中提到的 NS 域名所对应的 A 或者 AAAA 记录

注: 其中 (res only) 代表着仅在DNS响应中有效的字段

参考文章：

Chapter 8. DNS Resource Records (RRs) http://www.zytrax.com/books/dns/ch8/
Chapter 15 DNS Messages http://www.zytrax.com/books/dns/ch15/
Chaosnet https://en.wikipedia.org/wiki/Chaosnet
DNS: Understanding The SOA Record http://www.peerwisdom.org/2013/05/15/dns-understanding-the-soa-record/
MX record https://en.wikipedia.org/wiki/MX_record#Priority

Lua 自动缩进处理的单文件版本

20180802T16:31:08.008Z

在 https://www.oschina.net/code/snippet_563463_19381 中看到一个使用 Perl 正则对 Lua 文件中进行自动缩进的脚本，感觉思路不错，单文件就可以做到简单的自动的缩进判断。可是在 github 上搜索了半天，也没能找到相关的 lua standalone 项目代码。

这里顺便吐槽一下 LuaRocks，如果要使用 LuaRocks 安装好的脚本，机器上就得安装 LuaRocks 才行，于是就算打包的时候调用 LuaRocks 将依赖解决好，也是不可用的，除非在依赖项中写上 LuaRocks。对我这种 standalone 洁癖来说非常不友好。

这里我对 Perl 版本的自动缩进改写成了 Lua 版的，其中的正则使用的是 openresty 中的 ngx.re，启动时要调用 resty 命令行或者在 openresty 中使用 (两种启动方式)

https://github.com/xiaocang/lua-resty-luatidy

hexo + gitlab 服务隐藏静态文件

20180801T20:42:12.008Z

前情提要

由于之前一直托管博客的网站 https://bitcron.com/ 无法更新证书，而该网站的 Let’s Encrypt 自动脚本又挂掉不能用了（这网站该不会凉了吧(小声）。我决定抽空把博客迁移到纯静态博客上。

之前有过使用 hexo 的经验，又加上 node 的生态在个人博客这里又异常繁荣（大量node相关的第三方插件可用），还是决定迁移过来了。

在 Github 被微软收购后，虽然其CEO直接升级成为 Billionaire，但我对他的好感降到了冰点，目前仅留了几个开源的小项目和之前fork的项目在上面，私有库的付费计划已经停止了。现在把大部分代码及私有库都转移到了 gitlab 上。于是使用 gitlab pages + hexo 的初步技术选型就已经定下来了。

顺利进行

首先，跟着 hexo 官方的文档，一步一步安装，将大的框架搭起来。再配合 GitLab CI 来自动生成及部署静态页面。一切看起来异常的简单。

遇到问题

在 gitlab 上的 pages 选项中，很容易就找得到绑定域名和给域名设置证书的选项。在vps上安装 Let’s Encrypt的命令行工具 certbot，按照官方的文档：

1

certbot certonly --manual -d www.ogura.io

下一步，下一步，直到停在需要验证网站所有权的地方：

访问 http://www.ogura.io/.well-known/acme-challenge/JDbJQP50-rI3LgKGLy7U7EhOkSxr73P0bP2UeTIh1yE 得到指定内容的静态文件。

在自己的 VPS 上做静态文件服务再简单不过了，不过如果是在 gitlab + hexo 的情形下又该怎么做呢。

经过试验得知，在 source/ 文件夹下的文件会被直接扔到 public/ 文件夹下，但特殊情况是，.well-known 文件夹是个隐藏文件夹， hexo generate 在生成静态文件的时候，会忽略隐藏文件和隐藏文件夹。

gitlab pages 中举例了一个 jekyll 中的解决方案是使用一个 xxx.md 的文件，其内容为：

1
2
3
4
5
6


---
layout: null
permalink: /.well-known/acme-challenge/5TBu788fW0tQ5EOwZMdu1Gv3e9C33gxjV58hVtWTbDM
---

5TBu788fW0tQ5EOwZMdu1Gv3e9C33gxjV58hVtWTbDM.ewlbSYgvIxVOqiP1lD2zeDKWBGEZMRfO_4kJyLRP_4U

但是在 hexo 中（起码是 next 这个主题下，没有 null 这个 layout），而且生成的链接中带有 .html 后缀，无法通过校验。

折腾了半天自定义layout，也没弄成功。最终在 .gitlab-ci.yml 中，加了一行手动 copy 的命令，也就成功了。（折腾了半个小时layout模版= =）

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19


# This file is a template, and might need editing before it works on your project.
# Full project: https://gitlab.com/pages/hexo
image: node:6.10.0

pages:
  script:
  - npm install
  - ./node_modules/hexo/bin/hexo generate
  - /bin/cp -rv static/.well-known public/
  - ./node_modules/.bin/hexo algolia
  artifacts:
    paths:
    - public
  cache:
    paths:
      - node_modules
    key: project
  only:
  - master

lua 的栈与内存限制

20180502T12:12:00.008Z

在使用动态生成的 lua 代码时，往往要注意 lua 在栈与内存上的限制。结论先放在前面：

结论以 lua 5.1.5 版本(ubuntu 官方发行版)在 ubuntu 18.04 的实际运行为准

一个lua文件不能超过 262144 个常量
一个控制结构不能超过 32895 个栈
upvalue数量不能超过 60 个
Lua 的每个函数(function)中不能超过 200 个本地变量

本篇文章使用 tt2 技术，并使用 Template::Tools::tpage 提供的命令行 tpage 来生成 lua 代码

一个lua文件不能超过 262144 个常量

其中 262144 = 2^18^

tt2 代码

1
2
3
4
5


[% SET array = [1..262144] %]

local a = {
    "[% array.join("\", \"") %]"
}

lua 代码

生成的 lua 代码 gist 链接(文件较大)： https://gist.github.com/xiaocang/cd947e57cdb6d16b83d7bdc9c4d0cecd#file-too_much_constant-lua

执行结果

1
2


$ lua too_much_constant.lua
lua: constant table overflow

源码定位

TODO

一个控制结构不能超过 32895 个栈

其中 32895 = 2^15^ + 2^7^ - 1

tt2 代码

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11


[% DEFAULT max = 32895 %]

if
[% FOREACH i IN [1..max] -%]
    ([% i %] > 0) [% IF i < max %] and [% END %]
[%- IF i % 10 == 0 %]
[% END -%]
[% END %]
then
    print("ok")
end

lua 代码

生成的 lua 代码 gist 链接(文件较大)： https://gist.github.com/xiaocang/99a5b636694bab0fd870c17ef97fa472#file-control_pattern_too_long-lua

执行结果

1
2


$ lua control_pattern_too_long.lua
control_pattern_too_long.lua:3297: control structure too long near ''

源码定位

TODO

upvalue数量不能超过 60 个

tt2 代码

1
2
3
4
5
6
7
8
9


[% FOREACH i IN [1..200] -%]
local a_[% i %]
[% END %]

function closure()
    [% FOREACH i IN [1..61] -%]
    a_[% i %] = 0
    [% END %]
end

lua 代码

生成的 lua 代码 gist 链接(文件较大)： https://gist.github.com/xiaocang/baf52c6e7fffa31d684ad55ddfc47867#file-too_much_upvalue-lua

执行结果

1
2


$ lua too_much_upvalue
lua: stdin:264: function at line 203 has more than 60 upvalues

源码定位

TODO

Lua 的每个函数(function)中不能超过 200 个本地变量

tt2 代码

1
2
3
4


[% FOREACH i IN [1..201] -%]
local a_[% i %]
[% END %]
print("ok")

lua 代码

生成的 lua 代码 gist 链接(文件较大)： https://gist.github.com/xiaocang/f4fd0b56bbdec00e4794e661b0ffd994#file-variables_in_function-lua

执行结果

1
2


$ lua variables_in_function.lua
main function has more than 200 local variables

源码定位

from lua5.2.2 src/lparser.c line 30-32

1
2
3


/* maximum number of local variables per function (must be smaller
   than 250, due to the bytecode format) */
#define MAXVARS     200

自建图床 uppy

20180411T23:45:00.008Z

选择

自建图床的方案可以说不是很多了，先是用过 Lychee – 使用世界上最好的语言(PHP)开发，使用下来感觉功能太重了：一堆功能，能用上的没几个。还要装一堆图像处理的插件，去做图片缩放(并用不到

目前是使用的 uppy，优点是部署方便，一个 npm install 就解决了，后端用的是 tusd 的 go 版本，部署更是方便，一个二进制文件扔上去就好了。

困惑 & 解决

在选择 uppy 之后，看了半天官方文档，也没有提到怎么样把 uppy 部署好，我甚至以为 uppy 是 uppy server 的后端。走投无路的时候去扒 uppy 的官方例子的页面，发现部署 uppy 只需部署一个静态页面即可，所有选项都在页面的

为各发行版构建本地仓库

来由

TL;DR

流程

0x02. 软件包下载

yum / dnf

apt-get

zypper

0x03. 目录结构

yum

apt

0x05. 添加本地仓库

yum

zypper

apt

旧版本内核与 AMD Family 17h 系列 CPU 的兼容性问题

TL;DR

解决过程

LVM ?

XFS/EXT4/EXT2 ?

GRUB2 ?

VIRTIO ?

AMD Family-17h !

Yubikey 的 polkit 配置

重现

分析

解决

调试技巧

countu 游泳计数器 (安利)

前言

选项

理由

自由泳的学习回顾

简介

基础

学习

成果

OpenResty 开发速览

简介

开发

1. Nginx

1.1 反向代理

1.2 Web Server

2. Lua

3. lua-nginx-module

4. 工具

See Also

Hugo 迁移记录

前提

问题

解决方案

方案 1

方案 2

方案 3

方案 4

实现

1. 文章迁移

2. 模板迁移

3. 功能实现

4. 部署方案

See Also

Blogroll

Friends

TCP/IP 知识串联

前提

概览

OSI 七层 vs TCP/IP 四层

数据链路层

网际层/网络层

路由协议

距离向量路由协议

最短路径优先算法

IGP 与 IBGP 的区别与联系

网关

DNS

传输层

UDP

TCP

应用层

http