最近观察项目 CI 跑的情况如何时,会偶尔发现一两个镜像虽然构建成功但是容器跑不起来的情况。究其原因,是因为一个 exit code 的问题

本文地址: https://shanyue.tech/post/exit-code-node-and-docker

# throw new ErrorPromise.reject 区别

以下是两段代码,第一个是抛出一个异常,第二个是 Promise.reject,两段代码都会如下打印出一段异常信息,那么两者有什么区别?

function error () {
  throw new Error('hello, error')
}

error()
// /Users/shanyue/Documents/note/demo.js:2
//   throw new Error('hello, world')
//   ^
// 
// Error: hello, world
//     at error (/Users/shanyue/Documents/note/demo.js:2:9)
//     at Object.<anonymous> (/Users/shanyue/Documents/note/demo.js:5:1)
//     at Module._compile (internal/modules/cjs/loader.js:701:30)
async function error () {
  return new Error('hello, error')
}

error()

// (node:60356) UnhandledPromiseRejectionWarning: Error: hello, world
//    at error (/Users/shanyue/Documents/note/demo.js:2:9)
//    at Object.<anonymous> (/Users/shanyue/Documents/note/demo.js:5:1)
//    at Module._compile (internal/modules/cjs/loader.js:701:30)
//    at Object.Module._extensions..js (internal/modules/cjs/loader.js:712:10)

从一个比较底层的角度来说,两者的 exit code 不一样,那 exit code 是什么东西?

# exit code

exit code 代表一个进程的返回码,通过系统调用 exit_group 来触发。在 POSIX 中,0 代表正常的返回码,而 1-255 代表异常返回码,不过一般错误码都是 1。这里有一张附表 Appendix E. Exit Codes With Special Meanings

所以,在 node 的应用中经常会有 process.exit(1) 来代表因为不期望的异常而中断。

现在看一个关于 cat 的异常以及它的 exit code 与系统调用

$ cat a
cat: a: No such file or directory

# -e 代表只显示 write 与 exit_group 的系统调用
$ strace -e write,exit_group cat a
write(2, "cat: ", 5cat: )                    = 5
write(2, "a", 1a)                        = 1
write(2, ": No such file or directory", 27: No such file or directory) = 27
write(2, "\n", 1
)                       = 1
exit_group(1)                           = ?
+++ exited with 1 +++

可以看出,它的 exit code 是 1,并且把错误信息写到 stderr (标准错误的 fd 为2) 中了

# 如何查看 exit code

其实从上边的内容可以看出,可以使用 strace 来判断进程的 exit code。但是这样实在太不方便了,特别是在 shell 编程环境中。

有一种简单的方法,通过 echo $? 来输出返回码

$ cat a
cat: a: No such file or directory

$ echo $?
1

在对上述两个测试用例查看 exit code,我们会发现 throw new Error()exit code 为 1,而 Promise.reject() 的为 0。

# Dockerfile 在 node 中的注意点

node 中的异常与 exit code 都说完了,接下来该说与 Dockerfile 的关联了。

当使用 Dockerfile 构建镜像时,如果其中 RUN 的进程返回非0的返回码,则构建就会失败。

而在 Node 中的错误处理中,我们倾向于所有的异常都交由 async/await 来处理,而当发生异常时,由于此时 exit code 为 0 并不会导致镜像构建失败。 如下所示

FROM node:alpine

RUN node -e "Promise.reject('hello, world')"
$ docker build -t demo .
Sending build context to Docker daemon  14.85kB
Step 1/2 : FROM node:alpine
 ---> d97a436daee9
Step 2/2 : RUN node -e "Promise.reject('hello, world')"
 ---> Running in 0281c660ab82
(node:1) UnhandledPromiseRejectionWarning: hello, world
(node:1) UnhandledPromiseRejectionWarning: Unhandled promise rejection. This error originated either by throwing inside of an async function without a catch block, or by rejecting a promise which was not handled with .catch(). (rejection id: 1)
(node:1) [DEP0018] DeprecationWarning: Unhandled promise rejections are deprecated. In the future, promise rejections that are not handled will terminate the Node.js process with a non-zero exit code.
Removing intermediate container 0281c660ab82
 ---> 2146545654d2
Successfully built 2146545654d2
Successfully tagged demo:latest

而在编译时能发现的问题,绝不要放在运行时。所以,构建镜像需要执行 node 的脚本时,对异常处理需要手动指定 1 的 exit codeprocess.exit(1)

runScript().catch(() => {
  process.exit(1)
})
Last Updated: 10/27/2019, 12:09:11 PM