目录

rockermq-operator的问题查找

概述

因为公司内有使用 RocketMQ,在做容器化的时候,在 Github 社区了找到了一个已经不太维护的项目 rocketmq-operator, 当然也在 Dockerhub 找到了 apacherocketmq/rocketmq-operator 这个镜像,但是在对比了一下 Github 仓库的 tag 和 Dockerhub 上的这个 0.3.0-snapshot 的镜像,发现 Github 上还没有打标签,大概看了一下代码,估计是 Dockerhub 上的代码是停留在这个 commit 了。

解决问题

正好在测试 Operator 的时候,同事反馈遇到扩容 broker 有问题,大概翻到了这个 issue, 细看一下,应该是 postStart 那个脚本有问题,然后先去定位一下 Operator 的代码。

/rockermq-operator%E7%9A%84%E9%97%AE%E9%A2%98%E6%9F%A5%E6%89%BE/img_3.png

定位到的代码大概是这里,会构建这个 postStart 的脚本。

/rockermq-operator%E7%9A%84%E9%97%AE%E9%A2%98%E6%9F%A5%E6%89%BE/img.png

从上图看,这个 nil 是不该这么插进去的,插进去之后,broker 读取 Json 文件,100%是要报错的。

img_4.png

然后再看看 RocketMQ 4.5 的代码,很明显,读取一个不是 Json 格式的文件,那肯定有问题的。

/rockermq-operator%E7%9A%84%E9%97%AE%E9%A2%98%E6%9F%A5%E6%89%BE/img_1.png

比如我在 RocketMQ 的单测中,加入一个测试文件,里面内容就是一个 nil,报错的信息会跟 issue, 所以基本是这里的问题了。

/rockermq-operator%E7%9A%84%E9%97%AE%E9%A2%98%E6%9F%A5%E6%89%BE/img_2.png

找到问题了,我们有几个解决的方法:

  1. 改Operator的代码,防止写入nil
  2. 改RocketMQ的代码,把nil排除

不管从哪个角度看,都是改 Operator 是更优的方法,至于怎么改,应该不用多说了,就是提前把 nil 获取,替换掉或者直接 return 就好。

警告
本文最后更新于 2017年2月1日,文中内容可能已过时,请谨慎参考。