Elasticsearch慢日志
目录
概述
本文是针对 ES 慢查询的排查过程的记录。
分析
5月16日早上的索引高峰一共有5w条慢记录,其中用户画像1w,内容画像4w,与此同时,内容画像有9w个慢查询记录。
首选 id 选择 rowkey 是会减低索引速度的,因为现在索引都是基于业务来划分索引的,基本不存在 id 混用的情况,所以没有必要用个 rowkey 来做 id。
这个是发生在 May 16th 2018, 07:58:35.790,也就是5月16日早上索引/召回超时高峰的一条慢记录。
|
|
可以看到这是一个旧贴,但是写入的文档几乎把所有的字段覆盖了一次。在没有了解具体业务之前,我认为这是不合理的,不管这是属于哪个业务的需要,像 ct, bi
等基本字段不应该属于需要一直更新写入的业务字段。

在仔细查看 ES 慢日志中发现,有个用户名的更新,对 ES 一直产生着压力。




警告
本文最后更新于 2017年2月1日,文中内容可能已过时,请谨慎参考。