真尼玛服了,把 elasticsearch 内存扩充到 9G,每次 query 时间成功延迟到 5 秒以上了

2017-12-01 10:55:17 +08:00
 Reign

昨天的帖子: https://tanronggui.xyz/t/410623 , 先来讲一下历程,mysql 共 30 个字段,一个 article 主字段,其余 29 个字段都是机器翻译改文章的内容,最初用的 xunsearch 索引 50 万数据,查询时间在 1 秒徘徊,太慢,用 elasticsearch 索引这 50 万行数据,还是 1 秒左右徘徊,想到 ES 默认内存是 1G,于是扩充到 9G (服务器 i5+16G+2T HDD ),这下好了单次查询时间,试了很多次,都在 5 秒以上,哪怕我搜索一个单字段而不是搜索所有字段,比如:article_cn 这个字段,还是 5 秒,好的时候 3 秒或者 2 秒

我当时在想,9 个 G 也够把所有数据存到内存中了吧,结果现实还是很骨感,ES 可不可以把所有数据都存到内存中?

而且我发现 ES 一个奇怪的特点,就是有一个冷却期,如果你短时间频繁的搜索各种不同的关键词,query 时间会慢慢减少,如果你很久不搜索,再次搜索时,query 时间会很长。昨晚我试了很多次,逐渐降低到 1s 之内,今早一起来,query 时间又恢复到 8 秒了。。。

14296 次点击
所在节点    Elasticsearch
40 条回复
Livid
2017-12-01 16:18:54 +08:00
ELK 的很多问题真的只能靠堆硬件解决……

sampeng
2017-12-01 16:22:48 +08:00
@Livid 3 台 64G 的? 66666...这个每天多少数据啊?
lyc1116
2017-12-01 16:29:40 +08:00
es 索引用的是堆外内存, 尽量少给 JVM 分配内存。 另外可以在启动时开启 preload,会把索引 mmap 到物理内存里。
Livid
2017-12-01 16:38:11 +08:00
@sampeng 3 台 128G / E5-2630 v2 双路。只分配了一半。
est
2017-12-01 16:43:51 +08:00
不开个 64G 内存你敢用 ES ?
MartinWu
2017-12-01 16:56:57 +08:00
@gouchaoer 长知识了。。
st2udio
2017-12-01 17:13:58 +08:00
我们 ES 用了 5 台 48 核心 128G 的机器。。
jowuIM
2017-12-01 17:27:12 +08:00
@est 才 50w 的数据。。。。
Tinngi
2017-12-01 17:51:50 +08:00
看看是不是 GC 问题。
@vus520 如果不是 term 或者 fuzzy 这样的底层搜索,都需要分词的。search analyzer 就是用来指定搜索的分词器。
amd00
2017-12-01 18:56:56 +08:00
这个问题你 4g 内存比 9g 内存性能高其实可以参考这个地方 https://www.elastic.co/guide/en/elasticsearch/guide/current/heap-sizing.html#_give_less_than_half_your_memory_to_lucene @Reign 只给系统的一半,也就是你占用 mysql 5g 剩下 11g 分一半给 elasticsearch 性能比 11g 都分给 elasticsearch 高
zuo
2017-12-02 04:41:00 +08:00
为了获取更好的性能,通常 elasticsearch 会建议留一半的内存给 Lucene 做 cache,这样就可以将数据 mapping 到内存中,避免 search 的时候产生 I/O
YMB
2017-12-02 10:23:45 +08:00
@gouchaoer 贼鸡儿溜
512557852
2017-12-02 15:19:52 +08:00
@Livid 为什么配了 64G,不是说超过 32G 是浪费性能吗?
likuku
2017-12-02 23:44:32 +08:00
@512557852 浪费?内存向来是多多益善的吧
ewBuyVmLZMZE
2017-12-03 05:31:02 +08:00
内存全给 ES,没有剩余内存给 Lucese,能快么? ES 只是壳,主要是集群之类的特性,你不能把内存全分配了,至少留一半给 Lucense
aiyo218
2017-12-03 10:24:32 +08:00
@likuku 对 ES 来说,还真不是越多越好,31G 正好。
512557852
2017-12-03 16:03:48 +08:00
@aiyo218 确切的说在 java 1.8 中,使用 CMS 是 32766MB,G1 是 32736M,比 32G 少一点。
fatpa
2017-12-04 00:18:43 +08:00
@Livid 曾为了扛下时延 10s 内大概 1000w 每分钟的数据量,堆了 10 来台 128G 的 ssd 集群,特别难过
hayao650
2018-03-06 09:09:57 +08:00
wukairobin
2018-06-19 17:07:47 +08:00
并不是越大越好,因为 lucene 也是要吃内存的 你一点不留给 lucene,意味着全文索引很慢很慢

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/411036

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX