求助 MySQL 建表 schema 的优化

2019-10-31 10:23:48 +08:00
 xiaoyaocmx

v 友们大家好… 我现在做的 project 要求对于 mysql 的 query 尽可能的做优化,完全没有插入和更新操作,纯粹 get。现在定的 schema 是 user id 和 timestamp,对于 userid 做了 index。我现在想优化 range query,比如对于如下 query “user id 在范围 A~B, tiemestamp 在 C~D 之间”,要返回所有行。

请问有什么其他可以优化的点吗,我在看 mysql 的官方文档时发现用 BETWEEN ... AND 可以提高速度,但是 database 这边还可以做什么优化呢?有针对 range 做的 index 吗?感谢大家!

5354 次点击
所在节点    MySQL
26 条回复
maierhuang
2019-10-31 10:28:58 +08:00
建立 user id 和 tiemestamp 的联合索引
Jrue0011
2019-10-31 10:36:23 +08:00
https://github.com/Meituan-Dianping/SQLAdvisor
之前无意中找到的,但是没用过,不知道有没有用
xiaoyaocmx
2019-10-31 10:55:29 +08:00
@Jrue0011 谢谢!我也在读美团他们写的优化慢查询的方法,真的很有帮助 https://tech.meituan.com/2014/06/30/mysql-index.html
xiaoyaocmx
2019-10-31 10:56:02 +08:00
@maierhuang 恩恩 我们也准备这么做,准备做两个实验看看哪个在前 performance 更好
xiaoyaocmx
2019-10-31 10:58:18 +08:00
补充:只有一个 table,所以没有 join 的 overhead,也没有 order by 操作
xiaoyaocmx
2019-10-31 11:00:17 +08:00
已经 enable caching
qwerthhusn
2019-10-31 11:14:54 +08:00
既然都没有修改操作,可以尝试一下 MyIASM,查询是比 InnoDB 快的
taogen
2019-10-31 11:52:56 +08:00
range query 用 B+ tree index 已经比较高效率的了

数据量太大,建议水平拆分。
xiaoyaocmx
2019-10-31 12:09:16 +08:00
@qwerthhusn 有道理,查了一下发现确实可能可行,之后我试试! 感谢
xiaoyaocmx
2019-10-31 12:10:58 +08:00
@taogen 水平拆分是指用多个 table 吗?还是说 sharding 到不同的 machine 上呀?如果 query 的 range 恰好 cross table 的话,performance 不会下降吗。。当然这只是我主观猜测
xiaoyaocmx
2019-10-31 12:13:57 +08:00
补充:数据量在 15G 左右,可能只有一些(相对而言比较少)常遇到的 range query,但是这个我们需要 log query 才能发现 pattern。。
hantsy
2019-10-31 12:18:19 +08:00
换 Elastic Search 对应海量数据查询。
ddup
2019-10-31 12:28:33 +08:00
分区表了解一下
wangyzj
2019-10-31 12:51:19 +08:00
加入默认自增 id 主键
innodb
userid 索引
xiaoyaocmx
2019-10-31 12:54:07 +08:00
@hantsy project 有要求,不能用 es。。只考虑 mysql 的 tuning、schema 的 design
xiaoyaocmx
2019-10-31 12:55:38 +08:00
@wangyzj 谢谢,现在是 innodb,已经对 userid 做了索引,按照 1 楼的建议,准备做 userid 和 timestamp 的 composite index。但是自增 id 做主键是什么意思呢?
xiaoyaocmx
2019-10-31 13:00:54 +08:00
@ddup 看了一下,发现基于 timestamp 做 range 分区应该会有帮助,但是怎么分还要根据 query 的 statistics 来决定,加到 todo 的实验里了……谢啦
wangyzj
2019-10-31 13:01:26 +08:00
@xiaoyaocmx 推荐有个自增 id 会效果好一些,uid 如果是自增也行
xiaoyaocmx
2019-10-31 13:13:56 +08:00
@wangyzj 好的,那我想的是 load 完数据后对 user id 这个 column 做个 sorting,保证 ascending order,应该可以达到自增 id 的效果
hantsy
2019-10-31 15:16:20 +08:00
@xiaoyaocmx 有工具可以同步在 ES 建索引的,搜索的时候用 ES,其他 Insert 什么的还是用 MySQL。MySQL 一张表数据量太大了,怎么优化都没有用,查询性能比 PG 差很多。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/614712

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX