Mysql 千万级数据在后台管理的展示问题

2019-04-16 10:08:19 +08:00
 Boywus

现在有一张钱包明细表,项目运行了两个月,已经达到了一千万的级别了,现在碰到了一个问题:

后台管理要求显示:

  1. 这个表的总条数
  2. 对这个表进行分页, 然后要显示总页数

第二个要求应该是基于第一个要求的,所以就是取决于

select count(*) from wallet_trans_detail where ...

这个 count 操作现在耗时还能接受,但是已经有点慢了,如果再运行两个月,分页的加载将会特别慢。

而且最近有分表计划,按照 user_id 取模进行分表放进不同的钱包明细表。

这样子有好几个表的内容使得总览的时候分页处理更加麻烦了。

各位大哥有什么好方法?

8127 次点击
所在节点    MySQL
36 条回复
mringg
2019-04-16 10:16:30 +08:00
重点是 where 后
iWicky
2019-04-16 10:26:00 +08:00
建一个索引表,只存全量 ID
ywisax
2019-04-16 10:28:47 +08:00
同 1L。where 都走了索引的话,查询起来应该不会很慢,就是插入比较蛋疼
ft7138
2019-04-16 10:30:09 +08:00
用 MySQL 做存储,引入 palo 等 OLAP 做查询分析。
qinxi
2019-04-16 10:35:55 +08:00
你可以按时间分表啊.
lihongjie0209
2019-04-16 10:39:10 +08:00
单独维护一个计数表很难吗?

计数表又不一定准确,每次更新主表的时候发送一个事件更新计数表
kimchan
2019-04-16 10:52:38 +08:00
@lihongjie0209 #6 如果 select count 后面的 where 条件多种多样的话, 维护计数表会不会反而更麻烦?
love
2019-04-16 10:59:23 +08:00
显示千万级别的表的精确总条数 99.9999 %是个伪需求,大至就可以了。
分页同理,你真的要翻到后面 1 万页?
lihongjie0209
2019-04-16 11:10:55 +08:00
@kimchan 我说的是维护一个总数量的计数,如果是 where 的计数,性能太差的话就不要做了, 直接给个下一页按钮,如果没数据了就提示没数据就好了
k9982874
2019-04-16 11:14:19 +08:00
algolia elasticsearch 了解一下
ChoateYao
2019-04-16 11:23:31 +08:00
采用 count() 索引字段。

限制分页数最大 100 页,想查看大于 100 的分页数据用搜索条件来缩小范围。

如果非要分页 1000 万数据,那么可以采用
09 年雅虎分享的解决方案 https://www.slideshare.net/Eweaver/efficient-pagination-using-mysql
Boywus
2019-04-16 11:23:42 +08:00
@love @lihongjie0209 然而需求就是要求要有总条数,以及总页数。 管理员经常会翻到最后一页看一下这个用户的前面的钱是怎么进来的。 翻到最后一页本身就有 offset 的性能问题,现在勉强用 beween and 加速了下查询。

搜索的指标而且还有很多,所以维护 where 计数有点麻烦,至于维护总数放到 redis 里面是可以的。

但是现在分表后,聚合几个表的数据不知道怎么分页了。
难道是一个总表,然后几个分表,总表内仍然包含所有数据给管理员查询, 分表只给应用端查询?
Vegetable
2019-04-16 11:25:13 +08:00
count 一般不会慢,慢的是你这个索引建的好不好

后台管理和客户端共用一张表的话,随便改索引好像也不太合适.数据按照 userid 分表应该是一个面向业务的设计,mod 这样最多分 10 个表,如果你当下遇到了性能问题,10 个表也坚持不了多久吧.

感觉需求有些问题,这种情况下和产品运营沟通一下.要数据的实时性,就要牺牲性能.要性能就要牺牲部分数据的精确度.
总不能为了这个屁大点的需求付出太高的成本吧
ben1024
2019-04-16 11:25:48 +08:00
索引
缓存
ES
千万可以考虑分表
lihongjie0209
2019-04-16 11:27:47 +08:00
@Boywus 你提到 ‘这个用户’, 既然精确到用户级别,那么数据量应该不多吧?只有在用户被选中的情况下才提供详细的分页信息
Vegetable
2019-04-16 11:31:44 +08:00
@Boywus #12

你第一段描述的问题挺有代表性的,一个 xy 问题的变种.
设计产品的人想知道资金来源,想知道首冲日期,他不直接和你说这个需求,也不直接设计这个功能,而是要求你必须能直接翻到最后一页.然后自己去看.
我认为这真真是错误的设计.分表再合并起来分页更是有点滑稽,合并操作开销太大了,因为没办法排序.根本就没办法优雅分页.
我有点心疼你了兄弟
iyaozhen
2019-04-16 11:33:09 +08:00
看看 phpmyadmin 怎么做的吧,全表大小 MySQL 自己有统计,取下值就行。


分表和总览的需求就是相违背的
cctvsun
2019-04-16 11:38:19 +08:00
楼主不会是 钱迹 吧?
laozhoubuluo
2019-04-16 11:38:24 +08:00
如果不带 where 的情况下建议缓存总交易数解决,如果带简单 where 条件的话建议优化索引,一般都尚能接受。
如果条件很复杂或者量很大,建议给后台读操作单独建一个只读的 Slave,这样大查询卡一点不影响业务。
如果后台分析人员随便一查就是几十万条命中的话,建议砍掉带 where 情况下的总条数和分页。

看到楼上写说单用户交易记录很多,那不如直接把搜索建表,完了把查表结果序列化存到数据库或者 redis 里,对同一个搜索翻页直接取查询结果。
laozhoubuluo
2019-04-16 11:46:36 +08:00
如果用户需求是:1. 关心总交易量 2. 关心单个用户钱流向 3. 特定条件下的全局查询少
那肯定是直接缓存总交易数,完了 uid%1000 甚至 10000 分表最省事。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/555591

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX