某五百强信创数据库运维幽默记录

293 天前
 HOMO114514
某五百强信创数据库,为了搭配他们的 arm 硬件,把物理安装的配置需求设计得十分严格,核数内存比 1:8 ,至少 8C 起步,否则安装检查不通过。

(但是容器化模式下允许 4C16G 安装)

一个集群 3 节点,也就是每个 cluster 至少要吃掉 24C192GB 内存,我们这边 base 的机器资源不够,调动用外地的机器,两地之间网络全隔离,需要开单申请端口放行

开始之前,我问某五百强技术支持,我们网络隔离,完成任务 1 需要开通什么端口

技术支持丢给我一个《端口矩阵》,林林总总列出了所有组件的端口接近 100 个,但是没告诉我是干什么用的,说可以参考这个文档

然后选了几个看起来要用的端口,提交了审批,等了 2 天,端口批下来了开始干任务 1

卡住了,几百个组件查 log 查了俩小时,发现它在任务过程中冷不丁地要请求一个端口 A 才能完成,具体来说,它下发 agent 包用的不是 scp ,而是要求 node 反过来请求 controller 的自建非标端口 sftp

OK ,反馈,继续开审批,然后追问五百强技术支持,你们任务 1 还涉及什么端口能说说吗?任务流程全是黑盒子,使用手册没有、矩阵文档也没有

技术支持说,你看看端口矩阵,自己整理下

OK ,等了 2 天,端口 A 批完了,继续任务 1 ,结果卡在另一个地方,再查俩小时 log ,发现这个子任务靠 ping 判断 node 的网络连接,但我们没开 ICMP

OK ,继续开审批,把 ICMP 开了,我再追问技术支持,你们还有什么端口要访问的,能不能说清楚

他回答我,那个端口矩阵你可以看下

等了 2 天,ICMP 批下来了,继续任务 1 ,结果卡在最后一个子任务,这个任务在矩阵文档里写的是要用端口 B ,之前已经批过这个端口,测试也顺利放行。

继续查 log 和测试,俩小时之后发现这个子任务实际上在用端口 C ,而非 B ,端口 C 没开通

OK ,继续开审批,等了 2 天,把端口 C 开了,最后终于跑完了

半个月时间消失了

接下来做任务 2 ,毫无意外地卡住了

查 log 两小时,发现这个子任务试图让 node 终端请求 controller 的 Kafka 来获取一些任务参数,这个端口当然是没开通的,哥们,你是个数据库啊

反馈技术支持,追问,你们任务 2 要什么端口

技术支持进入了已读不回状态
12833 次点击
所在节点    程序员
99 条回复
IDAEngine
293 天前
oceanbase 吧?各种开源组件集成在里面
Leovim
293 天前
很大概率这个技术支持也不太了解,所以只能甩给你文档,而如果他再去问可能也要很久、被踢皮球,有一些自私的人就不愿意浪费时间去找别的人问了。
Greendays
293 天前
国产数据库也不至于这么不堪吧,我记得不是有几个正常的产品的么?
HOMO114514
293 天前
@zmh69695328 OB 是国产最强的,目前没有之一
yifangtongxing28
293 天前
没办法,这就是干技术人的现状,费了九牛二虎,求了各路神仙,好不容易搞定了,领导还觉得你这干的太慢了啊哈
HOMO114514
293 天前
@mightybruce 是的,管理套件是 Java 全家桶,zookeeper 、dubbo 、influxdb 、kafka ,连 machine learning 相关的东西全都有,甚至给自己塞了一个信创数据库做内部 metadata
kkk1234567
293 天前
@povsister 信创啊 。 独一份的生意
ShuWei
293 天前
世界就是一群草台班子搭建的,这样多好,又快乐摸鱼了一周多
huijiewei
293 天前
@LieEar 那必须自主研发
iosyyy
293 天前
@Kinnice #42 楼主不已经解释了“另一边是银行,审核非常严格,每次开端口要三级两地领导审批,每个端口需要对应原因,否则一般大概率是会被打回的”
你以为的开端口: 点下安全组就行
实际上楼主的遇到的开端口: 提交审批说明理由
A555
293 天前
不错了至少是大公司
还有一些明显是当地领导关系的小公司做的什么破自研操作系统,数据库,听都没听过
你说换皮就老实换皮吧,你瞎搞什么创新
28Sv0ngQfIE7Yloe
293 天前
一看就是华为吧?
Kinnice
293 天前
@iosyyy #69 对啊,不就是嫌审批麻烦,然后 op 不想去做吗,然后开始自己凭经验挑端口 。至于每个端口的详细理由回复也已经说了,如果《端口矩阵》是不能满足审批要求,就应该让对面提供,如果对面不提供,反手应该问题升级到领导那去。
yulgang
293 天前
root 上去一把梭,什么安全服务、防火墙通通关闭,一键安装
shyrock
293 天前
@LieEar #23 当然是自主知识产权。只要西方敢开源,我们就可以突破。
Kinnice
293 天前
@iosyyy #69 和机关内 ssh 权限审批严格,每次获取 root 权限都需要多个领导审批,我直接凭借经验从安装文档的命令放弃了使用 root 权限(我凭经验这些命令都不需要 root )执行了,但是最后服务起不来 有啥区别?
我的观点是为啥要去猜测乙方服务所需要的端口,乙方说要什么,就去提条子申请什么,少资料就找乙方提供,是自己不想按流程办事 想省事然后坑了自己。
感觉一点不像甲方,倒像是乙方 pk 乙方,没一点话语权的样子,我们遇见乙方要是这样,问题早上升了。
yyysuo
293 天前
这事儿太正常了,第一次就应该把锅甩出去了,要求对方提供,要不就升级到领导。
isnullstring
293 天前
什么狗屎数据库,还没开始用就吃 192G 内存
jinsongzhao
292 天前
没找到幽默?:-D
aru
292 天前
@Kinnice
HW 是乙方,他也是乙方,甲方是银行
HW 是强势的乙方,甲方推动 HW 也是不容易的
他是弱小无力的乙方,苦活累活都是他的
和 HW 一起合作过项目的,都知道 HW 是多么操蛋的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/1035840

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX