奇怪的 pve 故障

7 天前
 LeeLou

用机房的三台 x86 pc 服务器自己组了一个 pve 集群,刚开始都用得好好的.

有一台虚拟的 win2008r2, 突然不能 rdp 远程了,打开 console 看打不开 .直接重启了虚拟机,启动失败了.然后用 winpe 光盘启动进去看了一下硬盘, 发现好像 c 盘少了不少文件,难怪启动不了,难道是黑客上来把文件删了,感觉又不太可能.

过了一段时间,一台 hfish 蜜罐服务端的 web 管理页面打不开了,但是 ssh 还能登录上去,看到有不少 zombie 进程, 但是 reboot 和 shutdown 都启动失败了. 就又去强制重启了一下,又进不去系统了. 难道又被黑了?

想不明白怎么回事. 从 pve 界面上看,三台服务器运行了 200 来天,没有异常重启过.

唯一有点类似的情况,是两台虚拟机都运行在 ceph 的磁盘上,三台服务器硬盘空间相差比较大,随意组了个 ceph,ceph 好像一直有 warning 的状态.

1780 次点击
所在节点    Linux
8 条回复
Zeaxion
7 天前
改了 IP 起不来,或者网口没插线也起不来,多搜索一下相关资料
nutting
7 天前
那肯定 ceph 的问题了
vibbow
7 天前
那肯定 ceph 的问题了
edenzhang
7 天前
这种情况先排查 ceph 的问题,把 warning 问题排查修复一下
个人家庭环境不建议使用运维比较复杂的分布式存储
guanzhangzhang
7 天前
那肯定 ceph 的问题了,ceph 集群加监控,然后盘有问题换盘,基本 ceph 就不会出问题
Int100
7 天前
大概率是 ceph 的问题,看看是啥 warning
qW7bo2FbzbC0
7 天前
还是别用 ceph 吧
Int100
6 天前
@qW7bo2FbzbC0 ceph 是个好东西, 只要不出问题......

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/1109212

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX