东芝硬盘是垃圾,奉劝各位不要买。求帮助!

2024-01-18 17:38:16 +08:00
 wuyadaxian

我在日本某动画公司工作,因为公司业务需要,需要弄一台大点的 SAMBA 共享服务器。

于是去年年底购入了 16 块,16TB 的 toshiba ,型号 MN08ACA16T/jp 。

日本国内质保 3 年,免费换新。

售后挺好的。但是噩梦来了。


去年 9 月购入,然后装机,上机架,系统设置,一气呵成。

15 盘 RAID10 ,+1 备用盘。合计 109T 可用空间。

然后做了 1 个月测试,没发现问题。

然后将业务数据移动到新服务器上。

正常开始跑业务。

也就是公司内部的作画 psd ,摄影 ae 做影片到处 mov 等数据在传输。


接下来 11 月开始卡了。

各种卡,表现为 smbd 或者 flush 进程 100%。

硬盘 io 全为 0.

甚至 dmesg 都出现内核恐慌了。

分析了下就是写入硬盘,然后没了。

等待 30-300s 随机时间,硬盘写入恢复。

怀疑写入遇到坏块了。

smartctl 测试走起。

好家伙,16 块盘,有 6 块报坏块。


不得不说,日本经销商态度可以。

马上 [私密马赛,私密马赛,私密马赛]

我们给你换。

换货邮费还是经销商全包。

甚至提供先发货,我再退货的服务。


换货之后

陆续小卡,恢复时间很短,基本上 10s 内。

而且 SMART 也不报错,smartctl -t long 测试也能无错通过。

我就放置了。


24 年 1 月 12 日,

又开始了,超级大卡。

这次恢复时间居然超出了 600s ,

所有含写入的进程都在内核恐慌。

dmesg 拉了 300 多行.

关键是这个一卡,公司业务全部要暂停,

硬盘写入读取完全无响应。

同事翘脚抱怨,我就只能打哈哈调试。


之后从 12 日开始到今天 18 日,

每天都有十来次卡顿,

30s-120s 才能恢复。

关键是 SMART 不报错。

日嘛,头都大了。

你要是报错,我就把你提出来找经销商换新啊。

你啥错误都不报,smartctl test 还能正常无错通过。

但是就是卡,简直要了我的狗命。


老板问,为啥服务器又卡了。

我,硬盘可能又坏块,要坏了。

老板,那找厂家换吧。

我,硬盘没报错,暂时还不能保修换新。

老板,你 TM 拿我开心啊,给我去解决这个问题。

我,打工人乖乖退下。


mb 东芝硬盘,

现在虽然偶尔卡顿,但是每天业务还在进行。

我又不能现在卸载硬盘来跑个完整的写入测试。


求问各路大佬有没有什么办法。

任何方法都可以尝试。

真心求问。

8844 次点击
所在节点    硬件
79 条回复
lizhengbo
2024-01-19 00:08:48 +08:00
@mokiki
权限设置简单吗, 我试了下不简单啊.
wuyadaxian
2024-01-19 00:14:13 +08:00
@xcodeghost 下次换企业级吧,家庭级别感觉不行。
wuyadaxian
2024-01-19 00:15:47 +08:00
@jdqingm 不会,因为服务器还有系统盘。所以网络和其他服务是正常的。另外卡的时候,在服务器本地操作,挂载的硬盘也无响应。
wuyadaxian
2024-01-19 00:18:22 +08:00
@yyzh 备份不能替代业务盘,业务卡的时候又不能拖出备份盘来用。
除非做数据集群动态负载均衡。但是小公司没必要吧。
msg7086
2024-01-19 02:48:17 +08:00
@wuyadaxian #27 希捷普通盘?难道是 barracuda……?
ZRS
2024-01-19 03:09:21 +08:00
Toshiba 只推荐买 MG 系列
ltkun
2024-01-19 04:14:58 +08:00
op raid10 竟然用软 raid 不用 zfs zfs 明显更加灵活性能也应该更好 失误哦 民用东芝是不行的 刚刚我用了五年的东芝被替换了 smart 已经报错 80 多次了
telaviv
2024-01-19 07:19:23 +08:00
买大硬盘推荐先读这个:
https://www.backblaze.com/cloud-storage/resources/hard-drive-test-data

自己的 NAS 用了东芝 MG 的氮气盘,比较安静,还算满意。
1KTN90lKW9gVJ9vX
2024-01-19 07:56:44 +08:00
我用东芝 n300 ,16t ,感觉还不错。
piku
2024-01-19 08:01:42 +08:00
正常啊,东芝的机械盘故障率一直是很高的(依据:某数据中心公开的统计报告
东芝固态(铠侠)其实还行的,但是性价比不高
litguy
2024-01-19 08:11:17 +08:00
感觉不像硬盘问题
硬盘不会这么大规模故障
重点检查硬盘供电,数据线和 RAID 卡
怀疑这些不稳定导致硬盘故障的
16 年企业级存储研发路过
litguy
2024-01-19 08:12:43 +08:00
把硬盘型号,机器配置,RAID 这些相信信息报告一下吧
Actrace
2024-01-19 08:17:18 +08:00
为啥不考虑 SSD ?
liuhaibin
2024-01-19 08:30:20 +08:00
10 年前买过 2 次东芝,没到就是坏的。从此不敢买
gbw1992
2024-01-19 08:30:59 +08:00
这种坏盘几率
我咋也感觉不像是硬盘的问题的
类似供电不稳定导致的
Xenotaros
2024-01-19 08:37:13 +08:00
大容量只推荐企业级硬盘
totoro625
2024-01-19 08:38:13 +08:00
@litguy #51 他是 mdadm 软 raid10 ,没有 raid 卡

这种情况是不是 zfs 更合适?
ReZer0
2024-01-19 08:44:12 +08:00
这个坏盘率的确有些离谱了,除非他们发出来的这个批次的盘大部分都不合格,不然一下子这么多块真的得考虑下电源问题。
itsjoke
2024-01-19 08:49:10 +08:00
最近一年应该买了上千块 MG 系列,坏盘率低于 ST 和 WD 。真的是稳,不过有一段时间老是坏盘,最后经过反复测试发现是机箱开了全速风扇导致的,供 OP 参考!
andydebug
2024-01-19 08:50:40 +08:00
人家都退市了,你说渣不渣

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/1009748

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX