proxmox ve 中nvme电源管理问题导致的磁盘性能急剧下降问题
proxmox ve 中nvme电源管理问题导致的磁盘性能急剧下降问题
这几天部署了proxmox ve
双节点集群,正常用没什么问题,但是过了一天,dell r720
这台主机,ssh
上去发现shell
的反应好慢,然后进去里面的linux container
,也是反应慢得狠,每打一个命令,zsh
都要卡半天.
以为是zsh
的问题,换了bash
, fish
只是强一点点,用vim
打开本地文件也是很慢,是不是硬盘出了问题? 这台dell
主机上的系统盘是West Digital
的SN750 1T
,照说应该不慢,于是我测了一下:
|
|
不测不知道,一测吓一跳:
|
|
慢得不正常, sudo dmesg | grep -i error
, sudo grep -i 'error' /var/log/syslog
都没发现有什么问题,是系统磁盘,装好后就没动过.
重启大法试一下,发现进系统需要好长时间,用smarttools
,查看,也没有坏道,没任何错误,郁闷了,google
,bing
搜索了半天,没有太大收获,有一个回答里面带过可能是apm
电源管理的问题,要使用hdparm
来查看设置,找了半天,对我的硬盘没效果,会报错.
想了半天,发现我搜索的是ssd
,我换了个关键字nvme
去搜索.
发现了一个新工具: nvme-ctl
, 有人说用这个来检查nvme
的电源管理配置,查了下manpage
,要用nvme get-feature
来查看电源管理,但是里面的参数--feature-id
是什么没说,又继续找.
在nvme
的官网找到一个,feature-id
=0x02
是指电源管理,试着运行了一下:
|
|
得到结果:
|
|
有结果了,可是0x03
具体是多少呢?我想起来之前用smarttools
查看的时候好像有电源配置列表,试了一下,真有:
|
|
可以看到0x03
和前面的差距好大,基本就是休眠了,把他调到0x02
试试:
|
|
结果舒服了:
|
|
222 MB/s
读写终于感觉了,给他改到0x01
:
|
|
结果:
|
|
折腾了一晚上,准备重装系统了,用new bing
的chat gpt
一步步对话找到了答案,chat gpt
虽然厉害,但是提问也很重要,他可没有人类那么强的猜测能力.
终于实现速度自由
了.