Linux 硬體測試指南(CPU、記憶體、網卡、ACPI)
Linux 伺服器的穩定性與效能依賴於硬體的正常運作。本篇將介紹如何測試與診斷 CPU、記憶體、網卡(NIC)與 ACPI(電源管理與硬體狀態),確保系統運行穩定。
目錄
CPU 測試與診斷
查看 CPU 相關資訊
檢查 CPU 型號與核心數量:
lscpu
顯示 CPU 即時溫度(需支援 lm_sensors
):
sudo dnf install lm_sensors -y
sensors
使用 stress-ng
進行 CPU 壓力測試
安裝 stress-ng
:
sudo dnf install stress-ng -y
執行 4 核心 100% 負載測試 60 秒:
stress-ng --cpu 4 --timeout 60s --metrics-brief
測試 CPU 浮點計算能力:
stress-ng --matrix 8 --timeout 60s --metrics-brief
使用 sysbench
進行 CPU 效能測試
安裝 sysbench
:
sudo dnf install sysbench -y
執行 CPU 測試:
sysbench cpu --cpu-max-prime=20000 run
記憶體測試
檢查記憶體使用情況
free -h
檢查記憶體錯誤:
sudo dmesg | grep -i "memory error"
使用 memtester
進行記憶體壓力測試
安裝 memtester
:
sudo dnf install memtester -y
測試 2GB 記憶體(請確保有足夠可用 RAM):
sudo memtester 2G 1
使用 stress-ng
進行記憶體測試
stress-ng --vm 4 --vm-bytes 1G --timeout 60s --metrics-brief
使用 mcelog
檢查記憶體錯誤
sudo dnf install mcelog -y
sudo mcelog --ascii
網卡(NIC)測試
檢視網卡資訊
ip link show
顯示所有網卡的詳細資訊:
ethtool eth0
測試網路連線
ping -c 10 google.com
測試封包遺失:
mtr -r -c 10 google.com
使用 iperf3
進行網路效能測試
伺服器端啟動 iperf
監聽:
iperf3 -s
客戶端測試速度(假設伺服器 IP 為 192.168.1.100
):
iperf3 -c 192.168.1.100 -t 60
使用 netperf
進行 TCP/UDP 測試
安裝 netperf
:
sudo dnf install netperf -y
啟動伺服器:
netserver
客戶端測試 TCP 速度:
netperf -H 192.168.1.100 -t TCP_STREAM
測試 UDP 延遲:
netperf -H 192.168.1.100 -t UDP_RR
ACPI 測試與診斷
檢視 ACPI 設備狀態
acpi -V
檢查電池與電源管理狀態
cat /sys/class/power_supply/BAT0/status
cat /sys/class/power_supply/BAT0/capacity
檢查 ACPI 記錄的異常錯誤
dmesg | grep -i acpi
啟用 ACPI 除錯模式
sudo dmesg -c
sudo acpid -d
使用 powertop
進行電源管理分析
安裝 powertop
:
sudo dnf install powertop -y
執行測試模式:
sudo powertop --calibrate
監控即時功耗:
sudo powertop
結語
本篇提供了 Linux 伺服器的硬體測試指南,涵蓋 CPU、記憶體、網卡、ACPI 相關測試與診斷工具,確保硬體穩定運行。透過這些工具,您可以監測效能、診斷問題並確保系統運行在最佳狀態。