NVMe SSD kapot?

Pagina: 1
Acties:

Acties:
  • 0 Henk 'm!

  • DeRoelO
  • Registratie: November 2022
  • Laatst online: 03-10 13:22
Goedemiddag,

Korte voorstelronde, ik ben een tweaker die geen achtergrond in de IT heeft maar wel grote interesse en zichzelf door schade en schande rijker aan het maken is.

Ik ben ongeveer 2 maanden geleden begonnen met het opzetten van een homeserver. Op een Thinkcentre M720q. Grotendeels geassisteerd door AI om mijn te kort aan kennis te compenseren.

Helaas freezed mijn server regelmatig zonder aanwijsbare redenen. Volgens Gemini moest ik het commando "journalctl -b -1 | tail -n 100" uitvoeren. Uit de output filterde hij de volgende regels uit:

Sep 28 22:55:03 proxmox kernel: pcieport 0000:00:1b.0: DPC: containment event, status:0x1f01: unmasked uncorrectable error detected
Sep 28 22:55:03 proxmox kernel: nvme nvme0: frozen state error detected, reset controller
Sep 28 22:55:03 proxmox kernel: pcieport 0000:00:1b.0: AER: device recovery successful

Nu komt het: Gemini zegt dat de SSD kapot aan het gaan is. En ik een nieuwe moet kopen, ChatGPT zegt dat het een firmware fout is..

Kan iemand me helpen?

Ter info:

Model Number: Micron 2200S NVMe 256GB
Serial Number: 200229F40845
Firmware Version: 22001070
PCI Vendor/Subsystem ID: 0x1344
IEEE OUI Identifier: 0x00a075
Controller ID: 0
NVMe Version: 1.2.1
Number of Namespaces: 1
Namespace 1 Size/Capacity: 256,060,514,304 [256 GB]
Namespace 1 Formatted LBA Size: 512
Namespace 1 IEEE EUI-64: 00a075 0129f40845
Local Time is: Tue Sep 30 10:16:15 2025 CEST
Firmware Updates (0x02): 1 Slot
Optional Admin Commands (0x0017): Security Format Frmw_DL Self_Test
Optional NVM Commands (0x0017): Comp Wr_Unc DS_Mngmt Sav/Sel_Feat
Log Page Attributes (0x02): Cmd_Eff_Lg
Maximum Data Transfer Size: 128 Pages
Warning Comp. Temp. Threshold: 82 Celsius
Critical Comp. Temp. Threshold: 85 Celsius

Supported Power States
St Op Max Active Idle RL RT WL WT Ent_Lat Ex_Lat
0 + 8.25W - - 0 0 0 0 0 0
1 + 2.40W - - 1 1 1 1 0 0
2 + 1.90W - - 2 2 2 2 0 0
3 - 0.0800W - - 3 3 3 3 10000 2500
4 - 0.0050W - - 4 4 4 4 50000 175000

Supported LBA Sizes (NSID 0x1)
Id Fmt Data Metadt Rel_Perf
0 + 512 0 0

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART/Health Information (NVMe Log 0x02)
Critical Warning: 0x00
Temperature: 30 Celsius
Available Spare: 100%
Available Spare Threshold: 50%
Percentage Used: 8%
Data Units Read: 35,210,961 [18.0 TB]
Data Units Written: 1,012,708 [518 GB]
Host Read Commands: 179,770,450
Host Write Commands: 26,343,187
Controller Busy Time: 1,785
Power Cycles: 154
Power On Hours: 158
Unsafe Shutdowns: 132
Media and Data Integrity Errors: 0
Error Information Log Entries: 20
Warning Comp. Temperature Time: 0
Critical Comp. Temperature Time: 0
Temperature Sensor 1: 30 Celsius
Temperature Sensor 2: 32 Celsius

Error Information (NVMe Log 0x01, 16 of 256 entries)
Num ErrCount SQId CmdId Status PELoc LBA NSID VS Message
0 20 0 0x0004 0x8004 0x000 0 0 - Invalid Field in Command

Read Self-test Log failed: Invalid Namespace or Format (0x00b)

Acties:
  • 0 Henk 'm!

  • mrmrmr
  • Registratie: April 2007
  • Niet online
Er zijn 2 fouten denk ik. De eerste (unmasked uncorrectable error detected) is de ernstige. De tweede is het oplopen van het aantal errors. "Invalid Field in Command" is niet ernstig. Het komt doordat Linux tijdens booten opdrachten stuurt die de SSD niet kent.

Je hebt denk ik al de laatste firmware (22001070 1 2). Firmware kan corrupt raken. Je kan proberen die opnieuw erop te zetten als laatste poging om de SSD te redden.

De drive kan ook kapot zijn gegaan. Een nieuwe SSD kost weinig, dat is ook een optie. Bijvoorbeeld uitvoering: Kioxia Exceria Plus G3 1TB

Die is groter, dat heeft als voordeel dat het langer meegaat, met name als je de SSD relatief zwaar wordt gebruikt voor bijvoorbeeld logging en monitoring. Bij jou zijn er 18TB writes geweest, deze Kioxia heeft als spec 600TB.

Je kan ook een aantal onderdelen uitschakelen zodat de belasting lager wordt. Dat is veel zuiniger.

[ Voor 9% gewijzigd door mrmrmr op 30-09-2025 11:01 ]