Vandaag via Magician 4.6 de nieuwe firmware voor m'n 840 evo opgehaald en geïnstalleerd en het is nu al meer dan vier uur huilen met de pet op.
Het
goede nieuws is dat de benchmarkprestaties zienderogen vooruitgaan.
Ten tijden van de vorige firmware waarmee de schijf is geleverd:
Degradatie die aardig oploopt:
HDtune laat eenzelfde beeld zien (15 april):
Net na de nieuwe upgrade (en enkele crashes en reboots):
Verhoging van het aantal steekproeven laat zien dat het nog niet is wat het moet zijn:
Het (zeer)
slechte nieuws is dat ik nu ineens met een zwaar instabiel systeem zit.
Het leek allemaal nog goed te gaan nadat ik via Windows op een HDD mijn Linuxsysteem op de SSD had bijgewerkt aangezien vervolgens m'n Fedora-installatie (F21) met btrfs (voor 45.34GiB gevuld) prima opstartte.
Echter, wanneer ik me inogde op Gnome-Shell via Plymouth donderde het hele zaakje in elkaar:
- ata link resets
- kernel panics vanwege cpu freezes
- en btrfs checksum-fouten (mogelijk vanwege de herhaalde harde resets van mijn kant)
Ik kon dus nog gewoon tekstueel inloggen maar zodra ik grafisch inlogde crashte het systeem.
Na wat geklooi met disk schedulers (ben nu van noop weer naar de standaard cfq), het scrubben van m'n btrfs (nul fouten) en het verwijderen van m'n opgeslagen Gnome-Shell-sessie wil het langzaam weer lukken om in te loggen, echter bij elke reboot is het inloggen nog steeds een crime.
Een van de volledige crashes:
De ata-link-problemen die ik nog regelmatig zie bij het inloggen:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
| $ journalctl --system -f
apr 26 19:04:10 XVI.lan kernel: ata1.00: exception Emask 0x0 SAct 0x800000 SErr 0x0 action 0x6 frozen
apr 26 19:04:11 XVI.lan kernel: ata1.00: failed command: WRITE FPDMA QUEUED
apr 26 19:04:11 XVI.lan kernel: ata1.00: cmd 61/70:b8:e8:9d:fa/00:00:01:00:00/40 tag 23 ncq 57344 out
res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
apr 26 19:04:11 XVI.lan kernel: ata1.00: status: { DRDY }
apr 26 19:04:11 XVI.lan kernel: ata1: hard resetting link
apr 26 19:04:11 XVI.lan kernel: ata1: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
apr 26 19:04:11 XVI.lan kernel: ata1.00: supports DRM functions and may not be fully accessible
apr 26 19:04:11 XVI.lan kernel: ata1.00: supports DRM functions and may not be fully accessible
apr 26 19:04:11 XVI.lan kernel: ata1.00: configured for UDMA/133
apr 26 19:04:11 XVI.lan kernel: ata1.00: device reported invalid CHS sector 0
apr 26 19:04:11 XVI.lan kernel: ata1: EH complete
apr 26 19:04:42 XVI.lan kernel: ata1.00: exception Emask 0x0 SAct 0xc00 SErr 0x0 action 0x6 frozen
apr 26 19:04:42 XVI.lan kernel: ata1.00: failed command: READ FPDMA QUEUED
apr 26 19:04:42 XVI.lan kernel: ata1.00: cmd 60/08:50:a8:4b:65/00:00:10:00:00/40 tag 10 ncq 4096 in
res 40/00:01:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
apr 26 19:04:42 XVI.lan kernel: ata1.00: status: { DRDY }
apr 26 19:04:42 XVI.lan kernel: ata1.00: failed command: READ FPDMA QUEUED
apr 26 19:04:42 XVI.lan kernel: ata1.00: cmd 60/20:58:20:32:16/00:00:00:00:00/40 tag 11 ncq 16384 in
res 40/00:01:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
apr 26 19:04:42 XVI.lan kernel: ata1.00: status: { DRDY }
apr 26 19:04:42 XVI.lan kernel: ata1: hard resetting link
apr 26 19:04:42 XVI.lan kernel: ata1: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
apr 26 19:04:42 XVI.lan kernel: ata1.00: supports DRM functions and may not be fully accessible
apr 26 19:04:42 XVI.lan kernel: ata1.00: supports DRM functions and may not be fully accessible
apr 26 19:04:42 XVI.lan kernel: ata1.00: configured for UDMA/133
apr 26 19:04:42 XVI.lan kernel: ata1.00: device reported invalid CHS sector 0
apr 26 19:04:42 XVI.lan kernel: ata1.00: device reported invalid CHS sector 0
apr 26 19:04:42 XVI.lan kernel: ata1: EH complete |
SMART-fouten die ineens de kop op steken (voor de firmwareupgrade was hij spotless, maar oké mogelijk veroorzaakt door de harde resets):
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
| $ sudo smartctl -a /dev/sda
smartctl 6.2 2014-07-16 r3952 [x86_64-linux-3.19.4-200.fc21.x86_64] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Device Model: Samsung SSD 840 EVO 250GB
Firmware Version: EXT0DB6Q
User Capacity: 250,059,350,016 bytes [250 GB]
Sector Size: 512 bytes logical/physical
Rotation Rate: Solid State Device
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: ACS-2, ATA8-ACS T13/1699-D revision 4c
SATA Version is: SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Sun Apr 26 20:19:12 2015 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
9 Power_On_Hours 0x0032 099 099 000 Old_age Always - 2092
12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always - 120
177 Wear_Leveling_Count 0x0013 099 099 000 Pre-fail Always - 2
179 Used_Rsvd_Blk_Cnt_Tot 0x0013 100 100 010 Pre-fail Always - 0
181 Program_Fail_Cnt_Total 0x0032 100 100 010 Old_age Always - 0
182 Erase_Fail_Count_Total 0x0032 100 100 010 Old_age Always - 0
183 Runtime_Bad_Block 0x0013 100 100 010 Pre-fail Always - 0
187 Reported_Uncorrect 0x0032 099 099 000 Old_age Always - 2
190 Airflow_Temperature_Cel 0x0032 066 055 000 Old_age Always - 34
195 Hardware_ECC_Recovered 0x001a 199 199 000 Old_age Always - 2
199 UDMA_CRC_Error_Count 0x003e 100 100 000 Old_age Always - 0
235 Unknown_Attribute 0x0012 099 099 000 Old_age Always - 16
241 Total_LBAs_Written 0x0032 099 099 000 Old_age Always - 2427381314
SMART Error Log Version: 1
No Errors Logged |
Gnome-Shell en dbus die over de zeik gaan bij het inloggen:
Wat apart is dat het probleem pas de kop opsteekt zodra ik inlog op m'n grafische sessie, wat te maken lijkt te hebben met het automatisch herstellen van m'n sessie (opstarten van firefox), het inladen/voorbereiden van de Gnome tracker-database (welke in mijn geval zo'n gigabyte groot is en mogelijk zwaar onderhevig is aan fragmentatie aangezien het een database is op btrfs) en mogelijk in combinatie met het wegschrijven van data (want waarom geeft anders het opstarten zelf en het scrubben van de volledige schijf geen problemen?).
Het lijkt overigens langzaam iets beter te worden (algoritme heeft voldoende data ververst?), maar de kans lijkt me groot dat wanneer de schijf een weekje of twee uitstaat het feest weer van voor af aan begint.
Kortom, ik ben dus door de firmwareupdate van een enigszins vertraagd (in de benchmarks en bij het dumpen van de schijf, bij normaal gebruik merkte ik niks) maar absoluut stabiel systeem naar een in de benchmarks sneller maar compleet instabiel systeem gegaan.
Bedankt Samsung voor je mislukte lapmiddeltjes voor deze baggerdrive

Een recall lijkt me de enige correcte oplossing.
Ik ga nu eens kijken of ik m'n systeem weer in de gewenste staat kan krijgen (door te defragmenteren, mogelijk de tracker uit te schakelen en zo nodig een downgrade van de firmware).
Weet iemand of de firmware überhaupt kan worden gedowngraded?
Edit: na een internetzoektochtje naar "ata failed command: READ FPDMA QUEUED samsung 840" blijkt het dat samsung er wel vaker een potje van maakt (ik vind dat Samsung het nadeel van de twijfel heeft).
Heb nu NCQ uitgeschakeld en het lijkt nu weer stabiel.
Wel vreemd dat dit al een tijd een groot probleem is maar dat ik er nu pas last van heb.
Edit 2: nog wat verder gezocht en het lijkt erop dat Samsung zich op bepaalde zaken niet aan de sata-standaard houdt.
In Linux 3.19 stond het nog twee keer (blijkbaar omdat ze zelfs niet de eigen naam consistent kunnen spellen in de identifier) in de blacklist voor ATA_HORKAGE_ZERO_AFTER_TRIM voor al zijn SSD's en in 4.0 is daar een derde vermelding bijgekomen voor de 850 pro voor ATA_HORKAGE_NO_NCQ_TRIM.
Ik vermoed dat er in de toekomst nog meer van Samsung op de blacklist wordt gezet (of de specifieke regel voor de 850 wordt veralgemeniseerd) want het lijkt erop dat ze de zaken met de firmwareupgrades alleen maar meer verprutsen.
Ik vind dat de markleider in SSD's, die tevens actief adverteert met hun geweldigde NCQ (wel acht vermeldingen op deze site), zich wel eens wat professioneler mag opstellen.
Ik ga me bij mijn volgende aankoop dus maar eens flink achter m'n oren krabbelen na het hele 840 debacle.
[
Voor 12% gewijzigd door
XVI op 27-04-2015 13:50
. Reden: Work-around gevonden ]