OK met deze post komen we tot de kern.
De lanes in waarin die stromen gaan, dus je transistoren, kunnen gewoon een beperkt percentage op langere termijn aan. Ga je overvolten, ga je powermodden, ga je er meer stroom doorheen jagen dan wat de fabrikant veilig acht voor de komende jaren, dan slijt dat veel harder. In dit geval kan stroom als het ware "overspringen" van de ene trace naar de andere, en dan krijg je gewoon hele gekke results.
Het zal me niet verbazen dat je op een gegeven moment problemen krijgt met natuurkunde als je zwaar gaat overvolten. Namelijk bijvoorbeeld doordat de weerstand van halfgeleiders zoals GPU's door hogere temperaturen omhoog gaat. Als dat extreem wordt, dan gaan op een gegeven moment de voltages over andere paden lopen dan dóór de halfgeleider, want de weerstand van dat andere pad is lager.
Dan krijg je instabiliteit. Maar wederom is dit géén model voor degradatie; als je dit proces geen kortsluiting of schade veroorzaakt en je daarna de voltmod weer verwijderd, zou de GPU weer normaal moeten werken.
De Vega 56 bijv. Je kon hier een Vega 64 bios in flashen, waarmee je het HBM geheugen dat op de V56, sneller kon klokken en gelijk aan V64 speeds kon krijgen. Echter binnen een half jaar of zelfs jaar al zag je overal threads voorbij komen, met ja, het geheugen blijft niet meer stabiel. Dat is nou degradatie.
https://www.reddit.com/r/.../hbm_degradation_vega_64/
Dit is inderdaad een notoir voorbeeld, welke ik ook aan haal in mijn eerste post. Als je de limiten van Vega's afhaalt kunnen deze echt extreem overvolt en overclockt worden.
Maar zoals je al zegt, worden andere onderdelen instabiel, zoals het geheugen. Dat is niet de GPU.
Ik kan mij voorstellen als je 300+ watt door een GPU duwt dat je dan zulke temperatuurschommelingen krijgt waardoor bijv de koeler, PCB of de chip kromt/buigt en daardoor scheurt. Dat is wederom niet degradatie; dan is ie ineens kaputt ipv langzaam over tijd.
Klopt. En niemand gaat een CPU ook voor intensieve taken voor de komende 10 jaar inzetten ofzo gevolgd met een heftige OC. CPU's zullen uiteindelijk stuk gaan. Ik durf te wedden dat als je een oeroude K6 ofzo nu voor de komende jaren op 100% load zet uiteindelijk ook degraderen zal. Dat is gewoon de nature van de chip. Er zit gewoon een hoop veiligheidsmarge op ingebouwd, die verleg je zodra je hogere clocks doorheen jaagt en automatisch meer stroom verbruiken gaat.
Ik heb zelf veel GPU's overgeklokt, het hoogtepunt was een X2600pro volgens mij op een vapochill en met ruim 2.05V VCore. Dit resulteerde in een minus 25 graden gekoelde chip op ruim 1270 mhz zo uit m'n hoofd, dat was een OC van meer dan 100% (600mhz stock). Dat duurde maar heel even, de vonken sloegen achter de kaart weg en het was gebeurd. Zo'n suicide run kan maar heel kortstondig; daarna gaat het toch echt stuk als je het way beyond specificatie's laat draaien.
Mijn theorie is dit: het laatste wat faalt aan een computer systeem is het harde stuk semi-glas dat de CPU/GPU wordt genoemd.
Alles andere componenten en spul slijt/breekt/buigt/splijt/lekt/ontploft eerder dan dat de chip degradeert.
Dus dat maakt dus dat je vanuit dat oogpunt moet overclocken. En vanuit dat punt moet je ook kijken naar de instabiliteit die je ziet na overclocken.
Ik denk ook dat dit maakt dat 'high end' moederborden interessant zijn, want die hebben hogere kwaliteit componenten/MOSFETs en meer lagen in de PCB voor ruisonderdrukking en hogere weerstanden voor hogere voltages.
Een chip heeft miljarden transistoren, baantjes in waarin stroom en signalen doorheen gaan. Zie het als visdraad. Zet er een te grote spanning op en het scheurt met als gevolg een breuk. Hoe kleiner het procede ook, hoe gevoeliger ook voor hogere voltages of stroom.
Zie ook
Wikipedia: Electromigration
Hier is een goed,
modern artikel wat gaat over Electromigration. En ja, dit is een proces dat uiteindelijk geleidende materialen schaad. Maar dat is een erg langdurig proces, hoe Ian Cutress het omschrijft:
Modern day equipment is designed to run for a decade or longer. What we are seeing with these numbers, while there is an increase in thermals due to the increased power, isn’t actually a sizable shift. In The Stilt’s report, because the processor sees that it has extra power headroom, then it raises the voltage slightly in order to get the +75 MHz extra that the budget will allow, which increases the average voltage from 1.32 volts to 1.38 volts during a CineBench R20 run. The peak voltage, which matters a lot for electromigration, only moves from 1.41 volts to 1.42 volts. The overall power was increased 25 W, which makes for around 30A more. Not something on the order of a change in the order of magnitude.
So if I end up with a motherboard that adjusts this perceived current value, will it brick my processor? No. Not unless you have something else seriously wrong with your setup (such as thermals). Within the given lifetime of that product, and the next decade after, it is not likely to make a difference. And as stated previously, even if this did affect electromigration on a large scale, the processor manufacturers have built in mechanisms to deal with it
Dus hoe nieuwer de CPU, hoe beter het bestand is tegen electromigration, lees ik hier

Het staat mooi uitgelegd op YouTube: Ask GN 92: What Kills CPUs - Heat or Voltage? Used Mining GPUs Safe?
Zelfs Steve hier legt
niet uit wat nou hetgeen is wat zorgt voor die degradatie, in het begin van dit filmpje. Het zou kunnen dat hij het over Electromigration heeft, maar het lijkt me sterk dat dat proces normaal decennia duurt bij 1.2v en vervolgens maar een half jaar bij 1.3v. Hij haalt vervolgens aan dat je dodelijke voltages hebt: daar ben ik het mee eens, zoals boven uitgelegd.
Ik ken hem, hij heeft zeer veel ervaring, maar ook hij heeft niet de empirische gegevens om vast te stellen dat "CPU slijtage" hetgeen is dat de clockspeed naar beneden haalt. Het zou best nog iets anders op de CPU package kunnen zijn, dan de chip zelf.
Het is een complexe discussie