Help!!!! schreef op zaterdag 16 november 2024 @ 18:03:
[...]
Toch even voor mijn duidelijkheid vroeg ik me af waar je dit op baseert?
Wat ik mij namelijk herinner vind ik bijv.
hier terug voor de 7700x en volgensmij is dat niet anders dan voor de 9800X3D.
"When it comes to cooling, Zen 4 CPUs give the impression that they're difficult to cool by delivering as much performance as possible by taking full advantage of the thermal and power headroom. AMD says with the new AM5 platform and higher TDP, Zen 4 processors will run into a thermal wall before they hit a power wall. This means under heavy load they'll sit at TJMax which is about 95 degrees Celsius for the Ryzen 7000 series, and this will be particularly true for the 12 and 16-core models.
AMD has stressed that this behavior is by design and it's important to note TJMax is the maximum safe operating temperature – not the absolute maximum temperature. AMD went on to say that 95C is not running hot, rather Zen 4 will intentionally go to this temperature under load because the power management system knows that this is the ideal way to squeeze the most performance out of the chip without damaging it.
The processors are designed to run at TJMax 24/7 without risk of damage or deterioration they added.
De 80°C grens is iets wat ik persoonlijk als gezonde bovengrens beschouw. En dat is gebaseerd op diverse zaken eigenlijk:
- Gebruikelijk temperatuur bij GPU's. AMD chip hebben een Tjmax van 115°C, maar tenzij de koeling defect is, zal je niet zien dat daarop is afgestemd. <90°C hotspot lijkt door fabrikanten als doel gekozen te zijn in de afweging temperatuur/koellawaai.
- Gebruikelijke temperatuur geheugenchips. Deze kennen een Tjmax van 100-105°C als ik mij niet vergis en de package/case temperatuur is ca. 15-20°C hoger. 60°C Tcase wordt als gezonde grens beschouwd (waarbij het nog stabiel blijft).
- Gebruikelijke temperatuur VRM's. Tjmax daarvan kan zelfs tot 150°C gespecificeerd zijn. Toch zie je in de praktijk dat er ver vandaan wordt gebleven. Zowel bij moederborden als bij GPU's.
De doodsoorzaak van een GPU is trouwens meestal gerelateerd aan VRM's en/of geheugenchips die het begeven. Bij geheugenchip als oorzaak bijv. de BGA soldering dat door thermische stress loslaat. - Eigen ervaring met de AMD 3800X cpu. Daar was met geen mogelijkheid de allcore klok te boosten, ondank dat er in principe veel thermal headroom was (Tj zat op 70-75°C). En niet tegen andere limieten zoals stroom/spanning of Fmax aangelopen werd. Er zit echt een temperatuur plafond, waarbij de boostklok al vroeg op de rem ging. Ik weet niet precies meer bij welke temperatuur dat al in werking kwam, maar het was in ieder geval heel laag zo rond 60°C. Het is mij dan ook niet gelukt om ook maar in de buurt van de Tjmax te komen.
- Wat voorheen als gezonde cpu temperatuur werd beschouwt (toen de temperatuur nog met dioden in een socket werd gemeten, dus 60°C = pakweg 80-90°C Tj). Vergeleken met nu waren dat CPU's met relatief weinig vermogen / stroom.
Daarnaast ben ik (i.v.m. een andere hobby) ook in contact geweest met een aantal electronica ingenieurs die o.a. geheel zelf discrete versterkers hebben ontworpen en gebouwd (misschien zegt de ExtremA of Composiet AMP iemand iets?). Ze vertelden dat een Tjmax van een component niet als veilige grens beschouwd moet worden, maar als een uiterste. Het is niet iets waar op ontworpen hoort te worden i.v.m. marges die aangehouden moeten worden. Een afweging/kwestie van levensduur.
Het woordje veilig is daarbij een relatief begrip, want een harde/duidelijke temperatuurgrens waarbij dingen wel of niet kapot gaan bestaat er niet (buiten di-electric breakdown voltage om, waarbij een transistor of halfgeleider 'doorslaat').
Het is een relatie tussen spanning, stroom en temperatuur dat bepaald hoe lang iets meegaat of x % uitval van iets is te verwachten. Daar zullen ze bij AMD ook een berekening voor doen, hoewel ik het vermoeden heb dat er tegenwoordig met de 'veiligheids' marge gespeeld wordt. Wat vroeger not-done was, wordt nu wellicht als acceptabel gezien. Maar ja dat is slechts een vermoeden.
In datasheets van vermogens transistoren of vrm's wordt er vaak een zogenaamde derating curve gegeven, waar afhankelijk van de temperatuur de toelaatbare stroom op getoond wordt.
Bij Tjmax is dat een stuk minder dan bij bijvoorbeeld 40°C.
Om die reden is daarom een vergelijking met laptop chips niet zomaar te maken.
Het is weliswaar hetzelfde silicon waarvan de cpu's zijn gemaakt, maar daarnaast is het vermogen (dus ook stroom) bijna een factor minder met 15-45W.
Ik geloof verder ook niet dat daarbij als ontwerpdoel in gedachten wordt gehouden dat gebruikers de cpu's langdurig zwaar zullen belasten met bijv. renderwerk of het transcoderen van video's.
Daarnaast zal de verwachte levensduur van een laptop ook lager liggen dan een desktop.
AMD has stressed that this behavior is by design and it's important to note TJMax is the maximum safe operating temperature – not the absolute maximum temperature. AMD went on to say that 95C is not running hot, rather Zen 4 will intentionally go to this temperature under load because the power management system knows that this is the ideal way to squeeze the most performance out of the chip without damaging it. The processors are designed to run at TJMax 24/7 without risk of damage or deterioration they added.
Het verschil dat Techspot hier aanhaalt is wel merkwaardig te noemen. Het suggereert alsof er een tweede grens is. Maar absolute maximum rating is een grens waarbij dingen echt kapot gaan. Operating staat er dan ook expliciet niet bij.
In de datasheets van halfgeleider onderdelen worden vaak twee tabellen gegeven.
Een tabel met absolute maximum ratings en een tabel met recommended operating conditions.
Neem bijvoorbeeld de datasheet van een vrm, de
TDA21472 (wordt o.a. voor de RX6900XT gebruikt).
Daar wordt de volgende notitie gegeven bij absolute maximum ratings:
Stresses above those listed in Table 6 “Absolute Maximum Ratings” may cause permanent damage to the device.These are absolute stress ratings only and operation of the device is not implied or recommended at these or any other conditions in excess of those given in the operational sections of this specification. Exposure over values of the recommended ratings for extended periods may adversely affect the operation and reliability of the device.
En dit is een boodschap wat regelmatig voorkomt in datasheets.
De TDA21472 heeft een Tjmax van 150°C, waarbij Tj 125°C als aanbevolen bovengrens wordt gegeven.
AMD specificeert bij haar CPU's slechts een
"max. operating temperature" met Tjmax tussen haakjes.
Of dat een veilige grens is laten ze verder open. Het is ook niet gebruikelijk om de term 'safe' erbij te betrekken omdat het vrij subjectief is. Ik geloof in deze zin datasheets en wat ingenieurs vertellen meer dan wat een woordvoerder van AMD zegt.
Het is verder belangrijk om te benadrukken dat er een groot verschil is tussen degradatie = slijtage en kapot gaan. Degradatie is een proces dat altijd gaande is in gebruik en in snelheid varieert.
Afhankelijk van de combinatie van temperatuur, stroom en spanning en de marges die aangehouden worden, kan het 50 jaar duren voordat een punt wordt bereik waarbij een CPU onstabiel wordt. Of het kan binnen 1 jaar al voorkomen. Onstabiele CPU staat gelijk aan kans op datacorruptie. Het is imho niet zo onschuldig als op het eerste gezicht lijkt met vage crashes in games.
Zie de degradatie problemen rondom Raptor Lake. Het is een voorbeeld waarbij vermoedelijk de grenzen teveel zijn opgezocht. Het verhaal over te hoge spanningen is denk ik dan ook maar de halve waarheid.
Wat vaststaat is dat de stroomlimieten aan de laars zijn gelapt en dat de CPU's tot Tjmax gepushed werden in combinatie met een hoog verbruik/veel stroom.
Het is opmerkelijk dat met de stap van Ryzen 3000 serie naar Ryzen 5000 de turbo erop ging en het opeens allemaal ok en 'veilig' was om cpu's continue tot Tjmax te laten boosten. Vast niet om te kunnen wedijveren met Intel
Voor alle duidelijkheid de Tjmax van een CPU is niet zoveel veranderd in de laatste decennia (zowel bij Intel als AMD). Voor de 3800X / 5800X / 7700X / 9700X / 9800X3D is dat 95°C.
Los van het degradatie(snelheid) argument is het voor het verbruik ook beter om de CPU niet zo heet te laten worden. De verliezen nemen progressief toe bij hogere temperatuur en dat kan aanzienlijk zijn >60°C.
In de recente 9800X3D review van Der8auer is dat mooi te zien bij het resultaat van het delidden.
15-20W verschil door 15-20°C lagere temperatuur.