Video decoding performance: Xeon w5-2565X vs Ultra 9 285T

Pagina: 1
Acties:

Vraag


  • Supermario16
  • Registratie: Mei 2004
  • Laatst online: 21:58
In een professionele omgeving maken we gebruik van werkstations gebaseerd op een Xeon w5-2565X in combinatie met een Nvidia RTX 4000 ADA. We proberen met deze configuratie 32 1080p (30fps) beelden te decoderen op twee verschillende (QHD) schermen, die beide aan dezelfde GPU gekoppeld zijn. Volgens de specificaties van onze software leverancier zou dit moeten kunnen, ook als we dit vergelijken met concurrerende software. Het systeem heeft er echter erg veel moeite mee, was resulteert in een lagere fps in het decoden (ongeveer 12fps gemiddeld).

Als we exact dezelfde applicatie met dezelfde load (32 beelden, 1080p, 30fps, twee schermen) laten lopen op een i9 Ultra 285 met dezelfde GPU draait het systeem als een zonnetje.

Daarnaast hebben we nog een oud beestje (gebaseerd op een Xeon E5-1630v3 in combinatie met een Nvidia P2000 kaart) die in sommige situaties soepeler lijkt te presteren ten opzichte van de nieuwe configuratie.

Overige relevante zaken:
  • De Xeon gebruikt ongeveer 45% CPU en 62% GPU in dit scenario;
  • De i9 gebruikt ongeveer 25% CPU en 46% GPU in dit scenario;
  • Drivers / Windows 11 zijn volledig bijgewerkt op de laatste versie;
  • Bios / Windows instellingen staan op high performance, "eco" instellingen staan uit;
De i9 lijkt meer single thread performance te leveren. De software die we gebruiken is echter 32bits en spint voor elke core een nieuw achtergrondproces op om het geheugen gebruik over meerdere processen te spreiden. Ik zou dus verwachten dat het single thread performance verschil geen grote impact zou moeten hebben.

Iets anders dat ik me nog voor kan stellen is dat de oudere Xeon hardware en i9 beter overweg kunnen met de 32bits software, en dat nieuwe generaties Xeons hier minder goed mee overweg kunnen. Echter wordt dit tegengesproken door de testen die de software leverancier zelf uitgevoerd heeft op vergelijkbare processoren.

We hebben al met verschillende BIOS instellingen getest (Hypertreading aan/uit, disablen van C-states) maar dit lijkt weinig verschil te hebben.

We zijn met de leverancier van de software als de hardware aan het onderzoeken waar dit verschil vandaan komt, maar ik zou ook graag jullie ervaring meenemen.

Alle reacties


  • mrmrmr
  • Registratie: April 2007
  • Niet online
Kijk eens in de event viewer of er meldingen zijn.

Je kan met grafische analysetools kijken of er verschillen zijn in de ondersteuning van functies/libraries. Begin bijvoorbeeld met GPU-Z. Je geeft niet aan welke software je gebruikt en welke instellingen/drivers(/libraries) je daar gebruikt. Dat is essentieel voor troubleshooten.

Kun je een specificatie toevoegen over alle hardware? Inclusief SSD's en geheugen (Pricewatch links bij voorkeur). Volledige productnamen met modelnummers.

Het percentage cpu gebruik is een relatieve kwantificatie, 25% is dus niet noodzakelijk minder dan 45%. Dat kan bijvoorbeeld gebeuren als het aantal/type cores verschillend is. Processen die (erg) kort duren kunnen te snel zijn voor zichtbaarheid in task manager.

  • Supermario16
  • Registratie: Mei 2004
  • Laatst online: 21:58
We kunnen het probleem reproduceren op verschillende configuraties. Ook een I7-8700k ten opzichte van een Xeon W5-2465X geeft een vergelijkbaar resultaat. De data komt niet van een SDD/HDD maar van het netwerk in de vorm van UDP. We zouden de performance manager nog in kunnen richten om te kijken of er processen zijn die in de task manager niet (goed) zichtbaar zijn.

We hebben ook verschillende GPUs (o.a. RTX4000, RTX4000 ADA en RTX2070) naast elkaar gelegd en in de Xeon systemen is de performance merkbaar lager ten opzichte van de vergelijkbare Core systemen. Vandaar dat mijn vraag ook specifiek op ervaringen met de CPU gericht is.

Het gaat overigens om HP Z4 (Xeon) en Z2 (Core) systemen. We hebben er nog een Core systeem van Dell bij genomen en deze presteert vergelijkbaar als het Core systeem van HP.

  • Dennism
  • Registratie: September 1999
  • Laatst online: 21:53
De geteste installaties zijn software matig ook 100% gelijk? Niet dat er mogelijk 'onderwater' verschillen zijn in bijvoorbeeld de software installatie of de OS configuratie / drivers en dat soort zaken.

  • mrmrmr
  • Registratie: April 2007
  • Niet online
Verschillende processoren en gpu's hebben verschillende soorten ondersteuning voor grafische libraries, zoals Intel Quick Sync en andere functiesets. Als een bepaalde versnellingsfunctie niet aanwezig is in een bepaalde processor kan software intern besluiten een andere methode te kiezen, die is meestal veel trager. Compilers compileren met of zonder ondersteuning voor een bepaalde versie van AVX of SSE. Als een methode ontbreekt zal er doorgaans worden teruggevallen op een (veel) trager stukje code. Het wel of niet ondersteunen van een nieuwe instructieset door de software kan sterke performanceverschillen geven.

De keuze van GPU libraries door de software kan ook sterke verschillen opleveren.

Als je de output van CPU-Z en GPU-Z vergelijkt op alle systemen kun je zien waar de verschillen zitten. Door alleen met cpu te meten elimineer je de invloed van de GPU.

Je kan de performance van grote aantallen processen die heel snel eindigen niet monitoren. Ze zijn dan te snel om te worden waargenomen door het besturingssysteem. In bepaalde mate is performance te meten door het in te compileren. Dat kun je met of-the-shelf software als gebruiker uiteraard niet zelf. Om het nog complexer te maken: de waarneming zelf beïnvloed de snelheid. Verzamelen en weergeven of opslaan van data kost tijd.

  • CH4OS
  • Registratie: April 2002
  • Niet online

CH4OS

It's a kind of magic

@mrmrmr Xeons hebben nooit Quick Sync. Zo ook deze niet: https://www.intel.com/con...0-ghz/specifications.html

  • mrmrmr
  • Registratie: April 2007
  • Niet online
@CH4OS Die heeft geen interne gpu inderdaad. Een krachtige grafische chip of kaart is noodzakelijk. Afhankelijk van het ontwerpjaar kan dat een op het moederbord aanwezige chip zijn met heel weinig grafische functies (bijvoorbeeld een Matrox G200). Die is niet bedoeld of geschikt voor decoderen.

Als je alle andere factoren uitsluit komt het neer op een combinatie van cpufuncties, gpufuncties en de settings/mogelijkheden (ook libraries) van de software.

Mogelijkheden van nVidia kaarten:
https://developer.nvidia....ode-decode-support-matrix

Een i9 is er in versies met een igpu: categorie: Processors

Er zijn oudere (2011 t/m 2021) Xeons die Quick Sync Video aan boord hebben:
https://www.intel.com/con...=True&1_Filter-Family=595

[ Voor 13% gewijzigd door mrmrmr op 11-11-2025 02:24 ]

Pagina: 1