De sample-rate en bit-diepte race

Pagina: 1
Acties:

  • ktf
  • Registratie: Maart 2007
  • Laatst online: 31-01 08:12
Goedemorgen allen,

Na lang in het "zilveren HIFI-kabels gesmeed door elfen bij maanlicht"-topic te hebben gehangen zocht ik naar een soortgelijk topic om te discussieren over 'audiofiele' geluidsformaten. Deze blijkt er niet te zijn, dus misschien leuk om af te trappen.

Goed, Philips en Sony introduceerden halverwege de jaren 80 de compact disc, voor velen een eerste kennismaking met "digitale" audiodragers in de huiskamer in plaats van analoge dragers zoals langspeelplaten en allerlei soorten tape-media die men gewend was. Het lag niet voor de hand welke indeling precies te kiezen, maar men heeft besloten om met PCM te gaan werken, en wel 16-bit op 44.1 kHz. Dat lijkt voor ons nu heel triviaal, maar eigenlijk is het dat niet. Er wordt dus 44100x per seconde een monster genomen van het signaal op een schaal van -32.767 tot +32.767.

Door de jaren heen zijn er echter andere 'digitale formaten' ontstaan. Hoewel ze nooit zo populair zijn geworden als "44/16" zijn er toch zeker mensen die erbij zweren. Een overzicht van de mogelijkheden:

- CD-audio: 44.1kHz op 16 bit. Praktisch gezien de defacto-standaard voor alle audio.
- DVD-audio: 44.1/48/88.2/96/176.4/192kHz op 16-, 20- of 24-bit. Voor de samplerates tot 96kHz is meerkanaals (surround) mogelijk.
- de audio van DVD-video is maximaal 48kHz, 16-bit PCM
- SACD, welke het zogenaamde DSD gebruikt, wat wezenlijk anders is dan PCM, wat we van de audio-CD gewend zijn. Dit werkt op 2.8224 MHz en 1 bit. Deze 2.8224MHz komt van 44.1 * 64, wat dus de 44.1kHz van de audio-CD is maar dan 64x oversampled.

Verder hebben we nog wat exotischere formaten:
- Losse bestanden (in FLAC/WAV/[ander-lossless-formaat]) kunnen de meest exotische indelingen hebben, van 8-bit tot 64-bit integer en 32- en 64-bit floats, op elke denkbare samplerate. De samplerates welke hierboven genoemd voor DVD-audio gebruikt worden zijn het meest voorkomend
- Allerlei DSD varianten, zoals double DSD op 5.6MHz, DSD-wide op 2.8MHz maar 8-bit en DXD op 352.8KHz en 24-bit. Dit zijn eigenlijk alleen studioformaten overigens.
- MP3, AAC, WMA, Vorbis en consorten, hoewel niet exotisch, horen niet echt in dit rijtje thuis. Toch wil ik ze noemen, omdat ze intern met floats werken en dus theoretisch een dynamisch bereik hebben die CD ver overtreft (96dB vs schier oneindig) maarja, daar heb je niet zoveel aan als dergelijk formaten je geluid slechts benaderen. :)

Goed, en ondanks deze technisch gezien waanzinnig superieure formaten (ik bedoel, in DXD kan 83x zoveel data als in gewoon 44/16) gebruiken we voor onze audio nog gewoon de audio-CD standaard. Bij het Tweakers.net nieuws komen nog wel eens initatieven van internetwinkels voorbij waarbij wordt geopperd toch maar andere formaten te gaan verkopen, maar het gebeurd gewoon niet. We blijven bij het CD-audio formaat wat Sony en Philips lang geleden bedacht hebben.

De discussie die ik hiermee aan wil zetten is die over de formaten. Hebben Sony en Philips destijds hun huiswerk goed gedaan en is het gewoonweg niet nodig om 'meer details van het geluidssignaal' op te slaan? Zijn we met de CD in één keer (het was het eerste echte digitale formaat) bij het eindstation, bij de grenzen van het menselijk gehoor aangekomen? Wat denken jullie? Is het gebruik van hogere samplerates, maffe indelingen (zoals DSD) en hoge bitdieptes reclamepraat?

  • ktf
  • Registratie: Maart 2007
  • Laatst online: 31-01 08:12
Goed, dan zal ik maar beginnen met mijn eigen mening. Ik hobby wat als opnametechnicus voor concertregistraties. Ik merk hier dat de betere apparatuur te kort wordt gedaan door 16-bit op te nemen: ze kunnen beter. Daarom neem ik vaak in 24-bit op, zodat ik het in mijn audioprogramma kan versterken (dan kan ik met een redelijk veiligheidsmarge opnemen) en vervolgens naar 16-bit omzetten. 24-bit is in mijn ogen alleen handig voor opnames, waar je een zekere veiligheidsmarge moet hebben. Hier moet ik wel bij zeggen dat er veel professionele apparatuur is die met moeite de diepte van 16-bit overtreft! Consumenten-apparaat komt hier zelden aan, en materiaal wat de studio verlaat heeft vrij weinig meer dan 16-bit aan daadwerkelijke data.

Wat betreft samplerate, als je de Nyquist-Shannon sampling theorie kent en deze accepteert en ervanuit gaat dat mensen niet hoger dan 22kHz kunnen horen moet je haast wel zeggen dat meer dan 44.1kHz geen zin heeft. Dit is enigszins discutabel, ik begrijp het idee achter de Nyquist-frequentie nog niet helemaal (voor golfjes, oké, maar voor plotselinge overgangen?) en er zijn onderzoeken te vinden die de hoorbaarheid (of voelbaarheid o.i.d.) van frequenties boven de 20kHz aan lijken te tonen. Ik ben er zelf dus nog niet helemaal uit, maar heb het idee dat 44.1kHz gewoon voldoende is.

[ Voor 5% gewijzigd door ktf op 21-04-2011 00:05 ]


  • Wilf
  • Registratie: Maart 2007
  • Niet online

Wilf

shuo cao cao

Voor professionele applicaties zijn de grotere formaten, zeker bij (af)mixen een must want als je gaat multitracken op 44.1/16 gooi je informatie weg en krijg je er Digger voor terug. Er zijn ook slechte 48+-DACs op de markt (geweest) die door hun slechte filtering meer kwaad dan goed doen. De kwaliteit van de DAC is dus zeer belangrijk. 44.1/16 voldoet prima in de eindketen.

  • ktf
  • Registratie: Maart 2007
  • Laatst online: 31-01 08:12
Wilf schreef op donderdag 21 april 2011 @ 00:14:
Voor professionele applicaties zijn de grotere formaten, zeker bij (af)mixen een must want als je gaat multitracken op 44.1/16 gooi je informatie weg en krijg je er Digger voor terug.
Tuurlijk, maar door digitaal te werken gooi je sowieso informatie weg. De vraag is, is die informatie nuttig? Boven de 44.1kHz neem je toch alleen maar ruis op, het is toch onhoorbaar en als je downsampled haal je het eraf met een filter. Dat je tot het eind op 24-bit blijft werken, dat snap ik, anders blijf je afrondverschillen stapelen.
Er zijn ook slechte 48+-DACs op de markt (geweest) die door hun slechte filtering meer kwaad dan goed doen. De kwaliteit van de DAC is dus zeer belangrijk. 44.1/16 voldoet prima in de eindketen.
Wat is hier slecht? Harmonische vervorming? Heb je het nu over DACs in consumentenapparaten?

  • Wilf
  • Registratie: Maart 2007
  • Niet online

Wilf

shuo cao cao

Damn autocorrect! Digger = dither natuurlijk. Als je mixt op CD-kwaliteit benut je niet de volledige beschikbare diepte dus kom je dichterbij de quantisatieruis, wat weer opgelost moet worden met dithering. Nu kan je wel pas ditheren bij de downmix maar je quantisatieruis wordt daar niet minder van.

En uiteraard gooi je informatie weg maar als de jitter minimaal is dan zou je ook hoorbare transiënten theoretisch compleet samplen. De nauwkeurigheid van de sampling bij 44.1 zit immers binnen het menselijk hoorbare gebied. Bij een hogere samplingrate heb je minder interpolatie in het tijdsdomein dus bij een betrouwbare klok is het theoretisch beter, maar of je dat terughoort is nog altijd discutabel.

Ik had het over DACs in consumer en professional omdat deze discussie al meer dan 10 jaar oud is. Ik studeerde toen muziektechnologie aan de HKU en deze discussie is toen uitvoerig gevoerd, dus aardig achterhaald in deze, aangezien er in die 10 jaar weinig is veranderd behalve dan de kwaliteit van de DACs. In den beginne van 96 kHz was er nogal wat troep op de markt waarbij vooral de steilheid van de filters en de kleuring en faseverschuiving in vooral de hogere frequenties problemen gaven, iets wat theoretisch juist beter zou moeten zijn (immers: verder van de Nyquist-frequentie).

  • ktf
  • Registratie: Maart 2007
  • Laatst online: 31-01 08:12
Wilf schreef op donderdag 21 april 2011 @ 09:33:
Damn autocorrect! Digger = dither natuurlijk. Als je mixt op CD-kwaliteit benut je niet de volledige beschikbare diepte dus kom je dichterbij de quantisatieruis, wat weer opgelost moet worden met dithering. Nu kan je wel pas ditheren bij de downmix maar je quantisatieruis wordt daar niet minder van.
Dat is precies wat ik zeg: je blijft op 24-bit (of 32-bit float) mixen, dat is standaard in alle mixprogramma's, anders stapel je inderdaad dither.
En uiteraard gooi je informatie weg maar als de jitter minimaal is dan zou je ook hoorbare transiënten theoretisch compleet samplen. De nauwkeurigheid van de sampling bij 44.1 zit immers binnen het menselijk hoorbare gebied. Bij een hogere samplingrate heb je minder interpolatie in het tijdsdomein dus bij een betrouwbare klok is het theoretisch beter, maar of je dat terughoort is nog altijd discutabel.
Ik heb dat dus eens willen testen hoe en wat met interpolatie. Daarop heb ik een opname afgespeeld (line-out) en direct opgenomen (line-in), en dit effect 24x gestapeld door die opname dan weer af te spelen en op te nemen etc. Ik heb wel verschillen gezien in mijn audio-editor (natuurlijk) maar nog niet gehoord. Dit was overigens op 48kHz omdat het apparaat dat ik gebruikte geen 44.1kHz aankon, om een of andere duistere reden. Misschien wel leuk om die hier te plaatsen, het origineel en de versie die 24x 'gemangeld' is.
Ik had het over DACs in consumer en professional omdat deze discussie al meer dan 10 jaar oud is. Ik studeerde toen muziektechnologie aan de HKU en deze discussie is toen uitvoerig gevoerd, dus aardig achterhaald in deze, aangezien er in die 10 jaar weinig is veranderd behalve dan de kwaliteit van de DACs. In den beginne van 96 kHz was er nogal wat troep op de markt waarbij vooral de steilheid van de filters en de kleuring en faseverschuiving in vooral de hogere frequenties problemen gaven, iets wat theoretisch juist beter zou moeten zijn (immers: verder van de Nyquist-frequentie).
Dat klopt, SACD en audio-DVD zijn er alweer even maar nog steeds te koop (ik heb er zelf eentje die bij een set CD's zat) en dan wordt er toch nog wel flink reclame gemaakt met hoge sampling-rates en bitdieptes, dus m.i. is er nog wel ruimte voor discussie. Overigens, vraag ik me af, in hoeverre hoeverre heb je daadwerkelijk die DAC-problemen gehoord? Als je boven de 10.000 Hz zit hoor je allang geen faseverschuivingen meer. Toch ook raar dat daar uberhaubt problemen kunnen ontstaan, immers, je kunt een dergelijk filter rustig ergens rond de 30.000 Hz zetten, veilig boven het hoorbare gebied.

  • dtjv
  • Registratie: Juli 2008
  • Laatst online: 08-02-2023
Hier staat een aardig stukje over het effect van ultrasone signalen op muziekbeleving. Samengevat: alhoewel signalen boven de 20kHz ("los") niet te horen zijn, lijkt het erop alsof mensen muziek met die signalen prefereren boven zonder. Ook een PET-scan lijkt dit te bevestigen.

Het is vast niet het definitieve onderzoek naar dit fenemoeen, maar ik vind 't toch best aardig. Volkomen subjectief kan ik overigens ook zeggen dat ik erg goede ervaringen heb met luisteren naar high-res audio, ook in directe vergelijking met 16/44.1.

  • bartvl
  • Registratie: Oktober 2002
  • Nu online

bartvl

Vlieg! Kan ik niet. Te laat...

Voor mijn gevoel is de 44,1k/16 specificatie destijds heel netjes gekozen, hoewel 48000/16 misschien logischer zou zijn geweest? (makkelijker rekenen :P) Wat ik me wel afvraag bij de hogere samplerates: als dit effect heeft op onze beleving, dan zijn er blijkbaar geluidgolven die met die frequentie geproduceerd worden. Maar welke zijn dit dan? De meeste instrumenten en stemmen redden dat toch nevernooit niet? Of is er toch sprake van meerdere harmonischen die toch nog geproduceerd worden?
Als er effect is zou dit toch aanwijsbaar moeten zijn in de waveform.

Life is not about specs, it is about joy!


  • dtjv
  • Registratie: Juli 2008
  • Laatst online: 08-02-2023
@bartvl Dat valt nog best wel mee hoor: hier staan metingen van de frequenties die verschillende instrumenten produceren. Daar zit nogal wat energie boven de 20 kHz bij.

44.1kHz in plaats van 48kHz is een beetje toeval. De eerste opnames werden op videobanden gemaakt, en NTSC en PAL video konden beide 44.1kHz aan. Zie hier. Dit zorgt er trouwens nu nog voor dat er in allerlei verschillende samplerates muziek wordt uitgebracht: 88.2, 96, 176.4, 192, en ik las zelfs onlangs 352.8kHz...

  • Dre
  • Registratie: Juni 2001
  • Niet online

Dre

-

[ Voor 100% gewijzigd door Dre op 22-09-2013 19:26 ]


  • bartvl
  • Registratie: Oktober 2002
  • Nu online

bartvl

Vlieg! Kan ik niet. Te laat...

Een opname maken met een frequentiebereik tot boven 20 KHz is vrij goed mogelijk (met de juiste microfoons e.d.) Versterkers zijn goed in staat boven de 20KHz weer te geven. Maar speakers zijn er niet echt op gebouwd geloof ik, of wel? Zover ik uit het hoofd kan noemen zijn er een aantal Dali's die tot pakweg 30KHz (-3dB) doorlopen. Maar de gemiddelde tweeter is er dan toch al compleet mee gestopt?

Life is not about specs, it is about joy!


  • dtjv
  • Registratie: Juli 2008
  • Laatst online: 08-02-2023
Dat valt wel mee hoor, een beetje goede speaker loopt vrij ver door. Kijk naar een merk als Rosso Fiorentino, dat als optie een supertweeter die tot 100k loopt aanbiedt. Of de topspeakers van B&W of Kef, die lopen allemaal flink boven de 25kHz door.

@Dre: ik was een tijdje geleden bij een demonstratie door Ivor Tiefenbrunn, de baas van Linn. Hij liet steeds hetzelfde stukje muziek horen op MP3, 16/44.1 en (volgens mij) 24/88.2. De verschillen waren, met zo'n korte luistertijd (10 seconden) niet enorm, en werden ook niet door iedereen constant opgepikt, maar toch zeker wel te horen. (Overigens totaal niet wetenschappelijk verantwoord getest.) Het leek ook wel alsof de muziek bij hogere resoluties wat sneller ging. Wat ik wel interessant vond, is wat hij daar verder over vertelde. Volgens hem was het zo dat door de hogere resolutie het wegsterven en aanzetten van noten beter te volgen was voor onze hersenen. Niet alleen gaf dat de illusie dat de muziek sneller klonk, maar bij lang luisteren zou dat (volgens hem) ook tot minder luistermoeheid leiden.

Natuurlijk hebben we het hier over de baas van een bedrijf dat high-res streamers maakt, en high-res opnames verkoopt, dus dat zal vast meespelen. Maar ik vond 't in ieder geval interessant om te horen.

  • TjardE
  • Registratie: September 2002
  • Niet online
Ik heb zelf ook wel eens over het fenomeen nagedacht.

Meneer Nyquist heeft dan welliswaar bedacht dat je minimaal de hoogste frequentie x 2 moet nemen om een Sinusvormig signaal van die frequentie te kunnen sampelen. Dit geeft een mooie zaagtand die je na een integratie via b.v. een condensator weer een sinus kan laten lijken. (Te vinden in elke goedkope CD speler in het uitgangscircuit die niet aan een duurdere vorm van integratie doet).

Mooier zou zijn 4x of hoger. Een hogere samplerate geeft dus een mooiere representatie van het origineel. Nyquist had het over minimaal. Waar Nyquist het echter over heeft is een mono-signaal.

Toen de CD uitgevonden was, was het kennelijk goed genoeg om 2x een mono signaal op een schijfje te zetten en zo heel erg "HIFI" muziek op te slaan.
De signaal naar quantiseringsruis (Signal to Noise ratio) is een vast gegeven en hangt af van het aantal bits waarmee het signaal wordt weggeschreven. De S/N = 6x aantal bits + 2 in dB.

Hetgeen me wel eens bezig heeft gehouden is de plaatsing van het geluid. De 44,1KHz klok loopt bij een CD voor zowel links als rechts op dezelfde fase. De plaatsing van geluid is niet alleen maar het verschil in volume tussen links en rechts, maar ook de tijd die een signaal erover doet om naar het linker of rechter oor te reizen.
Wil je dus een signaal van links naast het midden laten komen dan moet je het signaal op de rechter speaker ook een klein beetje later laten komen.
Deze enorm subtiele fase verschillen zorgen ervoor dat volgens mij een signaal dat hoger gesampled wordt, deze kleine fase verschillen veel beter kan weergeven.

Misschien even een voorbeeld om mijn theorie een beetje te onderbouwen. Als een instrument alleen recht voor ons zou zijn. En we zouden dit met 2 microfoons opnemen die op de plek van onze oren zouden hangen, dan is de weg die het geluid aflegt even lang voor zowel de linker als de rechter microfoon.
Wordt het instrument nu een stukje naar links verplaatst dan zal de weg die het geluid aflegt naar de rechter microfoon een heel klein beetje langer zijn dan naar de linker microfoon. Dit introduceert een subtiel fase-verschil.
Zouden we het signaal met de Nyquist frequentie bemonsteren dan vind je alleen een heel klein volume verschil terug. Het fase verschil wordt niet bemerkt.

Dus mijn conclusie : Een hogere samplerate doet meer dan alleen maar de pure instrumenten beter samplen.

Meerdere die zich in deze theorie kunnen vinden?

  • Brad Pitt
  • Registratie: Oktober 2005
  • Laatst online: 12:02
TjardE schreef op vrijdag 22 april 2011 @ 01:31:
Zouden we het signaal met de Nyquist frequentie bemonsteren dan vind je alleen een heel klein volume verschil terug. Het fase verschil wordt niet bemerkt.
Wordt die geluidsinformatie niet gewoon zoals 'ie wordt ontvangen ook op het schijfje gezet dan? Dus dat bijv. uit de rechterspeaker het geluid van het instrument dat is opgenomen ook daadwerkelijk x milliseconden later komt?

Nickname does not reflect reality


  • Wilf
  • Registratie: Maart 2007
  • Niet online

Wilf

shuo cao cao

dtjv schreef op donderdag 21 april 2011 @ 14:50:
44.1kHz in plaats van 48kHz is een beetje toeval.
Geen toeval, heeft alles met videostandaards te maken (framerate) en dat heeft weer alles te maken met de frequentie van netspanning en de verschillen van de Amerikaanse en Europese standaard hierin.
dtjv schreef op vrijdag 22 april 2011 @ 00:45:
@Dre: ik was een tijdje geleden bij een demonstratie door Ivor Tiefenbrunn, de baas van Linn.
Wij van WC-Eend. Suggestie en niet zuivere technieken kunnen hierbij parten spelen.
TjardE schreef op vrijdag 22 april 2011 @ 01:31:
Hetgeen me wel eens bezig heeft gehouden is de plaatsing van het geluid.
Bereken de faseverschuiving bij 44.1 kHz en bekijk nu eens de JND. Die eerste samples uiten zich slechts als kamfilter, niet als plaatsingsverschil. Als je witte ruis 1 sample vertraagt ten opzichte van de originele bron uit een andere speaker dan wordt het geheel voor je gevoel even wat doffer. Vertraag je nu steeds weer een sample meer dan krijg je een zakkend kamfiltereffect (alsof er een straaljager voorbijvliegt) tot je een echo-effect krijgt. Doe je dit zelfde met muziek (of voorspelbaar geluid) dan zit er tussen het kamfiltereffect en het echo-effect de plaatsingsverschuiving.

Ofwel: het verschuiven van een paar samples doet veel meer met het spectrum dan met je beleving van plaatsing. En dan heb jij het nog niet eens over het verschuiven van een sample maar over het niet nauwkeurig genoeg zijn van 44.1 waardoor transiënten hoger dan 22 kHz verloren gaan en door interpolatie verkeerd weergegeven zouden worden (je kan overigens niks weergeven wat tussen samples gebeurt omdat daartussen geïnterpoleerd wordt maar dat snap je wel want dat was ook een beetje je punt).

[ Voor 3% gewijzigd door Wilf op 22-04-2011 10:26 ]


  • bartvl
  • Registratie: Oktober 2002
  • Nu online

bartvl

Vlieg! Kan ik niet. Te laat...

TjardE schreef op vrijdag 22 april 2011 @ 01:31:
...

Hetgeen me wel eens bezig heeft gehouden is de plaatsing van het geluid. De 44,1KHz klok loopt bij een CD voor zowel links als rechts op dezelfde fase. De plaatsing van geluid is niet alleen maar het verschil in volume tussen links en rechts, maar ook de tijd die een signaal erover doet om naar het linker of rechter oor te reizen.
Wil je dus een signaal van links naast het midden laten komen dan moet je het signaal op de rechter speaker ook een klein beetje later laten komen.
Deze enorm subtiele fase verschillen zorgen ervoor dat volgens mij een signaal dat hoger gesampled wordt, deze kleine fase verschillen veel beter kan weergeven.

...
Die fase verschuivingen zullen er vast zijn inderdaad. Punt daarbij is dat we het over zeer hoge frequenties hebben (15+ kHz) ofwel zeer korte golflengtes (1,5-2 cm). Een zeer kleine beweging van je hoofd/oor heeft dus al grotere gevolgen voor deze faseverschillen dan de faseverschuiving van het signaal.
Daarnaast is het ook nog zo dat ons gehoor pak 'm beet boven de 2-3 kHz veel gevoeliger is voor intensiteitsverschillen dan faseverschillen als het gaat om plaatsing van het geluid. (kortgolvig geluid kaatst af op ons hoofd, daardoor is het 'praktischer' dat we in die range gevoeliger zijn voor intensiteit- dan voor faseverschillen.)

Life is not about specs, it is about joy!


  • TjardE
  • Registratie: September 2002
  • Niet online
Brad Pitt schreef op vrijdag 22 april 2011 @ 09:55:
[...]

Wordt die geluidsinformatie niet gewoon zoals 'ie wordt ontvangen ook op het schijfje gezet dan? Dus dat bijv. uit de rechterspeaker het geluid van het instrument dat is opgenomen ook daadwerkelijk x milliseconden later komt?
Dat is nou juist het punt. Je hebt bij hoge frequenties net genoeg samples om een zaagtand te samplen die lijkt op het originele signaal. Subtiele verschillen in fasen heb je niet eens de mogelijkheid toe.

  • Varienaja
  • Registratie: Februari 2001
  • Laatst online: 14-06-2025

Varienaja

Wie dit leest is gek.

TjardE schreef op vrijdag 22 april 2011 @ 11:22:
Dat is nou juist het punt. Je hebt bij hoge frequenties net genoeg samples om een zaagtand te samplen die lijkt op het originele signaal. Subtiele verschillen in fasen heb je niet eens de mogelijkheid toe.
Een 20kHz piep zal nooit als zaagtand worden afgespeeld, maar als sinus. Een zaagtand (en nog erger een blokgolf) is een golf met ontzettend veel hoge-transiënten erin. Aangezien die hoge transiënten niet in het digitale signaal kunnen zitten (want >20kHz), worden die er bij het afspelen ook niet ingefantaseerd.

De 'subtiele' verschillen in een sinus van 20kHz kan je gerust weggooien, omdat elke afwijking in een 20kHz sinusgolf een nieuwe golf is met een kleinere golflengte en daardoor hoger dan 20kHz, en dus voor de mens onhoorbaar.
Het enige goede argument dat ik weleens hoorde voor een resolutie van meer dan 44.1kHz, is dat je een vrij steil analoog filter nodig hebt, dat vanaf 20kHz snoeihard ingrijpt om de quantiseringsruis weg te filteren. Zulke steile filters zijn moeilijk om te maken, en daarom zal vaak ook geluid onder de 20kHz beïnvloed worden.
Maar als ik me niet vergis, is dat eigenlijk allemaal allang opgelost door meervoudige oversampling toe te passen. Daardoor verplaatst zich de quantiseringsruis naar hogere gebieden, en kan een eenvoudiger filter gebruikt worden.

Siditamentis astuentis pactum.


  • Stoney3K
  • Registratie: September 2001
  • Laatst online: 31-01 11:46

Stoney3K

Flatsehats!

Even de wiskundige aanpak hier. Mijn stelling is: Sony en Philips hebben met hun CD het huiswerk gedaan en 44.1KHz/16 bit is meer dan genoeg.

Beargumentering:

Met 16 bit sampling heb je (6dB per bit regel) ongeveer 96dB aan dynamisch bereik. Dat betekent dat er tussen het allerzachtste stuk en het hardste gedeelte van je muziek maximaal 96 decibel aan verschil mag zitten voordat dat zachtste stuk in de ruis verdwijnt of het hardste gedeelte overstuurd wordt.

Als je bekijkt dat de menselijke gehoordrempel op zo'n 30dB (A) ligt, dan betekent dat dat het hardste stuk op die CD bijna aan de 130dB zit als het het zachtste stuk wil kunnen horen. Niet goed voor het gehoor als je dat lang wil luisteren ;)

Bovendien zijn er bijna geen muziekopnames die met 96dB aan bereik worden gemasterd. De meeste popmuziek zit tussen de 30dB en 6dB in, en daar heb je totaal geen meerwaarde als je SACD gebruikt met ruim 130dB (24bit) aan bereik.

Qua sample-rate houdt een CD op bij 22kHz, en ons menselijk gehoor gaat (voor volwassen mensen) ook niet voorbij de 20kHz. Dus meer is écht niet nodig. :)
Hetgeen me wel eens bezig heeft gehouden is de plaatsing van het geluid. De 44,1KHz klok loopt bij een CD voor zowel links als rechts op dezelfde fase. De plaatsing van geluid is niet alleen maar het verschil in volume tussen links en rechts, maar ook de tijd die een signaal erover doet om naar het linker of rechter oor te reizen.
Wil je dus een signaal van links naast het midden laten komen dan moet je het signaal op de rechter speaker ook een klein beetje later laten komen.
Deze enorm subtiele fase verschillen zorgen ervoor dat volgens mij een signaal dat hoger gesampled wordt, deze kleine fase verschillen veel beter kan weergeven.
Verschil in looptijd tussen links en rechts zul je inderdaad horen als 'verplaatsing' van instrumenten. Maar die 20kHz is meer dan genoeg, want het looptijdsverschil wordt dan beperkt tot 0,05 milliseconde. Rekening houdend met de snelheid van het geluid betekent dat dat het minimale hoorbare afstandsverschil tussen links en rechts in zo'n geval dan 1,6 centimeter wordt.

Sinds je over het algemeen naar een opname luistert die enige meters van het podium verwijderd hoort te zijn, zal het verwaarloosbaar zijn en ga je niet lopen zoeken of die derde strijker van links nu meer voor of achterop zijn stoel geleund zit. :Y)

[ Voor 36% gewijzigd door Stoney3K op 22-04-2011 14:47 ]

Zet het daar maar neer! -- It's time to party like it's 1984 -- Soundcloud


  • bartvl
  • Registratie: Oktober 2002
  • Nu online

bartvl

Vlieg! Kan ik niet. Te laat...

Hoe kom je erbij dat onze gehoordrempel op 30 dB(A) ligt? Aldus wikipedia: bij 4000 Hz is onze gehoordrempel -5 dB. Breed genomen wordt vaak gezegd dat onze gehoordrempel 0 dB is. Of zoals wikipedia weet te zeggen:
De referentie geluidsdruk van 2 × 10-5 Pa = 20 µPa die gebruikt wordt voor de definitie van de decibel is gelijk gesteld aan de gehoordrempel bij 1000 Hz van een gemiddelde persoon. De gehoordrempel bij 1000 Hz bedraagt derhalve 0 dB.
Wat overigens niet wegneemt dat 96 dB dynamisch bereik best wel voldoende is voor muziek, en je met 30 - 126 dB inderdaad wel een mooi gebied van heel zacht tot heel hard te pakken hebt. Ligt dit bij films anders overigens?

[ Voor 19% gewijzigd door bartvl op 22-04-2011 14:52 ]

Life is not about specs, it is about joy!


  • Stoney3K
  • Registratie: September 2001
  • Laatst online: 31-01 11:46

Stoney3K

Flatsehats!

bartvl schreef op vrijdag 22 april 2011 @ 14:49:
Hoe kom je erbij dat onze gehoordrempel op 30 dB(A) ligt? Aldus wikipedia: bij 4000 Hz is onze gehoordrempel -5 dB. Breed genomen wordt vaak gezegd dat onze gehoordrempel 0 dB is. Of zoals wikipedia weet te zeggen:

[...]
Anders gezegd: Hoe vaak luister jij in een ruimte waar het absoluut muis- en muisstil is? Normaal achtergrondgeluid komt al over de 30dB(A) heen, ook als je een fatsoenlijk gedempte ruimte hebt.

Zet het daar maar neer! -- It's time to party like it's 1984 -- Soundcloud


  • bartvl
  • Registratie: Oktober 2002
  • Nu online

bartvl

Vlieg! Kan ik niet. Te laat...

Daarin ben ik het helemaal met je eens hoor, maar het de gehoordrempel noemen is gewoon niet correct. Overigens red je die max. 30 dB(A) in een concertzaal wel, maar dan heb je ook een akoestische bron zonder digitale begrenzing in dynamisch- en frequentiebereik.
Als je niet midden in de stad woont, je een beetje een recent huis hebt en je 's nachts gaat luisteren dan zit je al wel vrij snel onder die 30 dB(A) hoor. Maar ja, om dan te gaan genieten van je 96 dB bereik :P

[ Voor 4% gewijzigd door bartvl op 22-04-2011 14:58 ]

Life is not about specs, it is about joy!


  • MPAnnihilator
  • Registratie: Juni 2002
  • Laatst online: 04-12-2025
Misschien een beetje off topic , maar zit er tussen al die verschillende formaten ( stereoformaten dan ) een verschil tussen de dB , bijvoorbeeld bij surround formaten als DD en DTS zet men het LFA signaal 10 dB stiller...

Als je thuis je hifi versterker bij stereo weergave op bijv. -40dB zet , kan het volume dan wijzigen enkel en alleen door het afspelen van bestanden met verschillende formaten , bijv. tussen PCM 16bit 44.1kHz en PCM 16bit 48 kHz ? Of liggen de verschillend alleen bij de 'mastering' ?

Mijn Specs


  • ktf
  • Registratie: Maart 2007
  • Laatst online: 31-01 08:12
Stoney3K schreef op vrijdag 22 april 2011 @ 14:42:
Verschil in looptijd tussen links en rechts zul je inderdaad horen als 'verplaatsing' van instrumenten. Maar die 20kHz is meer dan genoeg, want het looptijdsverschil wordt dan beperkt tot 0,05 milliseconde. Rekening houdend met de snelheid van het geluid betekent dat dat het minimale hoorbare afstandsverschil tussen links en rechts in zo'n geval dan 1,6 centimeter wordt.
Hier maak je toch wel een grote fout :P

Die faseverschillen gaan over de looptijdverschillen bij de microfoons, niet op het podium. Dit is dus geheel afhankelijk van hoever de microfoons uit elkaar staan, maar afstanden van 30cm tot 3 meter zijn gebruikelijk. Als ik 330m/s deel door 44.100 samples per seconde krijg ik 7,8mm *verschil* tussen de looptijden.

Om makkelijk te kunnen rekenen het volgende: stel, de microfoons staan 30 cm uit elkaar en een theoretische punt geluidsbron zit 15 cm uit het midden, recht voor een van de microfoons. Als je dan de afstand uitrekend waarop hij moet gaan zitten om dit verschil 1 sample of meer te maken krijg je d + 7,8mm = wortel(d² + 0,15²) . d is dan ongeveer anderhalve meter. Dus, een geluidsbron op anderhalve meter, 15 cm uit het midden (dat is een hoek van bijna 6 graden) is pas een verschuiving van 1 sample. Als hij wat verderop gaat zitten is dat verschil dus minder dan 1 sample. Ik kan overigens ongeveer bevestigen dat dit klopt: in looptijdverschil-opnamen die ik heb gemaakt (en volgens wat boeken die ik heb gelezen is dit in het algemeen) is de plaatsing vaak redelijk zwak en onduidelijk. Dat heeft niets te maken met sampling, maar met het feit dat het menselijk oor pas looptijdsverschillen gaat horen van lengtes meer dan een paar samples. (ik kan nu helaas geen bron daarvan vinden) en je moet dus redelijk dicht bij de microfoons zitten of de microfoons ver uit elkaar zetten om dat te halen.

Hierbij moet ik overigens wel meteen in de verdediging springen: stel dat de verschuiving een halve sample is (en stel dat je dat zou kunnen horen) dan kan dat door tijdsmiddeling alsnog uit het signaal gehaald worden. Het is niet zo dat dat faseverschil van een halve sample dan maar weggegooid wordt ofzo.
bartvl schreef op vrijdag 22 april 2011 @ 14:57:
Daarin ben ik het helemaal met je eens hoor, maar het de gehoordrempel noemen is gewoon niet correct. Overigens red je die max. 30 dB(A) in een concertzaal wel, maar dan heb je ook een akoestische bron zonder digitale begrenzing in dynamisch- en frequentiebereik.
Inderdaad, dat noem je normaal gesproken de noisefloor of ruisdrempel van een omgeving. Ik heb geleerd dat een beetje concertzaal 10dB ruisdrempel haalt. Veel lager ga je niet redden, want dan ben je naar je eigen ademhaling aan het luisteren, een rustige ademhaling hoor je als ongeveer 10dB. :+ Dan overigens nog steeds, 10 + 96 is een oncomfortabele 106dB, structureel meer dan 85dB levert al gehoorschade op.
MPAnnihilator schreef op vrijdag 22 april 2011 @ 16:08:
Als je thuis je hifi versterker bij stereo weergave op bijv. -40dB zet , kan het volume dan wijzigen enkel en alleen door het afspelen van bestanden met verschillende formaten , bijv. tussen PCM 16bit 44.1kHz en PCM 16bit 48 kHz ? Of liggen de verschillend alleen bij de 'mastering' ?
Nee, dat ligt dan geheel aan de mastering. Bij DD en DTS heeft dat dan met de formaten te maken, niet met de sample-rate of de bitdiepte.

  • technopeuter
  • Registratie: Januari 2000
  • Laatst online: 19:58
heb zelf opnames met 48kz gemaakt en vond ze significant (subjectief) beter klinen, ruimtelijkheid kwam veel beter uit en gaf me de rillingen over mijn rug.

diskeltische lurker


  • JAHRASTAFARI
  • Registratie: April 2005
  • Laatst online: 29-01 16:58
Na in aanraking te zijn gekomen met Super Audio CD op een goede installatie, weet ik dat er méér is dan 44,1 Khz 16 bits CD geluid. Echter is er maar heel weinig audio materiaal wat mij kan bekoren, dat op een uitstekende kwaliteit is opgenomen én wordt uitgebracht via hogere resolutie media.

Alle jazz, klassiek, rock-rariteiten, etc, die voor 99% de hogere resolutie media vult, vind ik niet te pruimen, ook al klinkt het technisch goed. Het gaat ook nog om de muziek....!

Via wat sites heb ik het een en ander gedownload aan HD flacs, bijna alles weggegooid. Eén voorbeeld is mij ewel bijgebleven, een HD versie van "The Raven" van Rebecca Pidgeon. Als ik de HD versie vergelijk met de CD/Flac versie, hoor je kleine verschillen. Echter blijft altijd de vraag of dit door de 24/88 eigenschap komt, of een andere mastering....?

In ieder geval is het treurig dat we nog altijd als muziekliefhebbers te maken hebben met de totale dominantie van het CD 16/44,1 formaat. Jammer.

Er zijn wel wat sites die langzamerhand het een en ander uitbrengen, bijv. https://www.hdtracks.com/ , maar helaas is dit weer altijd diezelfde niche muziek als op SACD en ontbreekt de mainstream/het brede aanbod.

  • mr.paaJ
  • Registratie: Februari 2007
  • Laatst online: 29-01 13:38

mr.paaJ

generatie cmd+z

Ik vind het altijd wel grappig dat 16bit gelijk gesteld wordt aan 96dB aan dynamisch bereik. Dat hangt toch af van hoe hard je het afspeelt? Als ik mijn versterker zacht zet heeft dat geen invloed op het dynamisch bereik dat uit de CD speler komt, de stapjes worden alleen kleiner weergegeven. Als ik mijn versterker op pieken van 130dB zet zijn de 0dB stukken in een theoretisch perfecte CD speler toch nog steeds gewoon 0dB?

In de praktijk niet waarschijnlijk, maar dat lijkt me niet afhankelijk van het aantal bits, maar van de interne componenten..

liever de tong gebrand dan lauwe soep


  • ktf
  • Registratie: Maart 2007
  • Laatst online: 31-01 08:12
technopeuter schreef op vrijdag 22 april 2011 @ 21:20:
heb zelf opnames met 48kz gemaakt en vond ze significant (subjectief) beter klinen, ruimtelijkheid kwam veel beter uit en gaf me de rillingen over mijn rug.
Heb je een directe vergelijking met 44.1kHz kunnen maken dan, of was het gewoon 'een goede opname'? Ik heb namelijk nog nooit zo'n verschil gemerkt.

edit: Woeps, meer reacties op de volgende pagina
JAHRASTAFARI schreef op vrijdag 22 april 2011 @ 21:26:
Na in aanraking te zijn gekomen met Super Audio CD op een goede installatie, weet ik dat er méér is dan 44,1 Khz 16 bits CD geluid.
[...]
Via wat sites heb ik het een en ander gedownload aan HD flacs, bijna alles weggegooid. Eén voorbeeld is mij ewel bijgebleven, een HD versie van "The Raven" van Rebecca Pidgeon. Als ik de HD versie vergelijk met de CD/Flac versie, hoor je kleine verschillen. Echter blijft altijd de vraag of dit door de 24/88 eigenschap komt, of een andere mastering....?
[...]
In ieder geval is het treurig dat we nog altijd als muziekliefhebbers te maken hebben met de totale dominantie van het CD 16/44,1 formaat. Jammer.
Je spreekt jezelf tegen. Je vraagt je af of verschillen door het formaat of door de mastering komen (ik vermoed de mastering, maargoed, daar gaat deze discussie nu juist over) en direct daarna zeg je: jammer dat we vast zitten aan 44/16. Waarom? Blijkbaar ben je van mening dat andere formaten superieur zijn?
mr.paaJ schreef op vrijdag 22 april 2011 @ 21:52:
Ik vind het altijd wel grappig dat 16bit gelijk gesteld wordt aan 96dB aan dynamisch bereik. Dat hangt toch af van hoe hard je het afspeelt? Als ik mijn versterker zacht zet heeft dat geen invloed op het dynamisch bereik dat uit de CD speler komt, de stapjes worden alleen kleiner weergegeven. Als ik mijn versterker op pieken van 130dB zet zijn de 0dB stukken in een theoretisch perfecte CD speler toch nog steeds gewoon 0dB?
Dynamisch bereik ik het verschil tussen het hardste en zachtste geluid wat een systeem aan kan. Als je het hardste geluid wat je op een CD kan zetten 0dB noemt, dan zit op -96dB de noisefloor, dan hoor je dus ruis. Als de pieken dus op 130dB zitten uit je versterker, zul je bij stilte 34dB aan ruis hebben, bij theoretisch perfecte reproductie.

[ Voor 70% gewijzigd door ktf op 22-04-2011 21:59 ]


  • JAHRASTAFARI
  • Registratie: April 2005
  • Laatst online: 29-01 16:58
ktf schreef op vrijdag 22 april 2011 @ 21:54:
[...]Je spreekt jezelf tegen. Je vraagt je af of verschillen door het formaat of door de mastering komen (ik vermoed de mastering, maargoed, daar gaat deze discussie nu juist over) en direct daarna zeg je: jammer dat we vast zitten aan 44/16. Waarom? Blijkbaar ben je van mening dat andere formaten superieur zijn?
De 88/24 versie van The Raven klinkt beter dan de CD, en ja, ook SACD's vind ik beter klinken. Op zichzelf al, maar ook in vergelijking met CD's. Echter, je weet nooit 100% of de HD/SACD versie toch niet beter gemastered/getransferred is en dat het daardoor beter klinkt. Zo duidelijk? :>

Verwijderd

Ik vat in een heel lange post een aantal dingen samen die inmiddels de revue gepasseerd zijn:

Bij het maken van een (live) opname is de looptijd van het signaal van geen enkel belang. Er zijn verschillende technieken in omloop om tot een fraai diep stereobeeld te komen, als het gaat om live-opnames.

Het label Chandos gebruikt meestal een 3 microfoon-opname op ca 3 meter van het podium, waarbij de twee 'flank-microfoons' ca. 8 meter uit elkaar staan. Dit geeft een zeer breed ruimtelijk beeld met een zeer goede 'ambiance', dwz dat je hoort in wat voor soort hal de opname gemaakt is.
Telarc werkte vroeger (ik weet niet wat ze tegenwoordig doen) met 2 microfoons op ca. anderhalve meter uit elkaar, op ca 7 meter van het podium, af en toe ondersteund met close-up miking van solisten. Dit gaf een zeer natuurgetrouw maar nogal droog beeld. Droog betekent hier dat de instrumenten en solisten zeer goed opgenomen waren, maar dat je weinig mee kreeg van de zaal. Je had dus niet het gevoel dat je er ook echt bij was.
Decca gebruikt altijd een multi-mike opname waarbij elke orkest-sectie zijn eigen setup heeft, en waarbij een aantal microfoons in de zaal worden gehangen om de acoustiek en het publiek op te vangen. De kwaliteit van de opnames is doorgaans heel behoorlijk, maar soms er zitten er absolute juweeltjes tussen.

Voor studio-opnames van popmuziek en kleine jazz-combo's, die in de praktijk mono worden opgenomen - behalve de drums dan -, gelden heel andere criteria.
En dan zijn er nog de gespecialiseerde kleine labels die zo hun eigen geheimpjes hebben. De meesten gebruiken een combinatie van omni- en close-up miking, waardoor ze een zeer scherp gedefinieerd stereobeeld weten te creeeren.

Dit zijn uiteraard geen wetten van meden en perzen (of meten en persen) en afhankelijk van de zaal en de geluidstechnicus wordt er nogal wat gemorreld om de beste plaatsing van de microfoons te krijgen.

Ik gebruik voor mijn werk in de concertzaal meestal 5 microfoons, twee centraal op het podium, 2 op ca. 5 meter van het podium en 1 achter in de zaal. Dit werkt wat mij betreft erg goed. Dit schema werd in de jaren 80 ontwikkeld door de ORTF (de franse staats-TV.) Aanvankelijk meten we de zaal door om te kijken waar we de microfoons ongeveer moeten plaatsen, hierbij kijken we naar looptijden, reflecties, galm en meer van dat soort zaken. Dan zetten we de boel neer en doen wat eerste tests. Vervolgens loopt Serge (een mannetje met een gouden oor) de zaal in en gaat wat 'ooohbkrstshh' geluiden maken. Op basis van wat hij hoort schuift hij dan nog wat met de microfoons, en meestal wordt het daardoor nog wel wat beter!
Het grappige is dat dit analoog en op 24 bit heel goed werkt, maar met 16 bits absoluut niet. Toen we onze eerst digitale opnames maakten in 16 bits moesten we echt close miking gebruiken, want 16 bits opnemen was gewoon niet genoeg (overigens was de ADC wel 16bits, maar effectief kwamen er maar 13 bits uit!)

De reden van de 5 microfoon opname is omdat dit zich heel gemakkelijk laat omzetten naar een dolby 5.1 en naar een klassieke stereo-mix. En vanuit 5.1 kan je vervolgens alle andere surround-standaards weer rekenkundig genereren. Overigens is de kwaliteit van de afzonderlijke kanalen van veel van die multi-kanaal weergaves bijzonder beroerd, meer dan 10 bit effectief komt daar niet uit, met dank aan de compressie. En er wordt ook flink in de frequentie-karakteristiek en de fase gesneden om het maar vooral te doen lijken alsof er ook geluid van achteren komt. Als het gaat om een natuurgetrouwe weergave gaat er voorlopig dus niets boven het goede oude stereo. Dit ligt overigens niet aan de technologie, maar aan de manier waarop de heren geluidstechnici (en hun opdrachtgevers) vinden dat het gedaan moet worden. Het is in die wereld belangrijker dat het 'vet' klinkt dan dat het natuurgetrouw klinkt.
Als we een groot orkest opnemen werken we overigens meestal met 24 sporen, gewoon omdat je dan de balans veel beter kunt beheersen. Een 5 microfoons-opname moet gewoon in een keer goed zijn.
En voor TV-opnames gebruiken we ook altijd 24 sporen, omdat je daar zo weinig dynamiek mag gebruiken dat je de opname wel moet verkrachten. En hoe meer sporen, des te makkelijker dat is!

Wij nemen alles 24bit/192kHz op. De reden daarvoor is dat je voor de digitale mix wat ruimte nodig hebt om in te kunnen rekenen. Het signaal wordt vervolgens op de PC (gewoon een notebook met een firewire naar een externe DAC en een midi-interface naar een yamaha digitale mixer) afgemixt en op de glass-master gezet. In die laatste fase wordt een down-conversie naar de redbook specificatie gedaan (dmw een normalisator en een adaptieve compressor om alles binnen 14 bits te houden. Die onderste 2 bits worden door niemand bewust gebruikt, maak je daar vooral geen illusie over, dat is ruimte die bij het afronden van de downsampling wordt gevuld). Voor een SA ,die ik persoonlijk overigens nog maar 5 gemaakt heb, wordt er een meestal een ongecompromeerde bitstream van gemaakt, en bij DVD's is er sprake van een simpele down-conversie naar 48KHz, met een beetje compressie. Surround laat ik altijd graag aan mijn jongere collega's over, daar bemoei ik me zo min mogelijk mee!

Dan om even terug te komen op het huiswerk van Philips: dat was prima voor de drager en de weergave, en iedereen die denkt dat 44.1KHz niet genoeg is voor transients moet toch Nyquist en Fourier er maar even op nalezen (ok, dat kan een universitaire studie wiskunde van 4 jaar vereisen, maar dat moet dan maar) Je hoeft namelijk geen zaagtand van 22Khz te reconstrueren. En ook de transients hebben geen frequentie-componenten die hoger liggen dan 22Khz.

De essentie van 192KHz sampling is niet dat je de nyquist-frequentie verhoogt (je filtert aan de ingang dus nog steeds op 20KHz af) maar juist dat je die hele bovenband kan weggooien (na wat gereken), wat je weer flink in je ruis scheelt. Ook die wiskunde vind je uitgebreid terug op het internet.

De 96 dB dynamiek van een CD wordt in de praktijk niet gehaald, niet in een opname, niet op een CD en niet in een zaal, in zoverre is SA een beetje overkill. In een heel goede lege concertzaal is het achtergrond-gerommel ongeveer 30dBA, met publiek erbij kom ik zelden beneden de 40dBA. En dan heb ik het over het constante geroezemoes, niet over af en toe iemand die kucht. Een orkest dat FFF speelt komt in de zaal op ca 115dB, op het podium soms tot 130.

En de theoretische dynamiek van een CD heeft niets met het harder of zachter zetten van je versterker te maken. 0dB is namelijk niet 'stil' maar een meeteenheid (2 tot de macht 0, is 1) let op dat er verschil is tussen dB en dBA ('A-gewogen') Het eerste is relatief, het tweede is absoluut. Dus als je je versterker zachter zet verschuif je dat wat je nul dB noemt omlaag op je 'gewogen' schaal. Uiteraard is het zo dat je daardoor minder ruimte krijgt tussen de ruis van de versterker, de achtergrondruis in je luisterruimte en het feitelijke signaal, maar dat is weer een heel andere dynamiek. Ga dichter bij de luidsprekers zitten en je schuift het weer omhoog.

En SACD's zijn inderdaad altijd anders gemasterd dan gewone CD's. Je zal wel moeten! Een directe vergelijking SA en CD is dus appels met peren vergelijken, want niet alleen een vergelijking van de kwaliteit van de technologie maar ook van het verschil in mastering. Sterker nog, ik kan je verzekeren dat een groot aantal opnames voor CD 'kapot' zijn gemasterd om het kwaliteitsverschil met SACD beter te kunnen accentueren.

  • ktf
  • Registratie: Maart 2007
  • Laatst online: 31-01 08:12
Verwijderd schreef op vrijdag 22 april 2011 @ 22:49:
Bij het maken van een (live) opname is de looptijd van het signaal van geen enkel belang.
De looptijd niet, het looptijdsverschil wel, dat is namelijk de basis van een aantal opnametechnieken die je noemt.
Het grappige is dat dit analoog en op 24 bit heel goed werkt, maar met 16 bits absoluut niet. Toen we onze eerst digitale opnames maakten in 16 bits moesten we echt close miking gebruiken, want 16 bits opnemen was gewoon niet genoeg (overigens was de ADC wel 16bits, maar effectief kwamen er maar 13 bits uit!)
Dat heeft dus geen fluit te maken met 24 of 16-bit, dat heeft te maken met de kwaliteit van je A/D-omzetters.
Wij nemen alles 24bit/196khz op. De reden daarvoor is dat je voor de digitale mix wat ruimte nodig hebt om in te kunnen rekenen.
En waarom neem je dan niet in 44/16 op en zet je dat voor je programma om naar 196/24, om maar wat te noemen? 'Ruimte om te rekenen', daar heeft degene met wie ik werk het ook altijd over, maar ik heb er nog geen uitleg voor kunnen vinden, hoe dat nu precies zit. Heb je documentatie? Headroom snap ik, maar dat zit in de bitdiepte en niet in de samplerate.
De essentie van 192KHz sampling is niet dat je de nyquist-frequentie verhoogt (je filtert aan de ingang dus nog steeds op 20KHz af) maar juist dat je die hele bovenband kan weggooien (na wat gereken), wat je weer flink in je ruis scheelt. Ook die wiskunde vind je uitgebreid terug op het internet.
Heb je een link? Dat is namelijk eigenlijk precies de reden dat ik dit topic gestart ben (namelijk, schiet meer dan 44/16 op, ook voor het opnemen? 44/24 doe ik zelf ook, maar 192/24?) en ik heb er níets over kunnen vinden. Misschien weet jij waar ik het kan vinden
De 96 dB dynamiek van een CD wordt in de praktijk niet gehaald, niet in een opname, niet op een CD en niet in een zaal, in zoverre is SA een beetje overkill. In een heel goede lege concertzaal is het achtergrond-gerommel ongeveer 30dBA, met publiek erbij kom ik zelden beneden de 40dBA. En dan heb ik het over het constante geroezemoes, niet over af en toe iemand die kucht. Een orkest dat FFF speelt komt in de zaal op ca 115dB, op het podium soms tot 130.
Dus, 24-bit audiobestanden voor consumenten vind jij ook onzin?

Verwijderd

Link.... Euh. Wikipedia. Shit, daar gaan ze ook niet al te diep op de materie in. Ik zit me suf te peinzen hoe die vent van het natlab ook al weer heette, dan heb ik het zo gevonden.

Looptijdverschillen: Inderdaad, maar men had het hier over een halve sample bij de weergave, Die doet echt niet ter zake, zeker gezien de looptijdverschillen die aan de ingangskant al zijn geintroduceerd.

44.1/16 opnames zijn in de praktijk bagger als je die om moet rekenen naar 48/16. Bovendien, en daar komt het weer, moet je ruimte hebben om te rekenen. Dat heeft in zoverre iets met headroom te maken, maar dan aan de onderkant. Eerder werd al het gebruik van dithering (Digger... ik vond 'm wel grappig) besproken. Waar het op neer komt is dat je bij een vermenigvuldiging van twee 16 bits getallen een 17 bits uitkomst krijgt. Als je in een 16bits domein blijft moet je dus gaan afronden. Die afronding resulteert in ruis. Als je het afgeronde signaal nogmaals gaat vermenigvuldigen introduceer je nog meer ruis en erger nog, je komt terecht in een 'limit cycle' en dan gaat die troep ineens correleren en gedraagt zich dus als een signaal, en niet als ruis. Dat is dus wel het laatste dat je wilt hebben. In een digitaal opnamesysteem, met allerlei digitale effecten erin, wordt er behoorlijk wat vermenigvuldigd, en dat gaat allemaal in integers (of fixed point), tenminste bij mij wel. Uiteraard zorgt de steeds sneller wordende hardware er voor dat er steeds meer floating-point wordt gewerkt. Als je met 16 bits fixed point zou werken houd je uiteindelijk alleen maar wat ruis over, of lijkt elke stem op die van Cher, als ze 'do you believe' zingt. (hoewel dat de autopitch was, maar het effect op de klank is ongeveer gelijk.)

Om dit voor te blijven werken we intern met meer bits en gebruiken we een techniek die we 'error shaping' noemen, zoals dithering, waarbij we extra energie in het systeem stoppen (ruis) maar we gebruiken kennis over de inhoud van het signaal om te bepalen welke kant we op gaan 'ruisen'. Zo kunnen we zorgen dat we niet in een limit cycle te komen, of beter gezegd: dat we de limit cycles doorbreken en maskeren. We nemen 24 bits op en rekenen in een 32 bits domein, zodat het effect van alle kwantisatiefouten ver buiten onze 16 bits output blijven.

We nemen 192 KHz op omdat we dan aan de ingang een simpel bessel-filter kunnen plaatsen. Dat is klanktechnisch nog steeds het mooiste. Vervolgens wordt er een digitaal anti-aliassing filter gebruikt om de boel ook verderop schoon te houden. Het maken van een steil digitaal FIR filter (met een constante looptijd) is heel gemakkelijk, terwijl dit analoog zo goed als onmogelijk is. Met de reductie van de bandbreedte reduceer je ook de ruis die in die band zit (sampling errors en thermisch) en dat levert je theoretisch weer twee bits op.

En doordat we intern met 192K Sample rate werken komt de energie die we er met de error-shaping instoppen zowel in de passband als in de stopband terecht. Error shaping zorgt er echter voor dat dit geen witte ruis is, want dan zou de energie gelijkmatig over het hele spectrum verdeeld zijn. Nu is het zo dat de meeste energie in de stopband komt (het gebied tussen 22KHz en 86KHz) en aangezien die band er op het einde helemaal uitgefilterd wordt komt er effectief dus vrijwel niets aan ruis bij (minder dan een kwart LSB). Het nuttige en het aangename bijkans op een ideale manier verenigd. Dit is veruit het belangrijkste voordeel van oversampling aan de ingangskant.

Eigenlijk is dit heel elementaire signaal-theorie, Z-transformatie en dergelijke. Als het niet zo lang geleden was dat ik me daar nog in verdiept heb zou ik het je zo geven. Maar ik zoek even. Ik kom hier op terug.

Wat je eens moet doen is een SACD digitaliseren, dan terugsampelen naar 16/44.1 en dat op een CD branden. Geen hond die het verschil hoort. Bij ons in de studio tenminste niet. (maar bij ons lopen er ook alleen maar katten in de studio!) En bij Mira productions waar we veel voor werken - de Franse tak, niet de noord-amerikaanse- ook niet. Vandaar dat we nooit verder zijn gekomen dan 5 SACDs. Ik heb hier een opname van Michel Petrucciani die we kort voor zijn dood in het Capitole in Toulouse hebben opgenomen. We hadden toen net onze 24bits/192KHz mobiele studio af, als een van de eerste onafhankelijke studios hier in het zuiden. Daarvan is een SACD gemaakt (ik meen voor/door Dreyfus) in en oplage van maar liefst 100 stuks! Die werd door de CNES, samen met een Sony SCD-1 speler die nog niet eens op de markt was, als relatiegeschenk weggegeven als je een satelliet door ze liet lanceren. Die opname is nergens meer te vinden. Ik heb de eindmaster gemaakt en daar twee versies van geleverd: een bitstream voor SA en een lineaire downsample daarvan naar red book, zodat de opdrachtgever het zelf ook ergens op kon afspelen. Die laatste was zo waanzinnig mooi dat Mira daarna nooit meer een SACD heeft laten maken!

De SACD kwam overigens pas 8 maanden na zijn dood van de pers (zal wel een brander geweest zijn, met zo'n oplage). Ik weet nog wel dat het toen een heel gedoe was met de nabestaanden, of dat ding wel gemaakt mocht worden, omdat Michel er op stond alles eerst zelf te horen voor het mocht worden uitgebracht, en dit had hij nooit gehoord! Uiteindelijk heeft zijn broer de toestemming gegeven.

Dus ja, ik vind 24 bit audiobestanden voor consumenten je reinste onzin. Doe het goed op 16 bit en je hebt geen SACD nodig. Ik beweer zeker niet dat wij de beste studio van de wereld hebben, en al helemaal niet dat wij de beste opnames van de wereld maken, maar als een kleine studio met 2 werknemers/direkteur eigenaren met een klein budget kan wat wij kunnen, dan is het een schande wat de grote maatschappijen met hun miljoenen-studios soms op de markt durven te zetten.

[ Voor 17% gewijzigd door Verwijderd op 23-04-2011 05:59 ]


Verwijderd

Verwijderd schreef op zaterdag 23 april 2011 @ 00:35:
Link.... Euh. Wikipedia. Shit, daar gaan ze ook niet al te diep op de materie in. Ik zit me suf te peinzen hoe die vent van het natlab ook al weer heette, dan heb ik het zo gevonden.
Kees Schouham Immink.

Verwijderd

Kees Schouhamer Immink... blijkt nota bene een jaargenoot van me! (of althans zelfde jaar afgestudeerd, maar hij deed 't cum laude, dus hij zal er wel een jaartje minder lang over gedaan hebben dan ik! Nee ik zie het al, hij zat toen al bij Philips, vandaar dat ik 'm verder niet ken.)

Maar ik heb een andere naam in mijn hoofd. Ik zoek nog even door!

Edit:
Ik had J.P.J. Heemskerk in gedachten, maar daarmee ben ik nog geen stap dichter bij een link, vreemd genoeg. Er rammelt ook nog iets in mijn achterhoofd dat de hele wiskunde achter de CD gewoon van Janssen was. Maar dat is uiteraard helemaal onmogelijk zoeken.

Als ik google op 'digital oversampling audio' kom ik in elk geval genoeg 'populair wetenschappelijke' artikelen tegen waar de theorie achter oversampling uit de doeken wordt gedaan zonder in al te veel wiskunde te vervallen.

Verder vind ik dit wel een aardig artikel, met een duidelijke introductie.

Edit 2:
Mijn geheugen is zo slecht nog niet. Het was inderdaad Guido (A.J.E.M.) Janssen die op het natlab de wiskunde achter de oversampling op papier heeft uitgewerkt. Nu je dat weet doet google de rest!

[ Voor 80% gewijzigd door Verwijderd op 23-04-2011 04:51 ]


  • ktf
  • Registratie: Maart 2007
  • Laatst online: 31-01 08:12
Verwijderd schreef op zaterdag 23 april 2011 @ 00:35:
44.1/16 opnames zijn in de praktijk bagger als je die om moet rekenen naar 48/16. Bovendien, en daar komt het weer, moet je ruimte hebben om te rekenen. Dat heeft in zoverre iets met headroom te maken, maar dan aan de onderkant. Eerder werd al het gebruik van dithering. (...) In een digitaal opnamesysteem, met allerlei digitale effecten erin, wordt er behoorlijk wat vermenigvuldigd, en dat gaat allemaal in integers (of fixed point), tenminste bij mij wel. Uiteraard zorgt de steeds sneller wordende hardware er voor dat er steeds meer floating-point wordt gewerkt.
Mijn software werkt altijd in 32-bit float. (Audacity an Audition) Dat lijkt me niet meer dan logisch. Daarnaast spreek je over oversampling, daar ga ik het zo nog even over hebben. Wat je hier beschrijft, met afrondverschillen, wordt daar allemaal door opgevangen. Aangezien 24-bit 144dB is en ruisniveau's nooit onder de 130dB zullen kunnen komen (thermische ruis) zit je dus altijd af te ronden in de ruis, als je op 24-bit zou werken. Op 16-bit werken is gewoon niet praktisch, maar dat heb ik al eerder gezegd.
Om dit voor te blijven werken we intern met meer bits en gebruiken we een techniek die we 'error shaping' noemen, zoals dithering, waarbij we extra energie in het systeem stoppen (ruis) maar we gebruiken kennis over de inhoud van het signaal om te bepalen welke kant we op gaan 'ruisen'. Zo kunnen we zorgen dat we niet in een limit cycle te komen, of beter gezegd: dat we de limit cycles doorbreken en maskeren. We nemen 24 bits op en rekenen in een 32 bits domein, zodat het effect van alle kwantisatiefouten ver buiten onze 16 bits output blijven.
Dithering in het mixproces? Wat is dat voor waanzin? Ik denk dat je probeert 'noise shaping' te beschrijven?
Waar het op neer komt is dat je bij een vermenigvuldiging van twee 16 bits getallen een 17 bits uitkomst krijgt. Als je in een 16bits domein blijft moet je dus gaan afronden. Die afronding resulteert in ruis. Als je het afgeronde signaal nogmaals gaat vermenigvuldigen introduceer je nog meer ruis en erger nog, je komt terecht in een 'limit cycle' en dan gaat die troep ineens correleren en gedraagt zich dus als een signaal, en niet als ruis. Dat is dus wel het laatste dat je wilt hebben.
Maar je edit niet in 16-bit, je edit in 24-bit of float. Dat is niet meer dan normaal, toch? Overigens, oversampling, daar ben ik mee bekend, ga ik het zo over hebben.
We nemen 192 KHz op omdat we dan aan de ingang een simpel bessel-filter kunnen plaatsen. Dat is klanktechnisch nog steeds het mooiste. Vervolgens wordt er een digitaal anti-aliassing filter gebruikt om de boel ook verderop schoon te houden. Het maken van een steil digitaal FIR filter (met een constante looptijd) is heel gemakkelijk, terwijl dit analoog zo goed als onmogelijk is. Met de reductie van de bandbreedte reduceer je ook de ruis die in die band zit (sampling errors en thermisch) en dat levert je theoretisch weer twee bits op.
(...)
En doordat we intern met 192K Sample rate werken komt de energie die we er met de error-shaping instoppen zowel in de passband als in de stopband terecht. Error shaping zorgt er echter voor dat dit geen witte ruis is, want dan zou de energie gelijkmatig over het hele spectrum verdeeld zijn. Nu is het zo dat de meeste energie in de stopband komt (het gebied tussen 22KHz en 86KHz) en aangezien die band er op het einde helemaal uitgefilterd wordt komt er effectief dus vrijwel niets aan ruis bij (minder dan een kwart LSB). Het nuttige en het aangename bijkans op een ideale manier verenigd. Dit is veruit het belangrijkste voordeel van oversampling aan de ingangskant.
Echter, een beetje A/D-convertor met goede specs is er eentje die oversampled en noiseshaping en een digitaal filter gebruikt. Toegegeven, dat doet een niet-causaal filter wat je achteraf toepast dus veel beter, maar moet je daar nu voor op 192kHz op gaan nemen? Lijkt me een beetje overkill.
Als ik google op 'digital oversampling audio' kom ik in elk geval genoeg 'populair wetenschappelijke' artikelen tegen waar de theorie achter oversampling uit de doeken wordt gedaan zonder in al te veel wiskunde te vervallen.

Verder vind ik dit wel een aardig artikel, met een duidelijke introductie.
Wat ik dus al zei, huidige ADC's doen aan oversampling. Als je de ADC op 96kHz zet zal hij minder oversamplen dan als je hem op 44 of of 48 zet: als je hem dus op 96 zet om "te oversamplen" dan schiet je er dus netto niets mee op. Om ADC's te maken met goede specs stoppen fabrikanten die chips namelijk helemaal vol met oversample- en noiseshaping technieken, anders haal je gewoon geen SNR van meer dan 110dB.

Goed, dus, het enige punt dat je nu toevoegt om op te nemen op hogere sample-rates is dat je de frequenties boven de 20kHz er beter (scherper) uit kan snijden in de post dan op de ADC, toch? Oversampling gebeurd namelijk al in de ADC en dither/afrondingsfouten heeft/hebben niets te maken met samplerates, dat gaat over bitdiepte.

[ Voor 10% gewijzigd door ktf op 23-04-2011 13:29 ]

Pagina: 1