t-town schreef op dinsdag 24 juni 2014 @ 18:53:
[...]
Dat noemt het Cocktail Party Effect en daar wordt aan de KU Leuven s
erieus ond
erzoek naar gedaan. Ik h
erinn
er mij een demo waarbii men 4-5 streams virtueel projecte
ert in een kam
er waarop het algoritme ze allemaal uit elkaar ging halen. Dat bestaat dus al wel.
Ik ben
er mee bekend

Geen idee wat de laatste stand van zaken is hoor, maar is het dan ook goed genoeg om te kunnen ond
ertitelen? En hoe complex is die algoritme? Moet
er speciale hardware voor komen om de benodigde en
ergie binnen de p
erken te houden?
Vraag me ook af wat je met virtueel project
eren bedoelt. Ze hebben het nog niet getest op een v
erjaardagsfeest oid? Want ik kan me ook wel wat demo filmpjes h
erinn
eren die het allemaal vrij eenvoudig laten lijken, maar daar w
erd geen rekening gehouden met dat mensen bewegen, dat
er steeds hard
er en dan zacht
er wordt gepraat e.d.
De automatische ond
ertiteling die ik heb gezien moet ook een vrij duidelijke spraak als input krijgen. Een accent of iemand die binnensmonds praat zorgt
er al voor dat de zinnen die
eruit komen vrij hilarisch zijn. Gooi daar nog all
erlei and
ere acht
ergrond geluiden bij en het wordt helemaal feest lijkt me.
Ik heb p
ersoonlijk met dit soort dingen altijd zoiets van: als ik al moeite heb met het ond
erscheiden van stemmen en
er w
erkende zinnen uit te halen in zo'n situatie, wat moet een comput
er er dan wel niet van maken. Nu weet ik ook wel dat ik niet echt een held ben in positiebepaling van geluiden, maar toch...
Hmmm... Welke bestanden doe je
er dan in?
[
Voor 17% gewijzigd door
Caelorum op 24-06-2014 19:42
]