Google heeft AI die een stem uit een menigte kan filteren

Jarenlange blootstelling aan veel te harde muziek heeft het mij bijna onmogelijk gemaakt: een stem isoleren in een groep of (nog erger) menigte mensen. Misschien dat ik in de toekomst echter geholpen kan worden door Google, want die zijn een ‘deep learning’ systeem ontwikkeld dat specifieke stemmen kan herkennen en uitfilteren, onder andere door naar de gezichten van mensen te kijken.

Het model is getraind om naar individuele mensen te kijken terwijl ze praten en op die manier het geluid te matchen met de persoon en het zo te isoleren in een apart audiospoor. Kijk naar de audio van de twee comedians hieronder die gewoon door elkaar aan het praten zijn en de AI kan er zonder probleem ééntje uitpikken en alleen dat geluid laten horen. Dat werkt zelfs als het gezicht van de persoon in kwestie gedeeltelijk wordt geblokkeerd door een microfoon of gebarende handen.

Powered by WPeMatico

Aanbevolen artikelen