Doneer je stem, Siri werkt niet alleen voor witte mannen

Heeft Siri problemen met uw accent? Een project draait om crowdsourced voice donations om dit probleem te overwinnen en een aantal andere inherente problemen met spraakherkenning op te lossen .

Voice assistenten zoals Siri en Alexa zijn gebaseerd op grote databases met opgenomen spraak. Maar als deze niet genoeg monsters bevatten van een bepaald accent of dialect, zullen de stemassistenten moeite hebben om mensen te begrijpen die op die manier spreken.

Zo zet Mozilla - de basis van de Firefox-webbrowser - zich tot crowdsourcing om spraakherkenningssystemen te maken die deze problemen vermijden. Door middel van Project Common Voice , die vorige maand gelanceerd is, streeft Mozilla naar 10.000 spreekwoorden Engels van mensen met een breed scala aan accenten.

 

"Historisch gezien zijn de meeste verzamelingen van spraak en taal meestal meer mannelijk en wit en middelklasse," zegt Rachael Tatman aan de Universiteit van Washington. En terwijl bedrijven zoals Google en Amazon beter worden bij het evenwicht van hun datasets, met name wat betreft gender, hebben voice recognition systemen nog steeds een moeilijke tijd om Amerikanen te begrijpen die met bepaalde accenten spreken, zegt ze.

De software heeft de neiging om beter te werken voor accenten die traditioneel gezien zijn als prestigieuze, zegt Tatman. En de accenten en dialecten die vaak ondervertegenwoordigd zijn in het trainen van datasets, worden meestal geassocieerd met groepen mensen die al in de Amerikaanse samenleving gemarginaliseerd zijn. Daarom heeft voice software soms lagere herkenningsgraden voor Afro-Amerikanen, zegt ze.

 

Woorden schieten tekort

 

Hetzelfde geldt voor vrouwelijke stemmen. Naomi Saphra aan de Universiteit van Edinburgh, Groot-Brittannië, maakt gebruik van spraakherkennings software om code te schrijven omdat ze niet kan typen. Ze moet veranderen hoe ze woorden uitspreekt omdat de software die ze gebruikt niet altijd vrouwelijke klanken herkent. "Ik zou het gebied van spraakherkenning meer democratiseren willen zien," zegt ze.

 

Maar zoals bij de meeste problemen rond algoritmische vooroordeel , is er geen makkelijke oplossing.

Op dit moment zijn voice recognition data sets meestal geconcentreerd in de handen van een paar bedrijven, zegt Kelly Davis, die het Mozilla project leidt. Wanneer mensen met Alexa of Google Voice spreken , worden de interacties aangemeld, waardoor een steeds groeiende database van spraakgegevens wordt ontwikkeld - voor Amazon en Google. Dat versterkt het monopolie van deze bedrijven op een hoogwaardige spraakherkenning, waardoor het moeilijker wordt voor concurrenten om spraakassistenten te ontwikkelen.

 

Alan Black bij de Carnegie Mellon University in Pennsylvania zegt dat de grote spraakherkenningsbedrijven ervoor willen zorgen dat hun software accuraat is voor een breed scala aan dialecten en accenten. Als mensen met bepaalde accenten vinden dat ze niet herkend worden door een bepaald systeem, kan dit toekomstig gebruik afbreken. Als ze stoppen met het gebruik van de apparaten, zullen de spraakassistentbedrijven gegevens missen van mensen met die accenten, verder scherpen wat Siri en Alexa gemakkelijk kunnen reageren.

 

Nadat Mozilla genoeg audioclips heeft verzameld, zijn de plannen van plan om ze vrij te laten, zodat iedereen - zelfs Google en Amazon - hun eigen spraakherkenningssysteem kan trainen met behulp van machine learning. "De top mensen zijn echt in universiteiten," zegt Black, maar ze hebben meestal geen toegang tot zeer grote voice-training datasets.

Om hun stem toe te voegen aan het project, kunnen mensen de website Common Voice bezoeken, een clip van zichzelf opnemen die een voorgeselecteerde zin lezen en hun demografische details toevoegen. Bezoekers kunnen ook luisteren naar de opnames van anderen om er zeker van te zijn dat ze accuraat zijn.

 

Dit alles zal uiteindelijk helpen bij het bouwen van software die een breed scala aan accenten herkent. Momenteel accepteert Mozilla alleen opnamen in het Engels, maar als het project succesvol is, is het van plan om soortgelijke initiatieven in andere talen te starten.

Reactie schrijven

Commentaren: 0