Hoe haalt Dragon zo'n hoge herkenbaarheid?

Niet elk spraakherkenningspakket is hetzelfde, de meest gebruikte softwarepakketten hanteren de volgende technieken.

 

Allereerst moet het systeem je stem leren herkennen. Daarvoor wordt er een klein stukje tekst voorgelezen en er een start-herkenbaarheid bepaald. 

Onder water wordt gekozen bij welke ‘blauwdruk’ je het beste past. Duizenden proefpersonen, vanuit alle windstreken, hebben uren teksten voorgelezen. Met en zonder dialect. Hele krantenartikelen.
Een zo’n proefpersoon wordt dus je startprofiel. Tijdens het dicteren leert spraakherkenning je stem beter herkennen en zal betere keuzes maken.

De rest is statistiek. Of Big Data voor de liefhebber

Tijdens het gebruik wordt bijgehouden welke woorden worden gebruikt en deze woorden worden in een logfile geplaatst. Standaard zitten zo’n 250.000 woorden in een lexicon. Gemiddeld gebruikt een persoon 50.000 actieve woorden, dus om die herkenbaarheid omhoog te krijgen, moet duidelijk zijn welk woorden hij of zij het meest gebruikt. Verstaat spraakherkenning je niet helemaal en heeft ze een aantal fonemen geformeerd tot mogelijkheden, kijkt ze in de logfile en geeft de voorkeur aan het meest gebruikte en lijkend woord. 

 

En niet alleen de woorden afzonderlijk, maar ook de combinatie van woorden, dus de persoonlijke schrijfstijl. Dat is ook de reden waarom er geen schrijffouten meer gemaakt worden: hij wordt … en ik word .. is zo uit elkaar te houden, ze ‘horen’ bij elkaar.

 

Dit hele proces is te optimaliseren, zelfs voordat er wordt gestart, maar daar zal ik je niet mee lastigvallen. Wel belangrijk is een beetje snelle computer om dit alles aan te kunnen.

Reactie schrijven

Commentaren: 0