Wat zijn nou woorden waarvan ik niet denk dat Dragon ze direct zal herkennen…
- mecenassen
- zuclopentixol
- Zuid-Willemsvaart
Ik gebruik deze woorden zelf eigenlijk nooit en ik geloof eerlijk gezegd dat bijna niemand ze vaak gebruikt. Toch herkent Dragon ze meteen.
Bijzondere woorden die makkelijk zijn voor Dragon
Laatst was het weer eens zover: ik dicteerde een zin met daarin een woord waarvan ik absoluut zeker wist dat Dragon het niet zou herkennen. Zó’n raar woord, dat ik bij het uitspreken bijna kramp in mijn tong kreeg.
Tot mijn stomme verbazing schreef Dragon het in één keer goed op.
Iedereen die met spraakherkenning werkt, weet dat er regelmatig iets slecht verstaan wordt. Maar de glanzende keerzijde van deze medaille is het aantal woorden dat vanzelf goed gaat. Dus welke woorden kent de spraakherkenning eigenlijk vanaf het begin? Kan Dragon in principe elk woord opschrijven, als je het maar duidelijk genoeg uitspreekt?
Het lexicon
Als jij woorden dicteert, komen de gedicteerde woorden uit de woordenlijst van Dragon zelf. De spraakherkenning heeft dus een soort ingebouwd woordenboek. Dat wordt het lexicon genoemd. In de Dragon-balk zie je dan ook een menu met de naam Lexicon.
Zodra jij een woord dicteert, gaat het programma kijken of er een match is met één van de woorden uit zijn woordenboek. Als dat zo is, dan wordt het woord door Dragon opgeschreven. En is de match er niet, dan probeert Dragon iets op te schrijven dat zo dicht mogelijk in de buurt komt. Ik geeft het toe: soms verzint hij daar creatieve oplossingen voor, die voor een mens niet te volgen zijn 🙂 .
De spraakherkenning kan dus geen woorden opschrijven die niet in zijn lexicon staan. Zelfs niet als jij heel duidelijk spreekt.
Mecenassen, zuclopentixol, Zuid-Willemsvaart… Waarom staan uitgerekend deze woorden in Dragon’s woordenlijst?
Dat heeft te maken met de manier waarop deze woordenlijst samengesteld wordt. Ze hebben namelijk niet zomaar de Dikke Van Dale in het spraakherkenningsprogramma gestopt. Nee, het lexicon is mede gebaseerd op de woorden die Nederlanders daadwerkelijk gebruiken.
Er zitten woorden in het lexicon die bijvoorbeeld in de Nederlandse kranten voorkomen en daarnaast ook woorden die door Dragongebruikers worden toegevoegd aan het systeem. Je kunt er namelijk voor kiezen om mee te werken aan het verbeteren van de spraakherkenning door je gegevens anoniem te delen met de fabrikant.
Hoeveel woorden kent de gemiddelde Nederlander?
Toen ik het schrijven van dit blogbericht voorbereidde werd ik nieuwsgierig naar het aantal woorden dat de gemiddelde Nederlander gebruikt. Ik vond hierover een artikel in de NRC.
Volgens dit artikel begrijpen laagopgeleide volwassen Nederlanders gemiddeld 15.000-20.000 woorden. Dat betekent dus niet dat ze deze woorden zelf zouden gebruiken, maar ze kénnen de woorden wel. Voor de gemiddelde hoogopgeleide Nederlander is dit aantal 60.000 woorden.
Hoeveel woorden kent Dragon eigenlijk?

240.000 woorden in de Dikke Van Dale
Dat is dan natuurlijk de hamvraag. En daarop wilde ik je het antwoord niet schuldig blijven dus ik ben de woorden van mijn Dragonprofiel in de lexiconbewerker gaan tellen. Eén, twee, drie… Heel Erg Veel 😯 Al snel kwam ik tot de conclusie dat ik dit moest automatiseren met een zelfgeschreven spraakopdracht, want anders was het niet te doen.
Mijn opdracht telde in eenheden van 10.000 woorden dus het exacte aantal woorden weet ik niet, maar het ligt tussen de 150.000 en de 160.000 woorden. Wow!
Kent Dragon dan echt meer woorden dan een hoogopgeleide Nederlander? Het lijkt zo, maar waarschijnlijk toch niet. Aangezien de spraakherkenning geen grammatica kent, kan hij zelf bijvoorbeeld geen werkwoorden vervoegen. Dat betekent dat alle varianten van het werkwoord ‘worden’ als nieuw woord in het lexicon worden toegevoegd. Dus: worden, word, wordt, geworden, werd, werden. Eigenlijk gaat het maar om één werkwoord, maar het levert zomaar zes aparte woorden in het lexicon op. Ook staan alle leestekens zoals ‘punt’ en ‘haakje openen’ als apart woord in het lexicon. De woordenlijst van Dragon is dus niet helemaal te vergelijken met een gewoon woordenboek.
Desondanks lijkt mij één ding wel duidelijk: er staan verrassend veel woorden in Dragon’s lexicon!
Haal het onderste uit de kan!
In de Spraakherkenningsacademie leer je hoe jij maximale herkenning bereikt met Dragon. Volg de gratis proeflessen om een kijkje te nemen achter de schermen. Het is helemaal vrijblijvend; je hoeft geen betaalgegevens achter te laten.