{"id":808,"date":"2008-06-05T11:55:55","date_gmt":"2008-06-05T11:55:55","guid":{"rendered":"http:\/\/www.joswassink.nl\/inzicht\/?p=808"},"modified":"2010-07-05T11:57:49","modified_gmt":"2010-07-05T11:57:49","slug":"de-heilige-kraal-van-spraakherkenning","status":"publish","type":"post","link":"https:\/\/www.joswassink.nl\/inzicht\/?p=808","title":{"rendered":"De heilige kraal van spraakherkenning"},"content":{"rendered":"<p><em>Delta  19, 5 juni 2008, wetenschap<\/em><\/p>\n<h3><em> <\/em><strong>De  heilige kraal van spraakherkenning<\/strong><\/h3>\n<p>Wanneer  spraakherkenningsprogramma&#8217;s leren begrijpen waar een gesprek over gaat,  maken ze minder fouten. Informaticus dr.ir. Pascal Wiggers pleit voor  meer context.<!--more--><\/p>\n<div id=\"attachment_809\" style=\"width: 490px\" class=\"wp-caption alignnone\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-809\" class=\"size-full wp-image-809\" title=\"spraakherkenning\" src=\"http:\/\/www.joswassink.nl\/inzicht\/wp-content\/uploads\/2010\/07\/spraakherkenning.jpg\" alt=\"\" width=\"480\" height=\"480\" \/><p id=\"caption-attachment-809\" class=\"wp-caption-text\">.<\/p><\/div>\n<p>Taalherkenning werkt niet, is het heersende idee. Dat doet geen recht  aan de vorderingen van de afgelopen vijftien jaar. Een voorgelezen  krantenbericht wordt inmiddels voor 95 procent correct herkend. Maar we  ergeren ons vooral aan de fouten die in elke tweede regel voorkomen.  Beroerder is de herkenning van een spontaan gesprek. Daarvan wordt  slechts tweederde correct wordt verstaan. Spraakherkenning wordt hier en  daar gebruikt (in operatiekamers, straaljagers en bij  reisinformatiesystemen), maar de luisterende computer kan zich nog bij  lange niet meten met de mens.<\/p>\n<p>Pascal Wiggers vindt dat het tijd  is voor een nieuwe benadering van het probleem, want het verder  verfijnen van de bestaande methoden levert marginale verbeteringen op.  Hij promoveerde woensdag bij de leerstoel mens-machine interactie van  prof.dr. Henk Koppelaar (Elektrotechniek, Wiskunde en Informatica).<\/p>\n<p>Bestaande  systemen vallen in twee onderdelen uiteen: het akoestische deel en het  taalgedeelte. Het akoestische deel vangt klanken op en vergelijkt die  met basisklanken (fonemen) in het geheugen. Dat levert woorden op die  met dat klankpatroon overeenkomen. Bijvoorbeeld &#8216;Tilburg&#8217; en  &#8216;Middelburg&#8217; of &#8216;graal&#8217;, &#8216;kraal&#8217; en &#8216;praal&#8217;. Het taalgedeelte kiest uit  de aangeboden woorden het meest waarschijnlijke op basis van statistiek.<\/p>\n<p>Wiggers  heeft niet zoveel op met de statistische benadering. Hij stelt dat de  kracht van de methode ook de zwakte is: het gaat meestal goed, maar bij  uitzonderingen blijft het systeem miskleunen.<\/p>\n<p>De kans op fouten  wordt minder bij een kleinere woordenlijst. Veel systemen brengen daarom  het aantal mogelijke termen terug tot een minimum.<\/p>\n<p>Wiggers kiest  paradoxaal genoeg voor de inzet van het hele woordenboek en betoogt dat  fouten minder worden naarmate het systeem meer &#8216;weet&#8217; over het  gespreksonderwerp. Als je de woorden dokter en zuster hoort, weet je  vrijwel zeker dat het over een ziekenhuis gaat.<\/p>\n<p>Woorden zijn net  mensen, ze omringen zich bij voorkeur met oude bekenden en vormen  zogenaamde &#8216;clusters&#8217;. Wiggers analyseerde de acht miljoen gesproken en  uitgeschreven woorden uit vijfduizend opnamen van de Standaardcorpus van  de Nederlands-Belgische taal. Hij ontdekte dat slechts 128 clusters  genoeg zijn om de taal in te vangen. Clusters vallen niet helemaal samen  met onderwerpen, want een groep met Griekse en Latijnse termen bevat  ook woorden uit kerkdiensten.<\/p>\n<p>Die clustering helpt bij  spraakherkenning. &#8220;Al luisterend komen een paar clusters boven drijven,&#8221;  vertelt Wiggers, &#8220;meestal zo&#8217;n vijf tot tien van het totaal.&#8221; Het  taalgedeelte zal in die beperkte groepen naar woorden zoeken. Zo past  bij &#8216;dokter&#8217; en &#8216;zuster&#8217; eerder &#8216;kussen&#8217; dan &#8216;blussen&#8217;.<\/p>\n<p>Of de  contextgebaseerde spraakherkenning beter presteert dan de machines uit  Twente, Leuven, Nijmegen en Gent, zal moeten blijken op de onderlinge  wedstrijd N-best 2008 die in augustus wordt gehouden.<\/p>\n<p>@01  infoblokje:P. Wiggers: &#8216;Modelling context in automatic speech  recognition&#8217;, 4 juni 2008.<\/p>\n<p>++<\/p>\n<p><a href=\"http:\/\/www.delta.tudelft.nl\/nl\/archief\/artikel\/de-heilige-kraal-van-spraakherkenning\/18029\" target=\"_blank\">zie ook website TU<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Delta 19, 5 juni 2008, wetenschap De heilige kraal van spraakherkenning Wanneer spraakherkenningsprogramma&#8217;s leren begrijpen waar een gesprek over gaat, maken ze minder fouten. Informaticus dr.ir. Pascal Wiggers pleit voor meer context.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[24],"tags":[],"class_list":["post-808","post","type-post","status-publish","format-standard","hentry","category-delta"],"_links":{"self":[{"href":"https:\/\/www.joswassink.nl\/inzicht\/index.php?rest_route=\/wp\/v2\/posts\/808","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.joswassink.nl\/inzicht\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.joswassink.nl\/inzicht\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.joswassink.nl\/inzicht\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.joswassink.nl\/inzicht\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=808"}],"version-history":[{"count":1,"href":"https:\/\/www.joswassink.nl\/inzicht\/index.php?rest_route=\/wp\/v2\/posts\/808\/revisions"}],"predecessor-version":[{"id":810,"href":"https:\/\/www.joswassink.nl\/inzicht\/index.php?rest_route=\/wp\/v2\/posts\/808\/revisions\/810"}],"wp:attachment":[{"href":"https:\/\/www.joswassink.nl\/inzicht\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=808"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.joswassink.nl\/inzicht\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=808"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.joswassink.nl\/inzicht\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=808"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}