Bristede forventninger: Tale-til-tekst gav ingen stor gevinst

Selv om tanken er god, er der i praksis ofte for store problemer med at få systemer til talegenkendelse til at virke

Tale til tekst

Forventningerne til talegenkendelse er stadig ikke indfriet i Odense Kommune

For bare tre år siden blev programmer til understøttelse af tale-til tekst udråbt som potentielt guld i det offentlige. Sagsbehandlere kunne spare millioner i hverdagen ved at indlæse deres journalnotater i stedet for selv at skrive dem ind. To år efter ligner den strategi en fuser.

For selv om tanken er god, er der i praksis ofte for store problemer med at få det til at virke fx at få ro i storrumskontorerne, overvinde generthedsbarriererne og manglende fagpakker til talegenkendelsessystemerne.

På Top 10-listen
Da KL's Økonomiske Sekretariat i 2014 udgav pjecen "10 gode eksempler på administrative effektiviseringer i kommunerne", var talegenkendelse ét af de ti gode eksempler.

"Talegenkendelse rummer et potentiale til både at skabe tidsbe­sparelser, bedre tekster og et forbedret arbejdsmiljø for medar­bejdere, der bruger meget tid foran computerskærmen" skrev daværende projektleder for talegenkendelse, Carl Østergaard, Odense Kommune, og kunne underbyggede med statistik, der viste, hvordan kommunens løsning til talegenkendelse løbende blev anvendt mere og mere og virkede både hurtigere og bedre.

De første statistikker viste en positiv udvikling i genkendelsesprocenten

I slutningen af 2014 havde ca. hver tredje kommune lige som Odense Kommune gjort sig de første erfaringer med talegenkendelse. Op mod 3.500 offentligt ansatte arbejde med talegenkendelse.

 Allerede på det tidspunkt kunne PA Consulting dog tørt konstatere i en rapport til Digitaliseringsstyrelsen, "Forudsætninger og barrierer for effektiv anvendelse af talegenkendelse i kommunerne":

"De danske kommuner har i et internationalt perspektiv været ”first movers” i forhold til anvendelsen af talegenkendelse i kommunal sagsbehandling. De har derfor ikke haft noget relevant erfaringsgrundlag at basere sig på og har derfor været relativt uforberedte på de betydelige udfordringer implementeringen og anvendelsen har indebåret."

PA vurderede, at talegenkendelse har et potentiale til at frigøre tid og ressourcer i de danske kommuner. Det var dog samtidig blandt andet PA’s vurdering, at talegenkendelse baseret på den eksisterende teknologi kun ville muliggøre effektiviseringspotentialer i forhold til en relativt lille del af kommunernes medarbejdere. I rapport påpegede PA Consulting, at en del af udfordringen med talegenkendelse skyldtes markedssituationen.

"Nuance dominerer i dag markedet for talegenkendelse, og i Danmark har Nuance i praksis et producentmonopol", skrev PA Consulting og konkluderede:

" Nuances monopol og det relativt begrænsede marked i Danmark indebærer, at Nuance ikke har væsentlige incitamenter til at investere i udvikling af en velfungerende akustisk model til det danske marked og i fagligt fokuserede sprogmodeller".

Odense Kommune kæmper bravt
I Odense Kommune blev talegenkendelse i 2012 igangsat som et effektiviserings - og besparelsesprojekt, hvor der på forhånd blev høstet en besparelse i alle kommunens forvaltninger. Projektet blev på det tidspunkt betegnet som Europas største projekt med brug af talegenkendelse til sagsbehandling, og det ambitiøse mål var at spare kommunen 78 millioner kr. på udgifter til sagsbehandling.

Trods de positive forventninger, hvor 700 sagsbehandlere fra starten blev sat til at bruge den nye talegenkendelsesløsning fra den østrigske producent Nuance, blev projektet ikke den ventede succes i første omgang.

Kommunen besluttede derfor at genstarte implementeringen af talegenkendelse. I 2014 ville kommunen reintroducere mobil talegenkendelse til iPad, Android telefon og iPhones, men løsningen blev aldrig distribueret ud til brugerne på grund af for dårlig teknik

Så i 2017 er forventningerne til talegenkendelse stadig ikke indfriet i Odense Kommune:

"Desværre er der ikke så mange brugere af talegenkendelsessystemet i kommunen, som man havde håbet på fra starten. Men for den enkelte bruger, der har taget talegenkendelsessystemet til sig, er der en positiv effekt - både tidsmæssigt og fysisk, forstået på den måde, at det bliver lettere for sagsbehandleren at nå at dokumentere, og at det ikke belaster kroppen så meget at få skrevet sine tekster ved hjælp af talegenkendelse som at skrive på tastatur", forklarer Niels Henrik Demant Rasmussen, Chef for IT Service og Infrastruktur i Odense Kommune.

Også forsøget med mobil talegenkendelse er droppet igen, da det viste sig, at teknikken på ingen måde levede op til kommunens forventninger", fortsætter Niels Henrik Demant Rasmussen:

"Vi har dog planer om at teste mobil talegenkendelse i kommunalt regi igen. Vi forventer, at teknologien er forbedret væsentligt i løbet af de år, der er gået og håber på et positivt resultat denne gang", siger Niels Henrik Demant Rasmussen, der alligevel mener, at talegenkendelse er kommet for at blive:

"Med den digitale udvikling der er, forventer jeg, at systemet bliver lettere at anvende og eventuelt kommer til at basere sig på den samme teknologi, som vi på nuværende tidspunkt ser på IOS."

Niels Henrik Demant Rasmussens egen talegenkendelsesstatistik for 2017

Ill: Niels Henrik Demant Rasmussens egen talegenkendelsesstatistik for 2017

Forkert teknologi til det forkerte formål
Lektor i teknologi- og forandringsledelse, Per Richard Hansen, Aalborg Universitet, AAU, er ikke overrasket over de fortsatte udfordringer med talegenkendelse i kommunerne:

"Problemet er klassisk. Teknologien er tænkt ind i en forkert problemstilling. Man afsætter ofte ikke de nødvendig midler til at forstå teknologien. Man implementerer den på den klassiske helt forkerte måde", forklarer Per Richard Hansen, der har arbejdet med talegenkendelse som teknologisk værktøj i videnintensivt arbejde:

"En genkendelsesrate på 98,5% lyder meget høj, men er faktisk tæt på uanvendeligt. Brugeren skal alt for ofte ind og rette i fejlene, og det stresser og er irriterende. 

Derudover så er måden vi "taler" skrift på en meget anderledes kreativ proces, end måden vi skriver den på. Når vi taster, så har vi den næste sætning i hovedet, mens vi skriver den forrige. Når man "taler" skrift, er man meget fokuseret på den sætning, man skriver nu. Det giver et meget anderledes flow i det man skriver. Teksten bliver mere mekanisk og usammenhængende.

Man glemmer, at det kræver træning og tilpasning, ændringer i arbejdsgange, og måder at praktisere arbejdet på. De stresser brugerens stemmebånd. Og så er de bare irriterende at arbejde med!".

Per Richard Hansen mener derfor, at man med fordel bør fokusere på en mere snæver målgruppe for arbejdet med talegenkendelse:

"Talegenkendelse skal først og fremmest udvikles som en teknologi, der giver mennesker med begrænsninger, enten fysiske eller mentale, evnen til at kommunikere på skrift. Det vil fremme demokrati og generel lykke og velbefindende i samfundet".

Annonce