Kan talegenkendelse mon bidrage til kommuners arbejde?

Danske kommuner fortsætter med at implementere talegenkendelse på trods af de udfordringer, der påvirker både medarbejdere og borgere og skaber bekymringer i forhold til valg af software.

Talegenkendelse

Talegenkendelse er stadig en tvivlsom succes i danske kommuner. Foto: iStock

Talegenkendelse: Hvis man spørger de danske kommuner, hvorfor de indfører teknisk software, der er så ny – i hvert fald i offentlige organisationer – får man ofte svaret: ”Fordi vi er en moderne kommune.” Hvilket efterlader spørgsmålet om, hvad ”moderne” dækker over, og hvor rationel beslutningsprocessen for implementering af software er.

Digitaliseringsstyrelsen mener, at de danske kommuner er ”first movers” i forhold til brug af talegenkendelse (SRT).

Derfor kan man forstå ”moderne” som noget ”nyt”, og måske ikke altid som pragmatisk eller i det mindste kombineret med brug af fuldt udviklet teknologi.

For at forstå first mover-implementeringen af teknologi og beslutningsprocessen bag dette, bruger vi talegenkendelse som eksempel til at se nærmere på processen i en dansk kommune, som har startet et pilotprojekt op i efteråret 2016, hvor talegenkendelse indgår som en del af det daglige workflow.

I 2016 beviste Stanford University, at talegenkendelse er op til 3 gange hurtigere end indtastning, og derfor giver det mening for kommunen at købe softwaren, så de kan spare deres tidsforbrug på administration.

Som juniorforskere i ETHOS Lab på IT-Universitetet i København forventes det, at vi allerede har grundlæggende viden om organisatoriske forandringer i forhold til talegenkendelse eller lignende software.

Desværre er det ikke tilfældet, og derfor er dette projekt motiveret af den begrænsede viden, og formålet er at kunne bidrage med resultater, der kan føre til en mere evidensbaseret implementering af talegenkendelse i fremtiden. Vi fokuserer på, hvad der identificerer og kendetegner de sociale og teknologiske udfordringer, der opstår ved implementering af talekendelse i en dansk kommune.

Talegenkendelse

Så... talegenkendelse, hvordan virker det?
Vi spurgte to mentorer (de medarbejdere, der mødes med borgerne og skriver rapporter om udviklingen i deres sag ved hjælp af talegenkendelse), hvordan talegenkendelse har påvirket deres daglige arbejdsgang, og vi bad dem demonstrere, hvordan de bruger teknologien.

Mirsk (firmaet bag talegenkendelses-softwaren) angiver, at softwaren fungerer efter hensigten, men det er svært at definere, hvad ”hensigten” er, når man indser, at talegenkendelse udfordrer den daglige arbejdsgang efter mentorernes opfattelse.

Det viser sig, at graden af tilfredshed er lav, fordi talegenkendelses-softwaren betyder, at der skal bruges ekstra tid på at udarbejde rapporter i forhold til at skrive, og at dette fjerner værdifuld tid fra borgerne, i stedet for at frigive tid fra papirarbejde.

Da begrundelsen for implementeringen var at reducere tidsforbruget på dokumentation, skaber dette frustration blandt mentorerne i kommunen.

Ifølge ledelsen i CFSE (Center for Familie, Social og Beskæftigelse) kan der være flere grunde til denne uheldige start på pilotprojektet, som fx kvaliteten af forbindelsen og mentorernes færdigheder i at diktere tydeligt. Mentorerne fik dog ikke tilstrækkelig tid til at lære en optimal udnyttelse af talegenkendelsen, hvilket skabte frustration blandt medarbejderne og betød, at de enten brugte ekstra tid eller simpelthen gav op i forhold til softwaren, fordi de ikke kunne se formålet.

Det er meget vigtigt, at rapporterne er præcise, da de danner grundlag for borgernes status og fremtid. Det konkluderes, at den nuværende brug af talegenkendelse mindsker rigtigheden af rapporterne, og at det skaber negative konsekvenser for den pleje, der gives. Der er i CFSE mange mentorer, der er begejstrede for muligheden for at formindske tidsforbruget på dokumentation og i stedet bruge denne dyrebare tid på borgerne.

Gennem vores undersøgelse har vi konstateret, at der mangler den fælles forståelse, som skabes via interaktion.

Det skyldes, at mentorerne har nedprioriteret softwaren. Desuden er medarbejderne ikke sikre på de specifikke mål med talegenkendelse, og de frygter, at den nedsatte dokumentationstid vil betyde færre ansatte.

Fælles forståelse
Brug af talegenkendelse giver et samspil mellem menneske og maskine, der forudsætter, at begge forstår målet eller deler intention for at få et produkt i en kvalitet, der er høj nok til, at man kan stole på den.

Professor Lucy A. Suchman forklarer kommunikationen mellem menneske og maskine som handlinger, der afhænger af sociale og fysiske forhold, og at situationen er afgørende for forståelsen af disse handlinger. Fortolkningen af kommunikationen mellem menneske og maskine afgør alle faktorer, der påvirker forventningerne og har indflydelse på forståelsen af fælles udgangspunkt. I vores eksempel med kommunen, er forståelsen yderligere påvirket, fordi mentorerne er forpligtet til at tage en del i processen med at forbedre softwaren ved at rapportere fejl, uden at de bliver informeret om de forskellige faser, som processen har.

Et eksempel er, at det kræver en vis mængde af fejl, før fejlene rettes i systemet. Mens fejlene opsamles, sker der ingen ændring med hensyn til forbedring af systemet. Manglen på indsigt i denne fase og eksterne tekniske påvirkninger betød, at mentorerne oplevede de samme fejl gentagne gange, hvilket skabte modstand mod brug af talegenkendelse.

Ifølge professor Marc Berg er processen med implementering af it i offentlige organisationer kompleks, og der er brug for en fælles forståelse fra alle involverede parter. Da CFSE har en udfordring med at få softwaren til at virke efter hensigten og er uklare om fælles retning og mål for brugen, bliver pilotprojektet udfordret i forhold til at få en vellykket gennemførelse, og det er desværre ikke som lovet i stand til at sænke det nødvendige antal timer til udarbejdelse af journaler og rapporter med en time om ugen.

Når tiden er inde
Da analysen viser, at nøjagtigheden er udfordret, anvendes forskellige succeskriterier og handlinger. Det kan være, at softwaren er fuldt udviklet, men at den bliver udfordret på grund af de specifikke faglige forhold i kommunen, og at dette modvirker en vellykket brug af talegenkendelse.

Udfordringerne, der er i forhold til tid, som bliver betragtet som pleje, samt sammenhængen mellem tid og nøjagtighed, og dermed også nøjagtighed og pleje, er et vedvarende problem, der kører i ring. Dette er muligvis årsagen til kommunens beslutning om at relancere softwaren et par måneder efter, at pilotprojektet blev indledt, og denne undersøgelse udført. Måske var kommunen for ivrig efter at være ”moderne”.

PA Consulting Group påpeger, at næsten en tredjedel af de danske kommuner har erfaring med talegenkendelse, og det estimeres, at der et stort potentiale i, at mentorer ændrer deres arbejdsgang til at besøge borgere i deres private hjem. Ved at lade talegenkendelse indgå i den daglige arbejdsgang hos de sociale enheder i den offentlige sektor kan det blive en teknologisk ramme, der sparer tid og ressourcer.

Den mest interessante aspekt er, at hvis talegenkendelse blev vellykket implementeret, kunne softwaren bruges af mentorerne i interaktion med borgerne uden at påvirke deres nuværende arbejdsrutiner. Hvis mentorerne arbejder med softwaren sammen med borgerne, kunne det muligvis skabe en bedre forståelse for det sprog, der bruges i borger-rapporterne, og softwaren kunne fungere som et middel til at skabe en ny forbindelse mellem borgerne og det offentlige.

Læs mere om talegenkendelse i danske kommuner

Referencer: 

  • Berg, Marc (2003) Health Information Management - Integrating information technology in healthcare work. London.
  • MIRSK (2016) Talegenkendelse – Brug, Introduktion til MIRSK Talegenkendelse Version 0.2, Slutbruger træning.
  • Suchman, Lucy A. (2007) Human-Machine Reconfigurations, Plans, and Situated Actions, Cambridge university press, UK, 2nd Edition.
  • PA Consulting Group (2014) Digitaliseringsstyrelsen - Forudsætninger og barrierer for effektiv anvendelse af talegenkendelse i kommunerne.