
Talegenkendelse er stadig en tvivlsom succes i de danske kommuner. Foto: iStock
Danske kommuner fortsætter med at implementere talegenkendelse på trods af de udfordringer, der påvirker både medarbejdere og borgere og skaber bekymringer i forbindelse med valg af software.
Talegenkendelse er stadig en tvivlsom succes i de danske kommuner. Foto: iStock
Silja Vase studerer på kandidaten Digital Innovation og Ledelse, der udbydes af IT Universitetet i København, hvor hun underviser i datavisualisering og etnografi. Silja er junior forsker i det digitalt-etnografiske ETHOS Lab og forsker nu i menneskers brug af talegenkendelse i det offentlige.
Kontakt og følg Silja Vase
Talegenkendelse: Hvis man spørger de danske kommuner, hvorfor de indfører teknisk software, der er så ny – i hvert fald i offentlige organisationer – får man ofte svaret: "Fordi vi er en moderne kommune." Det efterlader spørgsmålet om, hvad "moderne" dækker over, og hvor rationel beslutningsprocessen for implementering af software er.
Digitaliseringsstyrelsen mener, at de danske kommuner er "first movers", når det handler om brug af talegenkendelse (SRT).
Derfor kan man forstå "moderne" som noget "nyt" og måske ikke altid som pragmatisk eller i det mindste kombineret med brug af fuldt udviklet teknologi.
For at forstå first mover-implementeringen af teknologi og beslutningsprocessen bag dette bruger vi talegenkendelse som eksempel til at se nærmere på processen i en dansk kommune, som har startet et pilotprojekt op i efteråret 2016, hvor talegenkendelse indgår som en del af det daglige workflow.
I 2016 beviste Stanford University, at talegenkendelse er op til tre gange hurtigere end indtastning, og derfor giver det mening for kommunen at købe softwaren, så man kan spare tid på administration.
Som juniorforskere i ETHOS Lab på IT-Universitetet i København forventes det, at vi allerede har grundlæggende viden om organisatoriske forandringer i forbindelse med talegenkendelse eller lignende software.
Desværre er det ikke tilfældet, og derfor er dette projekt motiveret af denne begrænsede viden. Formålet er at kunne bidrage med resultater, der kan føre til en mere evidensbaseret implementering af talegenkendelse i fremtiden. Vi fokuserer på, hvad der identificerer og kendetegner de sociale og teknologiske udfordringer, der opstår ved implementering af talekendelse i en dansk kommune.
Så ... talegenkendelse, hvordan virker det?
Vi spurgte to mentorer (de medarbejdere, der mødes med borgerne og skriver rapporter om udviklingen i deres sag ved hjælp af talegenkendelse), hvordan talegenkendelse har påvirket deres daglige arbejdsgang, og vi bad dem demonstrere, hvordan de bruger teknologien.
Mirsk (firmaet bag talegenkendelsessoftwaren) angiver, at softwaren fungerer efter hensigten, men det er svært at definere, hvad "hensigten" er, når man konstaterer, at talegenkendelse udfordrer den daglige arbejdsgang efter mentorernes opfattelse.
Det viser sig, at graden af tilfredshed er lav, fordi talegenkendelsessoftwaren betyder, at der skal bruges ekstra tid på at udarbejde rapporter i forhold til at skrive, og at dette fjerner værdifuld tid fra borgerne i stedet for at frigive tid fra papirarbejde.
Da begrundelsen for implementeringen var at reducere tidsforbruget til dokumentation, skaber dette frustration blandt mentorerne i kommunen.
Ifølge ledelsen i CFSE (Center for Familie, Social og Beskæftigelse) kan der være flere grunde til denne uheldige start på pilotprojektet, fx kvaliteten af forbindelsen og mentorernes færdigheder i at diktere tydeligt. Mentorerne fik dog ikke tilstrækkelig tid til at lære at udnytte talegenkendelsen optimalt, hvilket skabte frustration blandt medarbejderne og betød, at de enten brugte ekstra tid eller simpelthen opgav at bruge softwaren, fordi de ikke kunne se formålet.
Det er meget vigtigt, at rapporterne er præcise, da de danner grundlag for borgernes status og fremtid. Det konkluderes, at den nuværende brug af talegenkendelse mindsker rigtigheden af rapporterne, og at det skaber negative konsekvenser for den pleje, der gives. Der er i CFSE mange mentorer, som er begejstrede for muligheden for at mindske tidsforbruget til dokumentation og i stedet bruge denne dyrebare tid på borgerne.
Gennem vores undersøgelse har vi konstateret, at der mangler den fælles forståelse, som skabes via interaktion.
Det skyldes, at mentorerne har nedprioriteret softwaren. Desuden er medarbejderne ikke sikre på de specifikke mål med talegenkendelsen, og de frygter, at den nedsatte dokumentationstid vil betyde færre ansatte.
Fælles forståelse
Brug af talegenkendelse giver et samspil mellem menneske og maskine, der forudsætter, at begge forstår målet eller deler samme intention for at få et produkt i en kvalitet, der er høj nok til, at man kan stole på den.
Professor Lucy A. Suchman forklarer kommunikationen mellem menneske og maskine som handlinger, der afhænger af sociale og fysiske forhold, og hævder, at situationen er afgørende for forståelsen af disse handlinger. Fortolkningen af kommunikationen mellem menneske og maskine afgør alle faktorer, der påvirker forventningerne og har indflydelse på forståelsen af det fælles udgangspunkt. I vores eksempel med kommunen er forståelsen yderligere påvirket, fordi mentorerne er forpligtet til at tage del i processen med at forbedre softwaren ved at rapportere fejl, uden at de bliver informeret om de forskellige faser, som processen har.
Et eksempel er, at det kræver en vis mængde af fejl, før fejlene rettes i systemet. Mens fejlene opsamles, sker der ingen ændring med hensyn til forbedring af systemet. Manglen på indsigt i denne fase og eksterne tekniske påvirkninger betød, at mentorerne oplevede de samme fejl gentagne gange, hvilket skabte modstand mod brug af talegenkendelse.
Ifølge professor Marc Berg er processen med implementering af it i offentlige organisationer kompleks, og der er brug for en fælles forståelse hos alle involverede parter. Da CFSE har en udfordring med at få softwaren til at virke efter hensigten og er uklare, når det gælder den fælles retning og de fælles mål for brugen, bliver det vanskeligt at gennemføre pilotprojektet, og projektet er desværre ikke som lovet i stand til at sænke det nødvendige antal timer til udarbejdelse af journaler og rapporter med en time om ugen.
Når tiden er inde
Da analysen viser, at nøjagtigheden er udfordret, anvendes forskellige succeskriterier og handlinger. Det kan være, at softwaren er fuldt udviklet, men at den bliver udfordret på grund af de specifikke faglige forhold i kommunen, og at dette modvirker en vellykket brug af talegenkendelse.
Udfordringerne i forbindelse med den tid, som bliver betragtet som pleje, samt sammenhængen mellem tid og nøjagtighed, og dermed også nøjagtighed og pleje, er et vedvarende problem, der kører i ring. Dette er muligvis årsagen til kommunens beslutning om at relancere softwaren, et par måneder efter at pilotprojektet blev indledt, og denne undersøgelse blev udført. Måske var kommunen for ivrig efter at være "moderne".
PA Consulting Group påpeger, at næsten en tredjedel af de danske kommuner har erfaring med talegenkendelse, og det estimeres, at der ligger et stort potentiale i, at mentorerne ændrer deres arbejdsgang til at besøge borgere i deres private hjem. Ved at lade talegenkendelse indgå i den daglige arbejdsgang hos de sociale enheder i den offentlige sektor kan det blive en teknologisk ramme, der sparer tid og ressourcer.
Det mest interessante aspekt er, at hvis talegenkendelse blev vellykket implementeret, kunne softwaren bruges af mentorerne i interaktion med borgerne, uden at det ville påvirke deres nuværende arbejdsrutiner. Hvis mentorerne arbejdede med softwaren sammen med borgerne, kunne det muligvis skabe en bedre forståelse af det sprog, der bruges i borgerrapporterne, og softwaren kunne fungere som et middel til at skabe en ny forbindelse mellem borgerne og det offentlige.
Læs mere om talegenkendelse i danske kommuner
Referencer: