Forsøg: AI er langt bedre til mundaflæsning end mennesker
Nye studier viser, at maskiner med kunstig intelligens, AI, er ekstremt gode til at forstå, hvad mennesker siger, selvom de ikke kan høre det – de kan nemlig mundaflæse langt bedre end mennesker.
AI er langt bedre til mundaflæsning end mennesker
Mundaflæsning er ekstremt svært, da meget afhænger af kontekst og viden om sprog og visuelle tegn. Men maskiner med AI er åbenbart ekstremt gode til at gennemskue, hvad der bliver sagt, selvom de ikke kan høre det.
Forskere på afdelingen for computervidenskab på Oxford Universitet har udviklet et nyt kunstig intelligens-system ved navn LipNet, der tilegner sig viden om mundaflæsning gennem en masse øvelser med 3-sekunders sætninger. Den data har forskerne så brugt til at træne et neuralt netværk til at kunne mundaflæse og det gør det så godt, at det fik 93,4 procent af ordene korrekt – i samme øvelse udført at mennesker var succesraten kun 52,3 procent.
Andre forskere på samme universitet, men fra afdelingen for ingeniørforskning, har også eksperimenteret med mundaflæsning men i en langt sværere kontekst. Disse forskere har arbejdet med Googles DeepMind og sat den på en hårdere prøve, hvor den skulle mundaflæse videoklip fra BBC, hvor der var langt større variation i sprog, lys og placering af ansigtet.
Den kunstige intelligens kunne i dette tilfælde vise en succesrate på 46,8 procent, mens de personer, der deltog, opnåede en succesrate på 12,4 procent.
Muligheder og udfordringer med AI til mundaflæsning
I begge meget forskellige eksperimenter står det klart, at den kunstige intelligens, AI, var mennesket klart overlegen og der ses allerede muligheder for brugen af dette til videosamtaler i meget støjende miljøer, hvor den kunstige intelligens vil kunne tage over og sige, hvad der bliver sagt, hvis der er så meget støj, at man ikke selv kan høre det.
Der kan dog også være udfordringer med overvågning og privacy og der kan være bekymring for, hvordan myndigheder vil kunne bruge denne type kunstig intelligens til at opsnappe detaljer fra folk i grupperinger og demonstrationer.