AI kan fjerne gøende hunde og skrigende børn fra videosamtaler

Google og Microsoft er på vej med imponerende automatiske funktioner, der skal fjerne baggrundsstøj fra videosamtaler.

Med den nuværende verdenssituation er videosamtaler blevet et fænomen, noget som mange er begyndt at bruge hver dag for at kommunikere. Det er ikke det samme som at se en person ansigt til ansigt, men det er trods alt bedre end en telefonsamtale, hvor man kun hører den anden, især hvis man er flere end to, der skal tale sammen.

For mange er videosamtaler ikke længere noget nyt, som det måske var tilfældet for nogle måneder siden. Derfor er vi også begyndt at bemærke alle de irriterende småting ved dem.

For et par måneder var det lidt charmerende, at man kunne høre et barn skrige i baggrunden, når man talte med chefen via video. Så var det sådan lidt hø-hø. Sådan er det ikke længere. Vi gider heller ikke høre en, der sidder og gnasker kiks midt i mødet uden at mute sin mikrofon.

Microsoft og Google klar med AI der fjerner baggrundsstøj under videosamtaler

Heldigvis kommer nu Google og Microsoft for at hjælpe os med AI-funktioner, der skal fjerne irriterende baggrundslyde under videosamtaler.

Google er allerede begyndt at rulle deres støjreduceringsfunktion ud til visse G Suite-erhvervskunder. Det er planen at få den ud til endnu flere kunder i løbet af de kommende måneder.

Google gav i sidste uge Venture Beat en demo-version af støjreduceringen, som de er ved at rulle ud. Det ser imponerende ud. Det er director of product management for G Suite, Serge Lachapella, der leder demonstrationen. Han gennemgår en række forskellige lyde, deriblandt klappende hænder, en pose der krølles sammen og en metalnøgle mod et glas.

Når støjreduceringen slås til, bliver hans stemme dæmpet en smule til at begynde med, men så vender den tilbage til normalen. Derimod forsvinder de irriterende lyde næsten helt.

Se også: Guide til Microsoft Teams

Støjreduceringen foregår i skyen

Lachapella bruger en Blue Yeti-mikrofon, der er ret almindelig at bruge til podcasts og streaming, men det er faktisk ikke hardwaren, der står for trickene. Det er i stedet en skybaseret AI-algoritme, der analyserer lyden og fjerner anstrengende forstyrrelser, men slipper talen igennem.

Det gør det anderledes end det, vi normalt forbinder med ordet støjreducering, når det gælder høretelefoner. Med høretelefonerne skabes der lydbølger, der fysisk reducerer støj, mens det prøver at finde vej til dine ører. Google og andre selskaber, der forsøger sig med det samme, har en bot, der analyserer lyden og fjerne støj fra signalet, inden den transmitterer den til høretelefoner eller højtalere.

Det er ikke noget nyt for Google med genkendelse af tale. Google Assistant har lyttet med og genkendt ord og tale i flere år. Sidste år kom deres overraskende præcise Transcription-funktion, der kan gengive samtaler i tekst og det i realtid. Den teknologi er nu udviklet ved hjælp af den nye AI.

Støjreduceringen foregår som nævnt i skyen og ikke på brugerens egen enhed, så det er ikke noget, der belaster processoren yderligere.

Se også: Brug Skype til videosamtaler uden en konto

Funktionen bliver standard – kan slås fra og til

Funktionen kommer til at ligge som standard, når den ruller ud. Man kommer helt enkelt til at opleve, at baggrundslydene helt pludselig er væk.

Hvis man gerne vil have baggrunden med, kan man gå ind og slå funktionen fra i indstillingerne. Hvis man nu ringer til farmor og gerne vil have fuglene fra haven med som hyggebaggrund. Eller hvis man skal synge, for så forsvinder musikken formentlig.

Se også: Dataforbrug eksploderede under corona-krisen

Microsoft også på vej med støjreducering under samtaler

Det er ikke kun Google, der arbejder med det her område. I april demonstrerede Microsoft en lignende teknologi til Teams’ videosamtale. Den bruger et lignende koncept, hvor den analyserer lyden og filtrerer alt det væk, der ikke lyder som tale.

Også den funktion forventes at rulle ud i løbet af de kommende måneder.

Som det altid er tilfældet med AI, forventer både Google og Microsoft, at deres systemer med tiden bliver bedre på at genkende den uønskede støj. Med mere data og tid til at lære, hvad det er, der skal filtreres væk og hvad der skal blive, bliver AI’en og funktionen bedre og mere effektiv.

Se også: Nyheder om videosamtaler