

Christer Berg Vi står inför ett större lyft för användargränssnitten till alla våra digitala prylar. Det är utvecklingen av hårdvaran som gör programvara baserad på AI möjlig.
Taligenkänning och talsyntes har funnits en längre tid. Sedan något år tillbaka finns också tolkning av gester och ögonrörelser i lanserade produkter.
Nästa nivå för systemen är att förstå vad de ser och hör. Israeliska Nemesysco har tagit fram en programvara som analyserar om den som talar ljuger eller talar sanning. Programvaran används av bland andra brittiska motsvarigheten till Försäkringskassan.
IBM har byggt en dator som sopar mattan med mästare i Jeopardy. Genom adaptiv inlärning har Watson, som datorn kallas, lärt sig förstå dubbeltydningar och antydningar mellan raderna i kluriga Jeopardy-frågor.
Brittiska Realeyes säljer en programvara som via en webcam kan tolka en persons känslotillstånd.
När maskinerna börjar bete sig och tänka som människor förändras människornas förväntningar på tekniken.
Som vanligt har Apple brutit ny mark, nu med lanseringen av Siri på Iphone 4S.
"Whats the weather in London tomorrow?" frågar en tjej sin lilla mobil i en bullrig gatumiljö. "The weather in London will be partly clouded in the morning and sunny in the afternoon", svarar mobilen inom cirka en sekund.
Efter lanseringen av Siri vill alla ha taligenkänning. Obekräftade rykten säger att över 25 procent av mobila sök i USA idag är röststyrda. Det är information som de som köper sökordsannonser inte vill höra.
Google räds dock inte förändringens vindar och tänker attackera Apple lika aggressivt som vanligt. Googles kommande teknik för taligenkänning, med kodnamnet Majel, är en direkt konkurrent till Apples Siri.
Enligt Eric Schmidt blir Majels teknik den bästa på marknaden. Google siktar på tillämpningar som går längre än tolkning, styrning och svar på enkla sökfrågor. Liknande IBM:s Watson ska tillämpningar baserade på Majel kunna förstå användarnas intensioner utifrån de sammanhang de befinner sig i.
En annan tillverkare som hakat på är Samsung. På CES presenterade de en röst- och geststyrd tv. Äntligen blir vi av med den hatade fjärrkontrollen.
Vinnarna när gränssnitten blir mer mänskliga är utan tvekan människorna.
När du ringer Skatteverkets upplysning för folkbokföring efter 6 februari, svarar ett smart program – en talande virtuell assistent. Det är slut med röststyrning där du på uppmaning fånigt säger enstaka ord för att komma vidare i ett ämnesträd.
Med Skatteverkets virtuella telefonist pratar du som om den vore en människa. I första versionen tolkas svaret och du blir kopplad till rätt handläggare. I nästa version blir den mer som en assistent.
Om du till exempel säger att du vill ha ett personbevis för att beställa ett nytt pass, svarar assistenten att det inte längre behövs personbevis för detta, det räcker med giltig legitimation.
"Vi gör det här för att underlätta för medborgarna", säger Henrik Konkel som är ansvarig för Skatteupplysningen. Skatteverket tar emot över fem miljoner samtal varje år. Genom att bättre kunna tolka vad användaren vill, blir fördelningen av samtalen till rätt handläggare effektivare.
Henrik Konkel framhåller att det inte finns några planer på att analysera rösterna djupare. Han avvisar bestämt idéer av typen lögndetektering eller identifiering (används redan av myndigheter i andra länder för att säkerställa att personen är den han eller hon uppger sig för att vara).
Systemet på Skatteverket kallas Fritt tal och tekniken levereras av Voice Provider. Sedan över ett år tillbaka används Fritt tal på Kronofogden.
Det här är bara en staplande början. Samtal med virtuella tjänster kommer att bli vardag.
När maskiner uppträder som människor kommer etiska frågor upp på bordet. Ska den som ringer Skatteverket eller Kronofogden informeras om att det är en virtuell telefonist som svarar?
Förlorarna när gränssnitten blir mänskligare är förstås de som är beroende av till exempel skärmbaserade gränssnitt för sina affärsmodeller. Det handlar i första hand om reklam.
Vissa kan få svårt att transformera sig i takt med marknaden. Långt ifrån alla affärsmodeller som bygger på försäljning av "eye-balls" kan gå över till att sälja "ear-drums" – om det ens går att sälja reklam med talsyntes.
De nya användargränssnitten förändrar förutsättningarna för många aktörer. Klarar din affärsmodell kunder som vill prata istället för att titta och läsa?
Christer Berg är marknadsekonom och har bevakat it-branschen som trendspanare och omvärldsanalytiker sedan 1990. Idag är Christer ansvarig utgivare för nyhetstjänsterna Trendspaning.se från Dataföreningen Kompetens och DF Redaktionellt från Dataföreningen.

Har du tänkt att börja med yoga? Vi har allt du behöver för att komma igång!