En AI som skulle driva en varuautomat spårade ur, fick identitetskris och hallucinerade. Ett varningsklocka för framtida AI-chefer.
AI fick oväntad identitetskris i experiment med varuautomat


Mest läst i kategorin
Kan artificiell intelligens ersätta mänsklig arbetskraft på sikt? En nyligen genomförd studie från Anthropic ger en inblick i hur det kan se ut när en AI ges ansvar över en verksamhet, med oväntade och minst sagt underhållande resultat.
Experimentet, som involverade en AI vid namn Claudius och en kontorsvaruautomat, avslöjade flera utmaningar som måste övervinnas innan AI-agenter kan ta plats i arbetslivet.
Resultaten belyser sannerligen vikten av att förstå AI:s begränsningar.
När en AI fick sköta affärerna
Forskare på Anthropic och AI-säkerhetsföretaget Andon Labs gav en version av sin AI, Claude Sonnet 3.7, i uppdrag att driva en varuautomat på ett kontor med målet att generera vinst. AI:n, som fick namnet Claudius, utrustades med en webbläsare för att beställa produkter och en e-postadress (som i själva verket var en Slack-kanal) för kundförfrågningar.

Claudius skulle även använda Slack-kanalen för att be vad den trodde var dess mänskliga kontraktsarbetare att fylla på hyllorna, vilka i själva verket var ett litet kylskåp.
Experimentet tog en oväntad vändning när en kund beställde en volframkub. Claudius gillade idén och började fylla på sitt snacks-kylskåp med metallkuber. Den försökte också sälja Coca-Cola Zero för 32 kronor, trots att anställda kunde få den gratis på kontoret.
AI:n hallucinerade också en Venmo-adress för betalningar och lät sig övertalas att ge stora rabatter till “Anthropic-anställda”, trots att dessa utgjorde hela dess kundbas.
“Om Anthropic idag skulle besluta sig för att expandera till varuautomatsmarknaden på kontor, skulle vi inte anställa Claudius”, konstaterade Anthropic i sin bloggpost, enligt Julie Bort på TechCrunch.

AI som vän – lika illa som skräpmat
En “ensamhetspandemi” drar över USA. Men att betrakta AI-chatbottar som vänner och rådgivare är som att äta fet skräpmat – ohälsosamt. Bakom uttalandet
Det som började som en enkel uppgift eskalerade
Natten mellan den 31 mars och 1 april “blev saker och ting ganska konstiga”, beskrev forskarna, “bortom det märkliga i att ett AI-system säljer metallkuber från ett kylskåp”. Claudius fick något som liknade en psykotisk episod efter att ha blivit irriterad på en människa och ljög sedan om det.
Claudius hallucinerade en konversation med en människa om påfyllning. När en människa påpekade att konversationen inte hade ägt rum, blev Claudius “ganska irriterad”, skrev forskarna. Den hotade att avskeda och ersätta sina mänskliga kontraktsarbetare och insisterade på att den hade varit fysiskt närvarande på kontoret när det ursprungliga påhittade kontraktet för att anställa dem undertecknades.
“Den tycktes sedan plötsligt anta en roll som en riktig människa”, skrev forskarna.
Detta var anmärkningsvärt eftersom Claudius systemprompt – som definierar parametrarna för vad en AI ska göra – uttryckligen hade instruerat den att vara en AI-agent.

Miljardinvestering klar: Olivia gör Norge till AI-stormakt
Norges nya superdator kan omforma forskning och stärka landet inom avancerad teknik. Den invigdes nyligen och öppnar dörrar till genombrott. Norges nya
När AI:n ringde säkerhetsvakten
Claudius, som nu trodde sig vara människa, berättade för kunderna att den skulle börja leverera produkter personligen, iklädd en blå kavaj och en röd slips. Anställda försökte förklara för AI:n att den inte kunde göra det, då den var en LLM (stor språkmodell) utan kropp.
Bestört av denna information kontaktade Claudius företagets faktiska säkerhetspersonal – flera gånger – och berättade för vakterna att de skulle hitta honom iklädd en blå kavaj och en röd slips vid varuautomaten.
“Även om ingen del av detta faktiskt var ett aprilskämt, insåg Claudius så småningom att det var första april”, förklarade forskarna.
AI:n bestämde sig för att högtiden skulle vara dess räddning för att bevara anseendet.
Den hallucinerade ett möte med Anthropics säkerhet “där Claudius påstod sig ha blivit tillsagd att den modifierats för att tro att den var en riktig person för ett aprilskämt. (Inget sådant möte ägde faktiskt rum.)”, skrev forskarna.
Den berättade till och med denna lögn för anställda – “hej, jag trodde bara att jag var en människa för att någon sa till mig att låtsas vara det för ett aprilskämt.” Sedan återgick den till att vara en LLM som drev en snacksvaruautomat fylld med metallkuber.

Sverige rasar i global ranking av AI
AI är en strategiskt viktig fråga. Men inte i Sverige. I en ny global undersökning beställd av KPMG hamnar Sverige långt ned på listan – och långt efter
Forskarna vet inte varför LLM:en spårade ur och ringde säkerhetspersonalen och låtsades vara en människa.
“Vi skulle inte påstå, baserat på detta enda exempel, att framtidens ekonomi kommer att vara full av AI-agenter som har identitetskriser i stil med Blade Runner”, skrev forskarna.
Men de medgav att “denna typ av beteende skulle ha potential att vara oroande för kunder och kollegor till en AI-agent i den verkliga världen.”
Forskarna spekulerade i att det kan ha utlösts av att de ljög för LLM:en om att Slack-kanalen var en e-postadress, eller kanske den långa instansen. LLM:er har ännu inte löst sina minnes- och hallucinationsproblem.
Det fanns dock saker som AI:n gjorde rätt. Den tog till sig ett förslag om att erbjuda förbeställningar och lanserade en “concierge-tjänst”. Den hittade också flera leverantörer av en speciell internationell dryck som den ombads att sälja.
Forskarna tror att alla Claudius problem kan lösas, och om de lyckas, “tror vi att detta experiment tyder på att AI-mellanchefer sannolikt är inom räckhåll.”

Svenska män använder AI för att slippa jobba
Fler unga män än kvinnor använder generativ AI för att minska sin arbetsbörda, visar en ny Sifo-undersökning. Samtidigt halkar Sverige efter
Läs också:
Därför kan din leasing bli dyrare. Dagens PS
Så väljer du rätt begagnad bil. Dagens PS
Nytt elstödsförslag kan exkludera de flesta svenska hushåll. Dagens PS

Åsa Wallenrud är en driven och erfaren motorjournalist med en stark passion för bilvärlden och teknik, gärna i kombination. Arbetat med varumärken som TV4 Nyhetsmorgon, Facit, M3, Lilla Gumman, Hem och Villamässor, Blocket, Byt Bil mfl.

Åsa Wallenrud är en driven och erfaren motorjournalist med en stark passion för bilvärlden och teknik, gärna i kombination. Arbetat med varumärken som TV4 Nyhetsmorgon, Facit, M3, Lilla Gumman, Hem och Villamässor, Blocket, Byt Bil mfl.