Bli allvarlig med humor: Kan AI förstå skämt?

Bli allvarlig med humor: Kan AI förstå skämt?

”Jag gillar mitt kaffe som mitt krig. Kall."

Ett par år efter att ett par forskare vid University of Washington skrev ett program som korrekt tillade "det är vad hon sa" i slutet av en mening 72% av tiden, bestämde forskare vid University of Edinburgh att ge det en chans . De utbildade en modell om stora mängder språkdata för att skapa skämt efter "Jag gillar min X som jag gillar min Y, Z" -struktur, producerar skämt som den ovan, eller den mycket mindre roliga "Jag gillar mina kvinnor som jag gillar min kamera ... redo att blinka. ”

Visst, det ser ut som ett skämt och låter som ett skämt, men många hävdar att det saknar den grundläggande delen när det gäller komedi - det är bara inte roligt.

Det visar sig att även om datorer är oändligt bättre än oss på många sätt, är de bara inte bra på att knäcka skämt. Men det har inte hindrat forskare från att bygga komedi-genererande algoritmer. Och trots hur roligt det måste vara att se en maskin kämpa för att komma med ett anständigt skämt, är anledningen till att så många akademiker och forskare utforskar den fascinerande världen av beräkningshumor inte helt nyckfull.

Utvecklare, forskare, produktchefer och akademiker arbetar alla för att göra interaktioner mellan människa och maskin lika naturliga och personliga som en konversation mellan två vänner, och för det behöver de ta itu med Natural Language Processing, lära datorer att bearbeta, analysera och replikera strukturer i vårt språk. Och det är ingen lätt uppgift. I själva verket, som en manual för matematisk lingvistik påpekar, "är dessa uppgifter så svåra att Turing med rätta kan göra flytande samtal på naturligt språk till mittpunkten för hans test för intelligens."

Även om du inte nödvändigtvis skulle säga det efter en rad “roligaste hemvideor” på Youtube, är humor en av de mest sofistikerade formerna av mänsklig intelligens - scatological och allt. Det beror delvis på att humoristiskt språk vanligtvis använder komplexa, tvetydiga och inkongruösa uttryck som kräver djup semantisk tolkning.

Och det är därför som forskning om djup modellering av humor saknas - det är för komplicerat, eller vad forskare kallar det, AI-komplett - en kategori reserverad för de svåraste AI-problemen, där det är lika svårt att lösa det specifika beräkningsproblemet som att lösa det centrala artificiella intelligensfråga.

Hitta skämtet

Vi har försökt att knäcka en formel som kan förklara humor i tusentals år, från Aristoteles till Freud, Kierkegaard till Monty Python. Den första humorteorin (eller snarare den första vi känner till) går tillbaka till antika Grekland. Känd som Superiority Theory, innebär det att humor kommer från andras olyckor. Även om det är en perfekt förklaring till varför vi slår en skratt när någon glider på trottoaren, förklarar det lite annat. Mycket senare, i början av 1900-talet, kommer Freud med Relief Theory. Han hävdar att humor är en frisättning av våra ackumulerade inre önskningar, att det händer när det medvetna tillåter uttryck för tankar som vanligtvis var förbjudna. Perfekt för smutsig, sarkastisk eller fientlig humor, men ändå faller inte alla skämt under denna kategori.

Sedan, på 70-talet, samlades lingvister bakom inkongruitetsteorin: idén av filosoferna Kant och Schopenhauer att vi skrattar åt brott mot våra förväntningar. Ett skämt är därför ett tvådelat företag - det kräver en uppsättning, skapande av förväntningar och en punch-line när den förväntningen är undergravad.

Denna teori var en av de första som Diyi Yang, biträdande professor vid School of Interactive Computing vid Georgia Tech, kom över. Tillbaka 2015, när hon var på Carnegie Mellon, brukade Yang undra över humor. Inte för att hon bryr sig mycket om skämt: "Jag är inte en humoristisk person, men jag gillar humor." Humor är en viktig del av att förstå mänsklig kommunikation. "Jag tror att om våra datorer kan förstå humor kan de bättre förstå den sanna innebörden av mänskligt språk", sa hon. "Om du tänker på alla dessa konversationsagenter som Google Assistant, Alexa eller Siri, om de hade en bättre förståelse för humor, skulle de kunna fatta bättre beslut för att förbättra användarupplevelsen."

Humor kan hjälpa henne att bygga intelligenta system som kan ge naturliga, empatiska interaktioner mellan människa och dator, så hon genomförde ett oberoende forskningsprojekt för att försöka skapa beräkningsmodeller för att upptäcka strukturerna bakom humor, känna igen det och till och med identifiera vilka ord som ger humor i en mening.

Yang dov djupt in i teorierna om humor och identifierade flera semantiska strukturer för var och en som hon kunde använda för att träna modellerna med. En av dem var teorin om inkongruitet - vilket förklarar varför vi tycker att bilder av apor som bär kostymer och affärsfall är lustiga, eller, för att citera en annan apa-tema quip: ”Varför föll apan ut ur trädet? Eftersom den var död. ”

Språkliga humorteorier

I sin forskning studerade Yang flera latenta strukturer bakom humor som inte bara finns i inkongruitetsteorin utan också i tre andra:

  • Tvetydighet. Humor och tvetydighet samlas ofta när en lyssnare förväntar sig en mening, men den tvingas använda en annan.

Hörde du om killen vars hela vänstra sida var avskuren? Han är okej nu.

  • Fonetisk stil. Vissa språkstudier visar att skämtets fonetiska egenskaper - alliteration, ordupprepning, rim - kan vara lika viktigt, om inte mer, än själva innehållet. Många one-liners har en viss komisk effekt även när skämtet inte nödvändigtvis är roligt. Till exempel:

När du har sett ett köpcentrum har du sett ett köpcentrum.

  • Interpersonell effekt - denna teori förklarar att humor i huvudsak är förknippad med känslor och subjektivitet, särskilt i sammanhang som är färdiga med fientlighet. Det är därför meningar som den nedan är roliga (ish), men du kan argumentera för att det knappast finns någon sofistikering där.

Din by ringde. De vill ha tillbaka sin idiot.

För att utföra automatisk igenkänning av humor och humor ankarextraktion - ord som “Knock, knock” som ger ledtrådar till en humoristisk interaktion - Yang behövde en datamängd med både humoristiska och icke-humoristiska exempel. "Det var inte lätt att undersöka", sa Yang. "Det var ett relativt undersökt ämne, vi tillbringade mycket tid på att skaffa data." Hon använde Dagens ordspel - den största samlingen av humoristiska ordlekar på internet - och datainsatsen för 16000 one-liner. Som kontrollgrupp använde hon rubriker från AP News, The New York Times, Yahoo! Svar och ordspråk.

För att identifiera ankarna - orden som skapade skämtet - analyserade Yang och hennes kollegor varje enfoder som uppfyllde kriterierna för en av de humoristiska strukturerna. Tänk på följande munkavle:

Jag är glad att jag kan teckenspråk; det är ganska praktiskt.

De mänskliga ankarna är inte orden som "vet" eller "am", och de är inte paren "vet" och "ganska praktiska". Snarare är det kombinationen av "teckenspråk" och "ganska praktiskt" som möjliggör skämtet - oavsett hur torr det är. Var och en av ankarkandidaterna tilldelas en förutsagd humorpoäng, som sedan beräknas av en klassificerare för humorigenkänning utbildad på alla datapunkter.

De ankarkandidater för humor som ger störst poäng returneras sedan som ankaruppsättning. Resultaten var lovande - de använde andra metoder för humorigenkänning, som Bag of Words, Language Model och Word2Vec, som baslinjer och uppnådde bättre resultat.

Men det finns fortfarande mycket arbete att göra. Speciellt eftersom humor inte bara handlar om orden.

Allt om T * I ​​* M * I * N * G *

Det finns ett gammalt skämt som går ungefär så här:

"Fråga mig hemligheten med god komedi."
"Vad är sek -"
"Timing!"

Vi har alla sett samma skämt landa vackert när vissa komiker säger det, bara för att falla platt när du slänger det i ett missriktat försök att vara rolig vid en familjesammankomst. Men som Rhodri Marsden en gång påpekade, "det beror på en kombination av rykte, fart, närvaro och timing." Av uppenbara skäl är träningsmodeller för att känna igen timing inte lika lätt som att be dem att upptäcka ett enkelt ”det är vad hon sa” i slutet av en given mening.

Men ändå finns det några intressanta studier om det. Amruta Purandare och Diane Litman från Intelligent Systems-programmet vid University of Pittsburgh har analyserat 2 timmars ljud, från totalt 75 scener från sex olika Friends-avsnitt, vilket markerar varje högtalarsväng som följs av ett skrattspår.

De undersökte vissa akustiska och språkliga särdrag, såsom tempo, tonhöjd, antal ord och hur ofta vissa ord upprepas. Deras analys bekräftade något vi har känt hela tiden - det finns signifikanta skillnader i de prosodiska egenskaperna hos humoristiskt och icke-humoristiskt tal, konsekvent mellan olika kön och talare. I roligare interaktioner tenderar högtalare att ha högre tempo, tonhöjd och energi, vilket överensstämmer med tidigare forskning som visar att dessa funktioner är associerade med positiva känslomässiga tillstånd som självsäker, vilket är mer sannolikt att visas i humoristisk kommunikation.

Det visade också att Chandler, inte förvånande, har de roligare interaktionerna på de 75 scenerna (22,8% av alla skämt är hans), och att skrattspår - vars popularitet tack och lov har minskat ända sedan 80- och 90-talet - är faktiskt bra för något.

Forskning inom beräkningshumor är fortfarande i ett mycket tidigt skede, men datorer verkar bli bättre och bättre på det. Det finns fortfarande en lång väg framåt, men lyckligtvis är den vägen asfalterad med dåliga ordlekar och ostliknande one-liners. Och medan juryn fortfarande är ute efter om ”jag gillar mitt kaffe som jag gillar mitt krig. Kall." är roligt eller inte, jag tycker det är roligt. Jag är en kvinna med enkel smak. Om det ser ut som ett skämt och låter som ett skämt är det förmodligen ett.

Du kan också vara intresserad av