vi går in i åldern för artificiell intelligens. Och eftersom AI-program blir bättre och bättre på att agera som människor, kommer vi alltmer att ställas inför frågan om det verkligen finns något som är speciellt med vår egen intelligens, eller om vi bara är maskiner av ett annat slag. Kan allt vi vet och göra en dag reproduceras av ett komplicerat nog datorprogram installerat i en komplicerad nog robot?,

1950 gjorde computer pioneer och wartime codebreaker Alan Turing ett av de mest inflytelserika försöken att ta itu med denna fråga. I ett landmärkespapper föreslog han att vagheten kunde tas ur frågan om mänsklig och maskinintelligens med ett enkelt test. Detta ”Turing Test” bedömer en dators förmåga att efterlikna en människa, som bedöms av en annan människa som inte kunde se maskinen men kunde ställa den skriftliga frågor.

under de senaste åren har flera bitar av AI-programvara beskrivits som att ha slagit Turing-testet., Detta har lett till att vissa hävdar att testet är för lätt att vara en användbar domare av artificiell intelligens. Men jag skulle hävda att Turing-testet faktiskt inte har godkänts alls. Faktum är att det inte kommer att passera inom överskådlig framtid. Men om en dag ett korrekt utformat Turingtest passerar, kommer det att ge oss anledning att oroa oss för vår unika status.

Turingtestet är verkligen ett test av språklig flyt. Korrekt förstådd, det kan avslöja det som är förmodligen mest utmärkande för människor: våra olika kulturer., Dessa ger upphov till enorma variationer i tro och beteende som inte ses bland djur eller de flesta maskiner. Och det faktum att vi kan programmera denna typ av variation i datorer är det som ger dem möjlighet att efterlikna mänskliga förmågor. I att döma flytande mimicry låter Turing-testet oss leta efter datorernas förmåga att dela i mänsklig kultur genom att visa sin förståelse av språk i ett socialt sammanhang.

Turing baserade sitt test på ”imitation game”, ett partispel där en man låtsades vara en kvinna och en domare försökte gissa vem som var Vem genom att ställa de dolda spelarnas frågor., I Turing-testet försökte domaren gissa vem som var en dator och vem som var en riktig människa.

föga förvånande, i 1950, Turing fungerade inte det nödvändiga detaljerade protokollet för oss att bedöma dagens AI-programvara. För en sak föreslog han att testet kunde göras på bara fem minuter. Men han fungerade inte heller att domaren och den mänskliga spelaren var tvungna att dela en kultur och att datorn skulle behöva försöka efterlikna den. Det har lett till många människor som hävdar att testet har passerat och andra hävdar att testet är för enkelt eller bör innehålla emulering av fysiska förmågor.,

först hävdade pass

en del av detta gjordes uppenbart nästan 50 år sedan med byggandet av programmet som kallas ELIZA av datavetare Joseph Weizenbaum. ELIZA användes för att simulera en typ av psykoterapeut som kallas en Rogerian, eller personcentrerad, terapeut. Flera patienter som interagerade med det tyckte att det var verkligt, vilket ledde till det tidigaste påståendet att Turingtestet hade passerat.

men Weizenbaum var klart att ELIZA i själva verket var ett skämt., Installationen följde inte ens vad lite protokollturing gav eftersom patienterna inte visste att de letade efter bedrägeri och det fanns inga samtidiga svar från en riktig psykoterapeut. Dessutom var kultur inte en del av testet eftersom Rogerian terapeuter säger så lite som möjligt. Varje givande Turing Test måste ha domaren och den mänskliga spelaren agerar i så mänsklig-som ett sätt som möjligt.

med tanke på att detta är ett test för att förstå text måste datorer bedömas mot förmågan hos de översta procenten av kopieringsredaktörer., Om frågorna är rätt kan de ange om datorn har förstått de andra deltagarnas materiella kultur.

Winograd schemas

rätt typ av fråga kan baseras på 1975-idén om ”Winograd schemas”, par meningar som skiljer sig från bara ett eller två ord som kräver kunskap om världen för att förstå. Ett test för AI baserat på dessa är känt som en Winograd Schema utmaning och föreslogs först i 2012 som en förbättring av Turing testet.,

Tänk på följande mening med två möjliga ändringar: ”trofén skulle inte passa i resväskan eftersom den var för liten/stor.”Om det sista ordet är” litet”, hänvisar” det ” till resväskan. Om det sista ordet är” stort”, hänvisar” det ” till trofén.

för att förstå detta måste du förstå den kulturella och praktiska världen av troféer och resväskor. I engelsktalande samhälle använder vi språk på ett sådant sätt att även om en liten trofé inte exakt ”passar” en stor resväska som inte är vad en vanlig engelsktalare skulle innebära med ”passform” i detta sammanhang., Det är därför på normal engelska, om det sista ordet är ”litet”, ”det” måste hänvisa till resväskan.

Du måste också förstå den fysiska världen av troféer och resväskor samt om du faktiskt hade hanterat dem. Så ett Turingtest som tog denna typ av tillvägagångssätt skulle göra ett test som inkluderade en bedömning av en AI: s förmåga att efterlikna en persons fysiska förmågor överflödiga.

en högre bar

detta innebär ett Turingtest baserat på Winograd schemas är ett mycket bättre sätt att bedöma en dators språkliga och kulturella flyt än en enkel fem minuters konversation., Det sätter också en mycket högre bar. Alla datorer i en sådan tävling i 2016 misslyckades kapitalt, och inga konkurrenter kom in från de stora AI-baserade företagen eftersom de visste att de skulle misslyckas.

inget av påståendena att Turing-testet redan har godkänts betyder någonting om det är upprättat som ett allvarligt test av mänsklighetens särskiljande förmåga att skapa och förstå kultur. Med ett korrekt protokoll är testet lika krävande som det behöver vara. En gång till, Alan Turing fick det rätt., Och som vi ser finns det ingen uppenbar väg att skapa maskiner som kan delta i mänsklig kultur tillräckligt djupt för att klara rätt typ av språkligt test.

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *