Vi går ind i en alder af kunstig intelligens. Og efterhånden som AI-programmer bliver bedre og bedre til at handle som mennesker, vil vi i stigende grad blive konfronteret med spørgsmålet om, hvorvidt der virkelig er noget så specielt ved vores egen intelligens, eller om vi bare er maskiner af en anden art. Kunne alt, hvad vi ved og gør en dag, gengives af et kompliceret nok computerprogram installeret i en kompliceret nok robot?,

i 1950, computer pioner og krigstid codebreaker Alan Turing gjort en af de mest indflydelsesrige forsøg på at løse dette problem. I et skelsættende papir foreslog han, at vagheden kunne tages ud af spørgsmålet om menneskelig og maskinel intelligens med en simpel test. Denne “Turing-Test” vurderer en computers evne til at efterligne et menneske, som bedømt af et andet menneske, der ikke kunne se maskinen, men kunne stille den skriftlige spørgsmål.

i de sidste par år er flere stykker AI-soft .are blevet beskrevet som at have slået Turing-testen., Dette har fået nogle til at hævde, at testen er for let til at være en nyttig dommer over kunstig intelligens. Men jeg vil hævde, at Turing-testen faktisk ikke er bestået overhovedet. Faktisk vil det ikke blive bestået i overskuelig fremtid. Men hvis en dag en korrekt designet Turing Test er bestået, vil det give os grund til at bekymre sig om vores unikke status.

Turing-testen er virkelig en test af sproglig flydende. Korrekt forstået, det kan afsløre det, der uden tvivl er mest karakteristisk for mennesker: vores forskellige kulturer., Disse giver anledning til enorme variationer i tro og adfærd, der ikke ses blandt dyr eller de fleste maskiner. Og det faktum, at vi kan programmere denne form for variation i computere, er det, der giver dem potentialet til at efterligne menneskelige evner. Når vi dømmer flydende efterligning, lader Turing-testen os se efter computerens evne til at dele i den menneskelige kultur ved at demonstrere deres forståelse af sprog i en social sammenhæng.

Turing baserede sin test på “imitation game”, et festspil, hvor en mand foregav at være en kvinde, og en dommer forsøgte at gætte hvem der var hvem ved at stille de skjulte spillere spørgsmål., I Turing-testen ville dommeren prøve at gætte, hvem der var en computer, og hvem der var et rigtigt menneske.

det var overraskende, at Turing i 1950 ikke udarbejdede den nødvendige detaljerede protokol for os at bedømme dagens AI-soft .are. For det første foreslog han, at testen kunne udføres på kun fem minutter. Men han fandt heller ikke ud af, at dommeren og den menneskelige spiller måtte dele en kultur, og at computeren skulle forsøge at efterligne den. Det har ført til, at mange mennesker hævder, at testen er bestået, og andre hævder, at testen er for let eller bør omfatte emulering af fysiske evner.,

første hævdede pass

noget af dette blev gjort indlysende for næsten 50 år siden med opførelsen af programmet kendt som Eli .a af computerforsker Joseph .ei .enbaum. Eli .a blev brugt til at simulere en type psykoterapeut kendt som en Rogerian, eller personcentreret, terapeut. Flere patienter, der interagerede med det, troede, at det var rigtigt, hvilket førte til den tidligste påstand om, at Turing-testen var blevet bestået.men ELIEI .enbaum var klar over, at Eli .a faktisk var en vittighed., Opsætningen fulgte ikke engang, hvilken lille protokol Turing gav, fordi patienterne ikke vidste, at de ledte efter svig, og der var ingen samtidige svar fra en rigtig psykoterapeut. Kultur var heller ikke en del af testen, fordi Rogerian-terapeuter siger så lidt som muligt. Enhver værdifuld Turing-Test skal have dommeren og den menneskelige spiller, der handler på en så menneskelig måde som muligt.

da dette er en test af forståelsestekst, skal computere bedømmes ud fra evnerne hos de øverste få procent af kopiredigerere., Hvis spørgsmålene er rigtige, kan de angive, om computeren har forstået de andre deltagers materielle kultur.

Wininograd-skemaer

den rigtige slags spørgsmål kunne være baseret på 1975-ideen om “scheminograd-skemaer”, par sætninger, der adskiller sig med kun et eller to ord, der kræver viden om verden for at forstå. En test for AI baseret på disse er kendt som en Scheminograd Schema Challenge og blev først foreslået i 2012 som en forbedring af Turing-testen.,

overvej følgende sætning med to mulige slutninger: “trofæet ville ikke passe i kufferten, fordi det var for lille / stort.”Hvis det sidste ord er “lille”, henviser “det” til kufferten. Hvis det sidste ord er “stort”, henviser” det ” til trofæet.

for at forstå dette skal du forstå den kulturelle og praktiske verden af trofæer og kufferter. I engelsktalende samfund bruger vi Sprog på en sådan måde, at selvom et lille trofæ ikke nøjagtigt “passer” til en stor kuffert, er det ikke, hvad en normal engelsktalende ville betyde med “fit” i denne sammenhæng., Derfor skal det på normal engelsk, hvis det sidste ord er “lille”, “det” henvise til kufferten.

Du er også nødt til at forstå den fysiske verden af trofæer og kufferter såvel som hvis du faktisk havde håndteret dem. Så en Turing Test, der tog denne form for tilgang ville gøre en test, der omfattede en vurdering af en AI evne til at efterligne et menneskes fysiske evner overflødige.

en højere bjælke

dette betyder, at en Turing-Test baseret på scheminograd-skemaer er en meget bedre måde at vurdere en computers sproglige og kulturelle flydende end en simpel fem minutters samtale., Det sætter også en meget højere bar. Alle computere i en sådan konkurrence i 2016 mislykkedes elendigt, og ingen konkurrenter blev indtastet fra de store AI-baserede firmaer, fordi de vidste, at de ville mislykkes.

ingen af påstandene om, at Turing-testen allerede er bestået, betyder noget, hvis den er oprettet som en seriøs test af menneskehedens karakteristiske evner til at skabe og forstå kultur. Med en ordentlig protokol er testen så krævende, som den skal være. Alan Turing fik det rigtigt igen., Og som vi står, er der ingen indlysende vej til at skabe maskiner, der kan deltage i den menneskelige kultur tilstrækkeligt dybt til at bestå den rigtige slags sproglige test.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *