Turing-Test zum Bestehen online auf Russisch. Der größte Turing-Test. Simulationsspiel versus Standard-Turing-Test

Als der Zweite Weltkrieg beginnt, eilt der Wissenschaftler nach Bletchley Park – zur Government School of Codes and Ciphers. Dort schließt er sich Experten an, die an der Entschlüsselung von Nachrichten arbeiten, die mit der legendären deutschen Enigma-Maschine erstellt wurden. Die Nazis verwendeten ihre geheimen Bezeichnungen für ihre Funksprüche. Innerhalb der Mauern der Schule wartet Turing mit einer einzigartigen Installation auf – der Turing Bombe.

Die drei Meter lange und zweieinhalb Tonnen schwere Maschine erledigte die Codes in wenigen Minuten. Und die britischen Behörden erhielten genaue Informationen über die Bewegungen des Feindes. Obwohl das Band von Kritikern als sehr erfolgreich anerkannt wurde, offenbart es dennoch nicht alle wissenschaftlichen Errungenschaften von Alan Turing. Schade... Dieser begabte Professor beschäftigte sich lange Zeit mit Morphogenese und beschrieb sogar mathematisch den Prozess der Selbstorganisation von Materie. Darüber hinaus ist Turing der Autor des abstrakten Rechenapparats, des Urvaters des modernen Computers. Und der Wissenschaftler ist einer der ersten, der sich ernsthaft Gedanken über das Zusammenspiel von synthetischem und lebendigem Geist gemacht hat.

Als 1950 in den Labors vieler Länder die ersten Computerprogramme entwickelt wurden, erregte er mit seinem Artikel „Computing Machines and the Mind“, der in der Zeitschrift „Mind“ erschien, die Aufmerksamkeit der Weltöffentlichkeit. Die Essenz des Materials war wie folgt. Der Brite schlug vor, die Frage „Denken Maschinen“ durch die Frage „Können Maschinen tun, was wir tun“ zu ersetzen. In diesem Fall gäbe es, wie Turing argumentierte, eine klare Grenze zwischen intellektuellen und körperlichen Fähigkeiten. Alan gab als Beispiel einen einfachen Test. Das Subjekt muss parallel mit der Person und mit dem PC kommunizieren. Das Gespräch wird nicht mündlich von Angesicht zu Angesicht geführt, sondern schriftlich, blind unter Verwendung der Tastatur. Zu Zeiten der Mathematik waren Computer noch nicht so schnell und leistungsfähig. Daher wurden die Verhandlungen in bestimmten Zeitabständen fortgesetzt. Pausen verringerten die Reaktionsgeschwindigkeit, und es wurde äußerst schwierig zu verstehen, wer in dieser Situation wer ist. Der Test galt als bestanden, wenn der Aufbau als lebender Proband durchgeführt wurde.

Viele glaubten, dass Turing, der seine Forschungen durchführte, schrecklich pessimistisch war und die Aussicht, dass Maschinen an die Macht kamen, ihm überhaupt nicht gefiel. Es gibt jedoch Beweise, die dagegen sprechen. Ein Freund des Wissenschaftlers Robin Gandy erinnerte sich beispielsweise oft daran, dass Turing, als er zum hundertsten Mal Passagen seines Werks durchblätterte, immer wieder lächelte und sogar kicherte. Wie dem auch sei, seine Suche ist zu einem wichtigen Meilenstein auf dem Weg der Annäherung zwischen Computer und Mensch geworden. Und in der Tat, eine Probeanalyse dieses Bereichs. Später gehen Experten noch weiter und finden verschiedene Möglichkeiten, wie ein elektronischer Denker einen Menschen um den Finger täuschen kann.

So kündigte der amerikanische Wissenschaftler Joseph Weizenbaum 1966 die Schaffung eines virtuellen Gesprächspartners an - des Computerprogramms Eliza. Sie sollte einen edlen Psychotherapeuten imitieren. Warum hat sich Weizenbaum auf dieses spezielle medizinische Gebiet konzentriert? Hier können Sie eine Frage ganz einfach mit einer Frage beantworten. Darüber hinaus ist ihre semantische Last relativ gering, es gibt keine langen Sätze und Gedanken lassen sich leicht in einem einzigen System strukturieren. "Eliza" gab Ratschläge und philosophierte nicht, sondern paraphrasierte einfach die Rede des Gesprächspartners. Es sah ungefähr so ​​aus:

Thema: Ich habe Kopfschmerzen.

Eliza: Warum sagst du, du hast Kopfschmerzen?

Manchmal tappten die Testpersonen in die Falle und glaubten von ganzem Herzen, dass sie mit einem echten Arzt sprachen. Aber es gab auch lustige Momente. Während des Experiments stellten die Leute regelmäßig fest, dass der elektronische Arzt die Essenz der Probleme nicht verstand. Unfähig, die richtigen Antworten zu finden, schloss "Eliza" normalerweise: Ich verstehe ... Und übertrug den Dialog auf ein anderes Thema. Joseph Weizenbaum schrieb über sein Programm in The Power of Computing Machines and the Human Mind. Vom Urteil zum Kalkül“:

In gewisser Weise war "Eliza" eine Schauspielerin, die eine bestimmte Technik hatte, aber sie selbst hatte nichts zu sagen. Das Drehbuch wiederum bestand aus einem bestimmten Regelwerk, das es dem Schauspieler ermöglichte, über jedes ihm zur Verfügung stehende Material zu improvisieren.

Acht Jahre später, 1972, veröffentlichte ein anderer Amerikaner, Kenneth Colby, ein ähnliches Programm, PARRY, das darauf abzielte, das Verhalten eines paranoiden Schizophrenen zu kopieren.Um die neue Erfindung auf ihre Wirksamkeit zu testen, führte Colby ein lustiges Experiment durch. Er schlug vor, dass professionelle Psychiater zwei Gruppen von Patienten testen sollten – reale Patienten und virtuelle Patienten, die durch das PARRY-Programm generiert wurden. Die Kommunikation erfolgte per Fernschreiber. Später wurden Abschriften der Reden einem anderen Team von Psychiatern gezeigt. Dann stellten zwei Ärzteteams fest, bei welchem ​​der Probanden es sich um einen Menschen und bei welchem ​​um einen Apparat handelte. Infolgedessen wurde nur in 48 % der Fälle die richtige Entscheidung getroffen. Und das bedeutete, dass es der Maschine gelang, die Ärzte zu täuschen. Insbesondere Eliza und PARRY waren dazu bestimmt, sich zu treffen. Rendez-vous wurde über das ARPANET organisiert. Der Dialog zwischen dem elektronischen Arzt und dem Patienten dauerte mehrere Minuten.

Kommen wir nun zu einem anderen Bereich, sagen wir zur Musik. Das ist nicht Mathematik, Geometrie und Physik, wo alles trockenen Zahlen unterliegt. Hier braucht es einen Höhenflug, Talent und vor allem Inspiration. Ohne diese drei Komponenten ist die Geburt eines guten Werkes, das tief in die Seele eindringt, unmöglich. Genauer gesagt war es unmöglich, bis die akribischen Magier den Iamus-Musikcomputer an der südspanischen Universität von Malaga erfanden. Benannt nach dem Sohn von Apollo, schreibt er rhythmische Partituren, die in ihrer Komplexität nur mit Gershwin oder Orff vergleichbar sind. Zunächst generiert der PC einfache, kurze rhythmische Phrasen – „Genome“. Dann beginnen sie sich zu entwickeln und nehmen allmählich die Form eines umfassenden akademischen Essays an. Basierend auf dem Turing-Test haben die Entwickler die Funktion ihres Geräts an professionellen Musikern getestet. Die Autoren von Iamus gaben den Künstlern mehrere Varianten von Werken zum Anhören: solche, die von einem Computer und von echten Komponisten geschaffen wurden. Später mussten Experten feststellen: Who is Who. Das Interessanteste ist, dass der Test die Befragten in eine Sackgasse führte. Ein von einem synthetischen Geist verfasstes Werk unterschied sich praktisch nicht von einem von Menschen gemachten.

Der Haken an der Sache war, dass die Schriften von Iamus die gleichen Emotionen hervorriefen: Traurigkeit, Freude, Lachen, Tränen. Daher konnten sich die meisten Probanden nicht entscheiden und eine genaue Antwort geben. Sie sagten normalerweise, sie wüssten es nicht.

Eine ähnliche Bemerkung der Testpersonen erwarteten Experten der University of Cambridge. Innerhalb der Mauern ihrer Alma Mater versuchten britische Linguisten und Programmierer, einem Computer beizubringen, japanische Haiku zu verfassen. Sagen Sie mir jetzt: Wie können Sie glauben, dass dies eine Maschine ist, wenn sie in der Lage ist, so etwas zu erschaffen?

Gestern ist alles in Ordnung

Und jetzt ist alles bedeckt -

Das ist die Essenz von Windows.

Bei der Entwicklung seines Tests argumentierte Alan Turing, dass es unwahrscheinlich ist, dass Wissenschaftler menschlicher werden, wenn Wissenschaftler künstliche Haut erfinden und sie Maschinen geben. Ein Computer ist ein Computer, der in Ordnern und Dateien denkt. Dennoch arbeiten Spezialisten seit langem in diese Richtung. Der Maschinenbauingenieur John-John Kabibihan von der University of Qatar hat beispielsweise ein weiches Silikonpolymer entwickelt, das bei einer Erwärmung auf 36,6 Grad echter Haut ähnelt: Der Spezialist druckte eine künstliche Hand auf einem 3D-Drucker und umhüllte sie mit einem neuen Material . Dann habe ich einen einfachen Test durchgeführt. Kabibikhan setzte die Teilnehmer mit dem Rücken zu ihm und begann, ihre Schulter entweder mit seiner Hand oder mit einem künstlichen Modell zu berühren. Die Befragten konnten keine klaren Unterscheidungen treffen.

Doch trotz zahlreicher Studien und Versuche, einen Computer einem Menschen näher zu bringen, wurde der Turing-Test erst 2014 offiziell bestanden. Möglich wurde dies durch das Eugene-Goostman-Programm, das von Vladimir Veselov, einem gebürtigen Russen, und Evgeny Demchenko, einem Vertreter der Ukraine, durchgeführt wurde: Das Experiment bestand aus einer Reihe kurzer Dialoge mit fünf Computern. Dabei musste die Jury erraten, ob sie von Maschinengewehren oder echten Menschen angetrieben wurden. Der Test galt als bestanden, wenn der Computer den Areopag zu einem Drittel täuschte aus geführt Zeit. Eigentlich ist die Idee von Veselov-Demchenko gerade gelungen. Der Indikator fiel aus sogar ein paar Zehntel höher - 33%. Künstliche Intelligenz wurde im Namen eines fiktiven dreizehnjährigen Teenagers aus Odessa, Zhenya Gustman, aktiv erklärt, der "behauptet, alles auf der Welt zu wissen, aber aufgrund seines Alters nichts weiß". Er wurde als lebende Person anerkannt. Skeptiker bezeichneten das Bestehen des Turing-Tests jedoch sofort als zweifelhaft. Immerhin war Zhenya Gustman nur Chatbot. Daher bleibt ihrer Meinung nach die Antwort auf die Frage offen, ob Maschinen das können, was wir tun. Sie können jedoch versuchen, eine Lösung zu finden, indem Sie mit Roboterprogrammen im Internet sprechen. Heute im Freien weltweites Netz Sie sind sichtbar und unsichtbar: von Online-Spielen bis zu sozialen Netzwerken. Wenn Alan Turing im 21. Jahrhundert wäre, würde er sicherlich ein solches visuelles Erlebnis organisieren.

Die Standardinterpretation des Turing-Tests

Turing-Test- ein empirischer Test, dessen Idee von Alan Turing in dem Artikel "Computing Machines and the Mind" (Eng. Computermaschinen und Intelligenz ), erschienen 1950 in der Philosophischen Zeitschrift Geist. Turing wollte herausfinden, ob eine Maschine denken kann.

Die Standardinterpretation dieses Tests lautet wie folgt: " Eine Person interagiert mit einem Computer und einer Person. Anhand der Antworten auf die Fragen muss er feststellen, mit wem er spricht: mit einem Menschen oder einem Computerprogramm. Die Aufgabe eines Computerprogramms besteht darin, eine Person in die Irre zu führen und sie zu zwingen, die falsche Wahl zu treffen.».

Alle Testteilnehmer sehen sich nicht. Wenn der Richter nicht sicher sagen kann, welcher der Gesprächspartner ein Mensch ist, gilt das Auto als bestanden. Um die Intelligenz der Maschine zu testen und nicht ihre Fähigkeit, mündliche Sprache zu erkennen, wird das Gespräch im Modus "nur Text" geführt, beispielsweise unter Verwendung von Tastatur und Bildschirm (Zwischencomputer). Die Korrespondenz muss in kontrollierten Abständen erfolgen, damit der Richter keine Rückschlüsse auf die Reaktionsgeschwindigkeit ziehen kann. Zu Turings Zeiten reagierten Computer langsamer als Menschen. Jetzt ist diese Regel notwendig, weil sie viel schneller reagieren als ein Mensch.

Geschichte

Philosophischer Hintergrund

Obwohl die Forschung auf dem Gebiet der künstlichen Intelligenz 1956 begann, reichen ihre philosophischen Wurzeln tief in die Vergangenheit. Die Frage, ob eine Maschine denken kann oder nicht, hat eine lange Geschichte. Es hängt eng mit den Unterschieden zwischen der dualistischen und der materialistischen Sichtweise zusammen. Aus Sicht des Dualismus ist Denken nicht materiell (oder hat zumindest keine materiellen Eigenschaften), und daher kann der Geist nicht nur mit Hilfe physikalischer Konzepte erklärt werden. Auf der anderen Seite vertritt der Materialismus die Ansicht, dass der Geist physikalisch erklärt werden kann, und lässt damit die Möglichkeit der Existenz künstlich geschaffener Geister offen.

Alan Turing

Bis 1956 forschten britische Wissenschaftler zehn Jahre lang an „maschineller Intelligenz“. Diese Frage war ein häufiges Diskussionsthema unter den Mitgliedern des Ratio Club, einer informellen Gruppe britischer Kybernetiker und Elektronikforscher, zu der auch Alan Turing gehörte, nach dem der Test benannt wurde.

Turing beschäftigt sich seit mindestens 1941 insbesondere mit dem Problem der maschinellen Intelligenz. Einer seiner frühesten Hinweise auf „Computerintelligenz“ stammt aus dem Jahr 1947. In seinem Bericht „Intelligente Maschinen“ ging Turing der Frage nach, ob eine Maschine intelligentes Verhalten erkennen könnte, und schlug im Rahmen dieser Studie vor, was als Vorläufer seiner zukünftigen Forschung gelten könnte: „Es ist nicht schwierig, eine Maschine zu entwickeln, die Schach spielt Gut. Nehmen wir nun drei Personen - die Versuchspersonen. A, B und C. Lassen Sie A und C unwichtig Schach spielen und B der Bediener der Maschine sein. […] Es werden zwei Räume verwendet sowie einige Mechanismen zum Weiterleiten von Nachrichten über Bewegungen. Teilnehmer C spielt entweder A oder eine Maschine. Teilnehmer C kann es schwierig finden, zu antworten, mit wem er spielt.

So hatte Turing zum Zeitpunkt der Veröffentlichung des Artikels „Computing Machines and the Mind“ im Jahr 1950 viele Jahre über die Möglichkeit der Existenz künstlicher Intelligenz nachgedacht. Dieser Artikel war jedoch der erste von Turing, der sich ausschließlich mit diesem Konzept befasste.

Turing beginnt seinen Artikel mit der Feststellung: „Ich schlage vor, die Frage ‚Können Maschinen denken?‘ zu prüfen.“ Er betont, dass der traditionelle Ansatz zu diesem Thema darin besteht, zunächst die Begriffe „Maschine“ und „Intelligenz“ zu definieren. Turing ging jedoch einen anderen Weg; Stattdessen ersetzte er die ursprüngliche Frage durch eine andere, "die eng mit dem Original verwandt und relativ eindeutig ist". Im Wesentlichen schlägt er vor, die Frage „Denken Maschinen?“ zu ersetzen. die Frage "Können Maschinen tun, was wir (als denkende Lebewesen) können?". Der Vorteil der neuen Frage, so Turing, sei, dass sie "eine klare Grenze zwischen den körperlichen und intellektuellen Fähigkeiten einer Person ziehe".

Um diesen Ansatz zu demonstrieren, bietet Turing einen Test an, der in Analogie zum Partyspiel „Imitation Game“ konzipiert ist – ein Imitationsspiel. In diesem Spiel gehen ein Mann und eine Frau in verschiedene Räume, und die Gäste versuchen, sie voneinander zu unterscheiden, indem sie ihnen eine Reihe schriftlicher Fragen stellen und die getippten Antworten darauf lesen. Nach den Spielregeln versuchen sowohl der Mann als auch die Frau, die Gäste vom Gegenteil zu überzeugen. Turing schlägt vor, das Spiel wie folgt neu zu gestalten: „Stellen wir uns nun die Frage, was passiert, wenn in diesem Spiel die Rolle A von einer Maschine gespielt wird? Wird der Fragesteller so oft Fehler machen, als würde er mit einem Mann und einer Frau spielen? Diese Fragen das Original ersetzen" Kann eine Maschine denken?

In demselben Bericht schlägt Turing später eine „äquivalente“ alternative Formulierung vor, bei der ein Richter nur mit einem Computer und einem Menschen spricht. Während keine dieser Formulierungen exakt der heute bekanntesten Version des Turing-Tests entspricht, schlug der Wissenschaftler 1952 eine dritte vor. In dieser Version des Tests, den Turing im BBC-Radio diskutierte, befragt die Jury einen Computer, und die Rolle des Computers besteht darin, einen großen Teil der Jury glauben zu machen, dass er tatsächlich ein Mensch ist.

Turings Papier befasst sich mit 9 vorgeschlagenen Fragen, die alle wichtigen Einwände gegen künstliche Intelligenz enthalten, die seit der ersten Veröffentlichung des Papiers erhoben wurden.

Eliza und PARRY

Blay Whitby weist auf 4 große Wendepunkte in der Geschichte des Turing-Tests hin – die Veröffentlichung des Papiers „Computing Machinery and the Mind“ im Jahr 1950, die Ankündigung von Joseph Weizenbaums Gründung des Eliza-Programms (ELIZA) im Jahr 1966, die Gründung von das 1972 erstmals beschriebene PARRY-Programm von Kenneth Colby und das Turing Colloquium 1990.

Das Funktionsprinzip von Eliza besteht darin, vom Benutzer eingegebene Kommentare auf das Vorhandensein von Schlüsselwörtern zu untersuchen. Wird ein Schlüsselwort gefunden, so wird die Regel angewendet, nach der der Kommentar des Nutzers umgewandelt und der Ergebnissatz zurückgegeben wird. Wenn das Schlüsselwort nicht gefunden wird, gibt Elise entweder eine allgemeine Antwort an den Benutzer zurück oder wiederholt einen der vorherigen Kommentare. Darüber hinaus programmierte Wizenbaum Eliza, das Verhalten eines klientenzentrierten Psychotherapeuten nachzuahmen. Dies ermöglicht Elise, "so zu tun, als wüsste sie so gut wie nichts über die reale Welt". Mit diesen Methoden war Wizenbaums Programm in der Lage, einige Leute zu der Annahme zu verleiten, dass sie mit einer realen Person sprachen, und für einige war es „sehr schwierig zu überzeugen, dass Eliza […] kein Mensch war“. Auf dieser Grundlage argumentieren einige, dass Eliza eines der Programme (vielleicht das erste) ist, das den Turing-Test bestehen könnte. Diese Behauptung ist jedoch höchst umstritten, da die „Fragesteller“ angewiesen wurden, anzunehmen, sie würden mit einem echten Psychotherapeuten sprechen, und sich nicht bewusst sein, dass sie möglicherweise mit einem Computer sprechen.

Kolloquium über Konversationssysteme, 2005

Im November 2005 veranstaltete die University of Surrey ein eintägiges ACE-Entwicklertreffen, an dem die Gewinner der Loebner-Turing-Praxistests teilnahmen: Robby Garner, Richard Wallace, Rollo Carpenter. Zu den Gastrednern gehörten David Hamill, Hugh Loebner und Huma Shah.

Symposium der AISB Society zum Turing-Test, 2008

Im Jahr 2008 veranstaltete die Society for the Study of Artificial Intelligence and Simulation of Behavior (AISB) neben der Ausrichtung eines weiteren Loebner-Preiswettbewerbs an der University of Reading ein eintägiges Symposium, auf dem der Turing-Test diskutiert wurde. Gastgeber des Symposiums waren John Barnden, Mark Bishop, Huma Sha und Kevin Warwick. Zu den Rednern gehörten RI-Direktorin Baroness Susan Greenfield, Selmer Bringsjord, der Turing-Biograf Andrew Hodges und der Gelehrte Owen Holland. Es hat sich keine Einigung über einen kanonischen Turing-Test ergeben, aber Bringsord schlug vor, dass eine größere Prämie dazu beitragen würde, den Turing-Test schneller zu bestehen.

Das Jahr von Alan Turing und den Turing 100 im Jahr 2012

2012 wird der Geburtstag von Alan Turing gefeiert. Das ganze Jahr über wird es viele tolle Events geben. Viele von ihnen werden an Orten stattfinden, die in Turings Leben von großer Bedeutung waren: Cambridge, Manchester und Bletchy Park. Betreut wird das Year of Alan Turing vom TCAC (Turing Centenary Advisory Committee), das Veranstaltungen im Jahr 2012 fachlich und organisatorisch unterstützt. Ebenfalls an der Veranstaltungsunterstützung beteiligt sind: ACM , ASL , SSAISB , BCS , BCTCS , Bletchy Park , BMC , BLC , CCS , Association CiE , EACSL , EATCS , FoLLI , IACAP , IACR , KGS und LICS .

Ein spezielles Komitee wurde eingerichtet, um Aktivitäten zur Feier des 100. Geburtstags von Turing im Juni 2012 zu organisieren, dessen Aufgabe es ist, Turings Botschaft über eine empfindungsfähige Maschine, die sich in Hollywood-Filmen wie Blade Runner widerspiegelt, der breiten Öffentlichkeit, einschließlich Kindern, zu vermitteln. Ausschussmitglieder: Kevin Warwick, Vorsitzender, Huma Shah, Koordinator, Ian Bland, Chris Chapman, Marc Allen, Rory Dunlop, Loebner Robbie Award Winners Garnet und Fred Roberts. Das Komitee wird unterstützt von Women in Technology und Daden Ltd.

Bei diesem Wettbewerb präsentierten die Russen, deren Namen nicht bekannt gegeben wurden, das Programm "Eugene". An 150 durchgeführten Tests (und tatsächlich fünfminütigen Gesprächen) nahmen fünf neue Programme teil, die unter 25 gewöhnlichen Menschen „verloren“ gingen. Das Eugene-Programm, das einen 13-jährigen Jungen aus Odessa zeigte, war der Gewinner und schaffte es, die Prüfer in 29,2 % seiner Antworten in die Irre zu führen. Somit hat das Programm nicht nur 0,8% erreicht, um den Test vollständig zu bestehen.

Varianten des Turing-Tests

Imitationsspiel wie von Turing im Artikel "Computing Machines and the Mind" beschrieben. Spieler C versucht durch Stellen einer Reihe von Fragen festzustellen, welcher der anderen beiden Spieler ein Mann und welcher eine Frau ist. Spieler A, ein Mann, versucht Spieler C zu verwirren, und Spieler B versucht C zu helfen.

Ein erster Test auf Basis eines Simulationsspiels, bei dem statt Spieler A ein Computer spielt. Der Computer sollte nun Spieler C verwirren, während Spieler B weiterhin versucht, dem Host zu helfen.

Es gibt mindestens drei Hauptversionen des Turing-Tests, von denen zwei im Artikel „Computing Machines and the Mind“ vorgeschlagen wurden, und die dritte Version, in der Terminologie von Saul Traiger, die Standardinterpretation ist.

Während es einige Debatten darüber gibt, ob die moderne Interpretation dem entspricht, was Turing beschrieben hat, oder das Ergebnis einer Fehlinterpretation seiner Arbeit ist, werden alle drei Versionen nicht als gleichwertig angesehen, ihre Stärken und Schwächen unterscheiden sich.

Simulationsspiel

Wie wir bereits wissen, hat Turing ein einfaches Partyspiel beschrieben, an dem mindestens drei Spieler teilnehmen. Spieler A ist ein Mann, Spieler B ist eine Frau und Spieler C, der als Sprecher auftritt, hat beide Geschlechter. Gemäß den Spielregeln sieht C weder A noch B und kann mit ihnen nur durch schriftliche Nachrichten kommunizieren. Indem er den Spielern A und B Fragen stellt, versucht C herauszufinden, wer von ihnen ein Mann und wer eine Frau ist. Die Aufgabe von Spieler A ist es, Spieler C so zu verwirren, dass er die falsche Schlussfolgerung zieht. Gleichzeitig besteht die Aufgabe von Spieler B darin, Spieler C dabei zu helfen, ein richtiges Urteil zu fällen.

In dem, was S. G. Sterret den Original Imitation Game Test nennt, schlägt Turing vor, dass die Rolle von Spieler A von einem Computer gespielt wird. Die Aufgabe des Computers besteht also darin, vorzugeben, eine Frau zu sein, um Spieler C zu verwirren. Der Erfolg einer solchen Aufgabe wird abgeschätzt, indem die Ergebnisse des Spiels verglichen werden, wenn Spieler A ein Computer ist, und die Ergebnisse, wenn Spieler A ein Computer ist Mann:

Die zweite Option wird von Turing im selben Artikel vorgeschlagen. Die Rolle von Spieler A wird wie im Eingangstest von einem Computer übernommen. Der Unterschied besteht darin, dass die Rolle von Spieler B sowohl von einem Mann als auch von einer Frau gespielt werden kann.

„Schauen wir uns einen bestimmten Computer an. Stimmt es, dass es möglich ist, indem man diesen Computer so modifiziert, dass er genügend Speicherplatz hat, seine Geschwindigkeit erhöht und ihm ein geeignetes Programm gibt, einen Computer so zu entwerfen, dass er die Rolle des Spielers A in einem Simulationsspiel zufriedenstellend erfüllt, während die Rolle des Spieler B macht ein Mann?“ Turing, 1950, S. 442.

Bei dieser Variante versuchen sowohl Spieler A als auch B, den Anführer zu einer falschen Entscheidung zu überreden.

Standardinterpretation

Die Hauptidee dieser Version ist, dass der Zweck des Turing-Tests nicht darin besteht, die Frage zu beantworten, ob eine Maschine den Host täuschen kann, sondern die Frage, ob eine Maschine eine Person imitieren kann oder nicht. Obwohl darüber diskutiert wird, ob diese Option von Turing beabsichtigt war oder nicht, glaubt Sterrett, dass diese Option von Turing impliziert wurde, und kombiniert daher die zweite Option mit der dritten. Gleichzeitig glaubt eine Gruppe von Gegnern, darunter Trager, nicht daran. Aber es führte immer noch zu dem, was man die "Standardinterpretation" nennen könnte. In dieser Version ist Spieler A ein Computer, Spieler B ist eine Person beliebigen Geschlechts. Die Aufgabe des Präsentators besteht nun nicht darin, zu bestimmen, wer von ihnen ein Mann und eine Frau ist, sondern wer von ihnen ein Computer und wer ein Mensch ist.

Simulationsspiel versus Standard-Turing-Test

Es herrscht Uneinigkeit darüber, welche Option Turing im Sinn hatte. Sterret besteht darauf, dass Turings Arbeit zu zwei verschiedenen Versionen des Tests führt, die laut Turing nicht äquivalent sind. Der Test, der das Partyspiel verwendet und Erfolgsquoten vergleicht, wird als Initial Imitation Game Test bezeichnet, während der Test, der auf dem Gespräch des Richters mit Mensch und Maschine basiert, als Standard Turing Test bezeichnet wird, wobei anzumerken ist, dass Sterrett ihn mit der Standardinterpretation gleichsetzt nicht auf die zweite Version des Simulationsspiels.

Sterrett stimmt zu, dass der Standard Turing Test (STT) die Mängel aufweist, auf die seine Kritiker hinweisen. Er glaubt jedoch, dass im Gegensatz dazu der ursprüngliche Test, der auf einem Imitationsspiel basiert (OIG-Test - Original Imitation Game Test), viele von ihnen aufgrund wesentlicher Unterschiede vorenthält: Im Gegensatz zu STT berücksichtigt er kein menschenähnliches Verhalten als das Hauptkriterium, betrachtet menschliches Verhalten jedoch als Zeichen maschineller Intelligenz. Eine Person kann den OIG-Test nicht bestehen, weshalb angenommen wird, dass dies eine Tugend des Intelligenztests ist. Das Nichtbestehen des Tests bedeutet mangelnden Einfallsreichtum: Der OIG-Test geht per Definition davon aus, dass Intelligenz mit Einfallsreichtum verbunden ist und nicht einfach "Nachahmung menschlichen Verhaltens während eines Gesprächs". Im Allgemeinen kann der OIG-Test sogar auf nonverbale Weise verwendet werden.

Andere Autoren haben Turings Worte jedoch dahingehend interpretiert, dass das Simulationsspiel selbst ein Test ist. Nicht erläutert wird, wie diese Aussage mit Turings Aussage in Verbindung zu bringen ist, dass der von ihm vorgeschlagene Test anhand des Gesellschaftsspiels auf dem Kriterium der relativen Erfolgshäufigkeit bei diesem Imitationsspiel beruhe und nicht auf der Möglichkeit, eine Runde zu gewinnen des Spiels.

Sollte der Schiedsrichter über den Computer Bescheid wissen?

Ob der Richter weiß, dass es unter den Testteilnehmern einen Computer geben wird oder nicht, erklärt Turing in seinen Schriften nicht. In Bezug auf OIG sagt Turing nur, dass Spieler A durch eine Maschine ersetzt werden soll, sagt aber nicht, ob Spieler C dies weiß oder nicht. Als Colby, F. D. Hilf und A. D. Kramer PARRY testeten, entschieden sie, dass die Richter nicht wissen mussten, dass einer oder mehrere der Interviewer Computer sein würden. Wie von A. Saygin und anderen angemerkt, hinterlässt dies einen signifikanten Einfluss auf die Durchführung und die Ergebnisse des Tests.

Vorteile des Tests

Themenbreite

Die Stärke des Turing-Tests ist, dass man über alles reden kann. Turing schrieb, dass „Fragen und Antworten angemessen erscheinen, um fast jeden Bereich von menschlichem Interesse zu diskutieren, den wir diskutieren möchten“. John Hoegeland fügte hinzu, dass „das bloße Verstehen von Worten nicht ausreicht; Sie müssen auch das Gesprächsthema verstehen. Um einen gut platzierten Turing-Test zu bestehen, muss eine Maschine natürliche Sprache verwenden, vernünftig denken, Wissen haben und lernen. Der Test kann erschwert werden, indem ein Videoeingang integriert wird oder beispielsweise ein Gateway zum Übertragen von Objekten ausgestattet wird: Die Maschine muss die Fähigkeit zum Sehen und zur Robotik nachweisen. All diese Aufgaben zusammen spiegeln die Hauptprobleme wider, denen sich die Theorie der künstlichen Intelligenz gegenübersieht.

Konformität und Einfachheit

Die Stärke und Attraktivität des Turing-Tests beruht auf seiner Einfachheit. Bewusstseinsphilosophen, Psychologie in der modernen Neurologie sind nicht in der Lage, Definitionen von "Intelligenz" und "Denken" zu geben, soweit sie hinreichend genau und allgemein auf Maschinen anwendbar sind. Ohne eine solche Definition kann es keine Antwort auf die zentralen Fragen der Philosophie zur künstlichen Intelligenz geben. Der Turing-Test, auch wenn er unvollkommen ist, stellt zumindest sicher, dass er tatsächlich gemessen werden kann. Als solches ist es eine pragmatische Lösung für schwierige philosophische Fragen.

Nachteile testen

Trotz aller Verdienste und Berühmtheit wird der Test aus mehreren Gründen kritisiert.

Der menschliche Geist und der Geist im Allgemeinen

Menschliches Verhalten und angemessenes Verhalten

Die Orientierung des Turing-Tests ist in Richtung Mensch (Anthropomorphismus) ausgeprägt. Getestet wird nur die Fähigkeit der Maschine, einer Person zu ähneln, und nicht die Intelligenz der Maschine im Allgemeinen. Der Test kann die allgemeine Intelligenz einer Maschine aus zwei Gründen nicht beurteilen:

  • Manchmal lässt sich menschliches Verhalten nicht vernünftig interpretieren. Gleichzeitig verlangt der Turing-Test, dass eine Maschine alle möglichen menschlichen Verhaltensweisen imitieren kann, unabhängig davon, wie intelligent sie ist. Es testet auch die Fähigkeit, Verhaltensweisen nachzuahmen, die eine Person nicht für vernünftig halten würde, wie z. B. die Reaktion auf Beleidigungen, die Versuchung zu lügen oder einfach nur eine große Anzahl von Tippfehlern. Wenn eine Maschine menschliches Verhalten, Tippfehler und dergleichen nicht perfekt nachahmen kann, besteht sie den Test nicht, egal wie viel Intelligenz sie haben mag.
  • Ein gewisses intelligentes Verhalten ist dem Menschen nicht eigen. Der Turing-Test testet kein hochintelligentes Verhalten, wie z. B. die Fähigkeit, komplexe Probleme zu lösen oder originelle Ideen zu entwickeln. Im Wesentlichen erfordert der Test, dass die Maschine schummelt: Egal wie schlau die Maschine ist, sie muss vorgeben, nicht zu schlau zu sein, um den Test zu bestehen. Wenn eine Maschine ein Rechenproblem schnell lösen kann, das ein Mensch nicht lösen kann, wird sie per Definition den Test nicht bestehen.

Unbrauchbarkeit

Ausgehend von dem exponentiellen Wachstum des Technologieniveaus über mehrere Jahrzehnte schlug der Zukunftsforscher Raymond Kurzweil vor, dass Maschinen, die den Turing-Test bestehen könnten, ungefähr um 2020 hergestellt werden würden. Dies entspricht dem Gesetz von Moore.

Das Long Bet Project beinhaltet eine $20.000-Wette zwischen Mitch Kapor (Mitch Kapor – Pessimist) und Raymond Kurzweil (Optimist). Bedeutung der Wette: Wird ein Computer bis 2029 den Turing-Test bestehen? Einige Bedingungen der Wette werden ebenfalls definiert.

Variationen des Turing-Tests

Zahlreiche Versionen des Turing-Tests, einschließlich der zuvor beschriebenen, werden seit geraumer Zeit diskutiert.

Reverse-Turing-Test und CAPTCHA

Eine Modifikation des Turing-Tests, bei der das Ziel oder eine oder mehrere Rollen von Maschine und Mensch vertauscht sind, wird als umgekehrter Turing-Test bezeichnet. Ein Beispiel für diesen Test findet sich in der Arbeit des Psychoanalytikers Wilfred Bion, der besonders fasziniert war von der Art und Weise, wie geistige Aktivität aktiviert wird, wenn er mit einem anderen Geist konfrontiert wird.

R. D. Hinshelwood erweiterte diese Idee und beschrieb den Geist als eine „Gedankenerkennungsmaschine“, wobei er feststellte, dass dies als „Ergänzung“ zum Turing-Test angesehen werden könnte. Nun wird es die Aufgabe des Computers sein festzustellen, mit wem er gesprochen hat: mit einer Person oder mit einem anderen Computer. Es war diese Ergänzung zu der Frage, die Turing zu beantworten versuchte, aber vielleicht führt sie einen ausreichend hohen Standard ein, um festzustellen, ob eine Maschine so „denken“ kann, wie wir dieses Konzept normalerweise für eine Person bezeichnen.

CAPTCHA ist eine Art umgekehrter Turing-Test. Bevor eine Aktion auf der Website ausgeführt werden kann, wird dem Benutzer ein verzerrtes Bild mit einer Reihe von Zahlen und Buchstaben und einem Angebot zur Eingabe dieser Reihe in ein spezielles Feld präsentiert. Der Zweck dieser Operation besteht darin, zu verhindern, dass automatische Systeme die Website angreifen. Die Begründung für eine solche Operation ist die Tschüss Es gibt keine Programme, die leistungsfähig genug sind, um Text aus einem verzerrten Bild zu erkennen und genau wiederzugeben (oder sie stehen normalen Benutzern nicht zur Verfügung). Daher wird angenommen, dass ein System, das dazu in der Lage war, mit hoher Wahrscheinlichkeit als eine Person angesehen werden kann. Die Schlussfolgerung wird sein (wenn auch nicht notwendigerweise), dass künstliche Intelligenz noch nicht geschaffen wurde.

Turing-Test mit einem Spezialisten

Diese Variation des Tests wird wie folgt beschrieben: Die Antwort der Maschine sollte sich nicht von der Antwort eines Experten - eines Spezialisten auf einem bestimmten Wissensgebiet - unterscheiden. Mit der Entwicklung von Technologien zum Scannen des menschlichen Körpers wird es möglich sein, die notwendigen Informationen aus dem Körper und dem Gehirn in einen Computer zu kopieren.

Test der Unsterblichkeit

Der Immortalitätstest ist eine Variation des Turing-Tests, der feststellt, ob der Charakter einer Person qualitativ übertragen wird, nämlich ob es möglich ist, den kopierten Charakter von dem Charakter der Person zu unterscheiden, die als Quelle diente.

Minimaler intelligenter Signaltest (MIST)

MIST wurde von Chris McKinstry vorgeschlagen. Bei dieser Variante des Turing-Tests sind nur zwei Arten von Antworten erlaubt – „Ja“ und „Nein“. Typischerweise wird MIST verwendet, um statistische Informationen zu sammeln, die verwendet werden können, um die Leistung von Programmen zu messen, die künstliche Intelligenz implementieren.

Turing-Meta-Test

Bei dieser Variante des Tests gilt ein Subjekt (z. B. ein Computer) als empfindungsfähig, wenn es etwas geschaffen hat, das es auf Empfindungsfähigkeit testen möchte.

Hutter-Preis

Die Organisatoren des Hutter-Preises glauben, dass das Komprimieren von Text in natürlicher Sprache eine schwierige Aufgabe für künstliche Intelligenz ist, die dem Bestehen des Turing-Tests gleichkommt.

Der Informationskompressionstest hat gegenüber den meisten Varianten und Variationen des Turing-Tests gewisse Vorteile:

  • Das Ergebnis ist eine einzige Zahl, anhand derer man beurteilen kann, welche der beiden Maschinen "intelligenter" ist.
  • Es ist nicht erforderlich, dass ein Computer einen Richter anlügt – Computern das Lügen beizubringen, gilt als schlechte Idee.

Die Hauptnachteile eines solchen Tests sind:

  • Damit ist es unmöglich, eine Person zu testen.
  • Es ist nicht bekannt, welches Ergebnis (oder ob es überhaupt eines gibt) dem Bestehen des Turing-Tests (auf menschlicher Ebene) entspricht.

Andere Intelligenztests

Es gibt viele Intelligenztests, die verwendet werden, um Menschen zu testen. Es ist möglich, dass sie verwendet werden können, um künstliche Intelligenz zu testen. Einige Tests (wie der C-Test), die von der Kolmogorov-Komplexität abgeleitet sind, werden verwendet, um Menschen und Computer zu testen.

Und gestern bin ich beim Turing-Test durchgefallen: Sie haben mich für einen Computer gehalten! Es war beim Schachspielen www.freechess.org. Generell gibt es im Online-Schach viele Heulsusen, die sich ein wenig bemühen, dem Gegner die Nutzung der Engine vorzuwerfen. Natürlich betrügen viele Leute so, aber ich werde immer ohne jede Grundlage beschuldigt. Manchmal schaue ich in die Debütbibliothek und dann nur auf mich selbst. Wenn es Ihnen gelingt, einen Gegner aus irgendeinem Grund in einer langen Reihe zu erwischen, passiert ihm oft ein heftiger Hintern: Er sagt, eine Person kann so nicht spielen.

Sie können es hier im Viewer vollständig sehen: Karapuzik vs. Schachmeisterrossie, und ich werde jetzt die hellsten Momente separat kommentieren. Tatsache ist, dass mir das Spiel selbst sehr gut gefallen hat und ich damit prahlen möchte. Kontrolle – 5 Minuten pro Spiel plus 5 Sekunden pro Zug.

Dies ist die Stellung, die nach 18 Zügen entstanden ist.

In der Eröffnung spielte Weiß (I) etwas nachlässig, insbesondere ging die Dame d1-b3-d1-g1, viel Zeit ging verloren. Im Allgemeinen steht die Dame auf g1 oder f2 oft in diesem Schema auf, aber normalerweise ist ihr Weg weniger gewunden. Schwarz hat es nur geschafft, den Springer b8-c6-e5-d7 aus den Verlusten zu ziehen, und bereitet sich nun eindeutig auf b6-b5 vor. Das Hauptproblem ist, dass mein Lieblingsplan, den a-Bauern vorzurücken, für Weiß nicht funktioniert: Sein eigener Springer auf a3 ist im Weg. Bis ich es entferne, gibt es keinen aktiven Plan. Und sobald ich es entferne, bekomme ich b5... Dann habe ich ein kombinatorisches Motiv bemerkt und eine Provokation aufgebaut: 19.Sc2 b5? 20.Sb4 Db7.

21.N:a6! F: a6(Ich denke, 21...b4 war besser) 22.c:b5 B:b5 23.N:b5 R:b5 24.a4

Das ist der springende Punkt! Jetzt nimmt Weiß einen ganzen Turm und hat am Ende des Gefechts eine zusätzliche Qualität und einen Bauern übrig. Dann folgte eine ziemlich chaotische Blitzpartie, an deren Ende der Gegner erneut auf einfache Taktiken hereinfiel. Das scheint ihn erwischt zu haben. Nur Computer können Taktiken ausführen, besonders solche komplexen:

34... Lxb4? 35.Tb1 Tb7(das war meine Hoffnung, aber...) 36 a6! Tb5 37.a7, und um den Bauern zu stoppen, muss man den Läufer auf b4 aufgeben.

Dann begann der Gegner langsam zu gehen. Ich schaue - er schreibt mir in Chatik. Schreibt folgendes:

chessmasterrossie sagt: gute Motornutzung
chessmasterrossie sagt: gute Motorauslastungnh5
chessmasterrossie sagt: Solche Computerzüge
chessmasterrossie sagt: Solche Computerzüge
chessmasterrossie sagt: qg1???
chessmasterrossie sagt: als ob ein Mensch das spielen würde
chessmasterrossie sagt: g4?
chessmasterrossie sagt: So ein menschlicher Schachzug!
chessmasterrossie sagt: Wie offensichtlich war das die Verwendung einer Schachengine.
chessmasterrossie sagt: Ich werde eine Beschwerde schicken
Schachmeisterrossie sagt: Beschwerde

Einfach Balsam fürs Herz. =)

15. September 2009 um 20:44 Uhr

Turing-Test

  • Künstliche Intelligenz

Deshalb werden wir heute über den bekanntesten Test zur Bewertung eines sprechenden Bots sprechen - den Turing-Test.

Der Turing-Test ist ein empirischer Test, dessen Idee von Alan Turing in dem Artikel Computing Machinery and Intelligence vorgeschlagen wurde, der 1950 in der philosophischen Zeitschrift Mind veröffentlicht wurde. Turing wollte herausfinden, ob eine Maschine denken kann.
Der Standardklang des Gesetzes: „Wenn ein Computer so arbeiten kann, dass ein Mensch nicht feststellen kann, mit wem er kommuniziert – mit einem anderen Menschen oder mit einer Maschine – gilt er als bestandener Turing-Test“

Intelligente, menschenähnliche Maschinen sind seit vielen Jahrzehnten ein großes Thema in der Science-Fiction. Seit den Anfängen der modernen Computertechnologie beschäftigen sich die Menschen mit der Frage: Ist es möglich, eine Maschine zu bauen, die einen Menschen irgendwie ersetzen könnte? Ein Versuch, eine solide empirische Grundlage zur Lösung dieses Problems zu schaffen, war der von Alan Turing entwickelte Test.
Die erste Version des Tests, die 1950 veröffentlicht wurde, war etwas verwirrend. Die moderne Version des Turing-Tests ist die folgende Aufgabe. Eine Gruppe von Experten kommuniziert mit einem unbekannten Wesen. Sie sehen ihren Gesprächspartner nicht und können mit ihm nur über ein isolierendes System - zum Beispiel eine Tastatur - kommunizieren. Sie dürfen dem Gesprächspartner Fragen stellen und ein Gespräch zu jedem Thema führen. Wenn sie am Ende des Experiments nicht sagen können, ob sie mit einem Menschen oder einer Maschine gesprochen haben, und ob sie tatsächlich mit einer Maschine gesprochen haben, kann davon ausgegangen werden, dass diese Maschine den Turing-Test bestanden hat.
Es gibt mindestens drei Hauptversionen des Turing-Tests, von denen zwei im Artikel „Computing Machines and the Mind“ vorgeschlagen wurden, und die dritte Version, in der Terminologie von Saul Traiger, die Standardinterpretation ist.

Während es einige Debatten darüber gibt, ob die moderne Interpretation dem entspricht, was Turing beschrieben hat, oder das Ergebnis einer Fehlinterpretation seiner Arbeit ist, werden alle drei Versionen nicht als gleichwertig angesehen, ihre Stärken und Schwächen unterscheiden sich.
Simulationsspiel

Wie wir bereits wissen, hat Turing ein einfaches Partyspiel beschrieben, an dem mindestens drei Spieler teilnehmen. Spieler A ist ein Mann, Spieler B ist eine Frau und Spieler C, der als Sprecher auftritt, hat beide Geschlechter. Gemäß den Spielregeln sieht C weder A noch B und kann mit ihnen nur durch schriftliche Nachrichten kommunizieren. Indem er den Spielern A und B Fragen stellt, versucht C herauszufinden, wer von ihnen ein Mann und wer eine Frau ist. Die Aufgabe von Spieler A ist es, Spieler C so zu verwirren, dass er die falsche Schlussfolgerung zieht. Gleichzeitig besteht die Aufgabe von Spieler B darin, Spieler C dabei zu helfen, ein richtiges Urteil zu fällen.

In dem, was S. G. Sterret den Original Imitation Game Test nennt, schlägt Turing vor, dass die Rolle von Spieler A von einem Computer gespielt wird. Die Aufgabe des Computers besteht also darin, vorzugeben, eine Frau zu sein, um Spieler C zu verwirren. Der Erfolg einer solchen Aufgabe wird abgeschätzt, indem die Ergebnisse des Spiels verglichen werden, wenn Spieler A ein Computer ist, und die Ergebnisse, wenn Spieler A ein Computer ist Mann. Wenn, wie Turing es ausdrückt, „der Spieler, der das Gespräch führt, nachdem er ein Spiel [mit einem Computer] gespielt hat, genauso oft die falsche Entscheidung trifft wie nach einem Spiel mit einem Mann und einer Frau“, dann kann man sagen, dass der Computer intelligent ist .

Die zweite Option wird von Turing im selben Artikel vorgeschlagen. Die Rolle von Spieler A wird wie im Eingangstest von einem Computer übernommen. Der Unterschied besteht darin, dass die Rolle von Spieler B sowohl von einem Mann als auch von einer Frau gespielt werden kann.

„Schauen wir uns einen bestimmten Computer an. Stimmt es, dass es möglich ist, indem man diesen Computer so modifiziert, dass er genügend Speicherplatz hat, seine Geschwindigkeit erhöht und ihm ein geeignetes Programm gibt, einen Computer so zu entwerfen, dass er die Rolle des Spielers A in einem Simulationsspiel zufriedenstellend erfüllt, während die Rolle des Spieler B macht ein Mann?“ Turing, 1950, S. 442.

Bei dieser Variante versuchen sowohl Spieler A als auch B, den Anführer zu einer falschen Entscheidung zu überreden.

Die Hauptidee dieser Version ist, dass der Zweck des Turing-Tests nicht darin besteht, die Frage zu beantworten, ob eine Maschine den Host täuschen kann, sondern die Frage, ob eine Maschine eine Person imitieren kann oder nicht. Obwohl darüber diskutiert wird, ob diese Option von Turing beabsichtigt war oder nicht, glaubt Sterrett, dass diese Option von Turing impliziert wurde, und kombiniert daher die zweite Option mit der dritten. Gleichzeitig glaubt eine Gruppe von Gegnern, darunter Trager, nicht daran. Aber es führte immer noch zu dem, was man die "Standardinterpretation" nennen könnte. In dieser Version ist Spieler A ein Computer, Spieler B ist eine Person beliebigen Geschlechts. Die Aufgabe des Präsentators besteht nun nicht darin, zu bestimmen, wer von ihnen ein Mann und eine Frau ist, sondern wer von ihnen ein Computer und wer ein Mensch ist.

Turing im Jahr 2012

Ein spezielles Komitee wurde eingerichtet, um Aktivitäten zur Feier des 100. Geburtstags von Turing im Jahr 2012 zu organisieren, dessen Aufgabe es ist, Turings Botschaft über eine empfindungsfähige Maschine, die sich in Hollywood-Filmen wie Blade Runner widerspiegelt, der breiten Öffentlichkeit, einschließlich Kindern, zu vermitteln. Ausschussmitglieder: Kevin Warwick, Vorsitzender, Huma Shah, Koordinator, Ian Bland, Chris Chapman, Marc Allen, Rory Dunlop, Loebner Robbie Award Winners Garnet und Fred Roberts. Das Komitee wird unterstützt von Women in Technology und Daden Ltd.

Der Turing-Test ist, wie der Name schon sagt, ein von Alan Turing vorgeschlagener Test, um festzustellen, ob eine Maschine intelligent ist. Turing entschied, dass es keinen Sinn habe, eine umfangreiche Liste von Anforderungen zu entwickeln, die für die Schaffung künstlicher Intelligenz notwendig sind, die außerdem widersprüchlich sein könnten, und schlug einen Test vor, der darauf basiert, dass das Verhalten eines Objekts mit künstlicher Intelligenz schließlich sein würde ununterscheidbar vom Verhalten solch unbestreitbar intelligenter Wesen wie Menschen. Ein Computer besteht den Turing-Test, wenn ein menschlicher Experimentator, der ihm bestimmte Fragen schriftlich gestellt hat, nicht feststellen kann, ob die schriftlichen Antworten von einer anderen Person oder von einem Gerät stammen. Im Moment erfordert das Schreiben eines Programms für einen Computer, um den Turing-Test zu bestehen, viel Arbeit. Ein auf diese Weise programmierter Computer muss Folgendes enthalten:

  • Natural Language Processing (NLP)-Textverarbeitungstools, mit denen Sie erfolgreich mit einem Computer kommunizieren können, beispielsweise auf Englisch;
  • Wissensrepräsentation Mittel, mit denen ein Computer das Gelernte oder Gelesene im Gedächtnis speichern kann;
  • Mittel zur automatischen Bildung logischer Schlussfolgerungen, die die Möglichkeit bieten, gespeicherte Informationen zu verwenden, um Antworten auf Fragen zu finden und neue Schlussfolgerungen zu ziehen;
  • maschinelle Lernwerkzeuge, mit denen Sie sich an neue Umstände anpassen sowie Anzeichen von Standardsituationen erkennen und extrapolieren können.

Beim Turing-Test wird die direkte physische Interaktion von Experimentator und Computer bewusst ausgeschlossen, da die Schaffung künstlicher Intelligenz keine physische Nachahmung einer Person erfordert. Beim sogenannten Turing-Vollständigen-Test wird jedoch die Verwendung eines Videosignals verwendet, damit der Experimentator die Wahrnehmungsfähigkeit des Testobjekts überprüfen und auch physische Objekte "in unvollständiger Form" darstellen kann (bestanden sie "durch Schlüpfen").

Turing sagte voraus, dass Computer seinen Test schließlich bestehen würden. Er glaubte, dass bis zum Jahr 2000 ein Computer mit einem Speicher von 1 Milliarde Bit (ca. 119 MB) in einem 5-Minuten-Test die Jury in 30 % der Fälle täuschen könnte.

Diese Vorhersage hat sich nicht bewahrheitet. Turing sagte auch voraus, dass der Ausdruck „Denkmaschine“ kein Widerspruch in sich sein würde und dass Computerlernen eine wichtige Rolle beim Bau leistungsfähiger Computer spielen würde (womit die meisten modernen Forscher übereinstimmen).

Bisher hat kein Programm auch nur annähernd den Turing-Test bestanden. Programme wie ELIZA ließen die Leute manchmal glauben, dass sie mit einer Person sprachen, wie in einem informellen Experiment namens AOLiza. Aber solche „Erfolge“ bestehen den Turing-Test nicht. Erstens hatte die Person in solchen Gesprächen keinen Grund zu der Annahme, dass sie mit dem Programm sprach, während die Person im echten Turing-Test aktiv versucht, festzustellen, mit wem sie spricht. Zweitens beziehen sich dokumentierte Fälle normalerweise auf solche Chats, in denen viele Gespräche lückenhaft und bedeutungslos sind. Drittens verwenden viele Chat-Benutzer Englisch als Zweit- oder Drittsprache, und die bedeutungslose Antwort des Programms wird ihnen wahrscheinlich als Sprachbarriere zugeschrieben. Viertens wissen viele Benutzer nichts über Elise und ähnliche Programme und können die völlig unmenschlichen Fehler, die diese Programme machen, nicht erkennen.

Jedes Jahr gibt es einen Wettbewerb zwischen sprechenden Sendungen und den menschenähnlichsten, so die Jury, wird der Lebner-Preis verliehen. Es gibt auch einen zusätzlichen Preis für ein Programm, von dem die Jury glaubt, dass es den Turing-Test besteht. Dieser Preis wurde noch nicht vergeben. Das beste Ergebnis zeigte der A.L.I.C.E. 3-maliger Gewinn des Loebner-Preises (2000, 2001 und 2004).

Trotz der Tatsache, dass mehr als 50 Jahre vergangen sind, hat der Turing-Test nicht an Bedeutung verloren. Aber derzeit lösen Forscher der künstlichen Intelligenz das Problem des Bestehens des Turing-Tests praktisch nicht, da sie glauben, dass es viel wichtiger ist, die Grundprinzipien der Intelligenz zu studieren, als einen der Träger natürlicher Intelligenz zu duplizieren. Insbesondere das Problem des "künstlichen Fluges" wurde erst erfolgreich gelöst, nachdem die Brüder Wright und andere Forscher aufgehört hatten, Vögel zu imitieren und begannen, sich mit der Aerodynamik zu beschäftigen. In wissenschaftlichen und technischen Arbeiten zur Luftfahrt wird das Ziel dieses Wissensgebiets nicht definiert als „die Schaffung von Maschinen, die in ihrem Flug so sehr an Tauben erinnern, dass sie sogar echte Vögel täuschen können“.