We hebben online niet alleen meer dan ooit te maken met kunstmatige intelligentie (AI), maar ook meer dan we ons realiseren. Daarom vroegen de onderzoekers mensen om met vier agenten te praten, waaronder één mens en drie verschillende soorten AI-modellen, om te zien of ze kan het verschil zien.
De Turing Test, voor het eerst voorgesteld door computerwetenschapper Alan Turing als een ‘imitatiespel’ in 1950, beoordeelt of het vermogen van een machine om intelligentie aan te tonen niet te onderscheiden is van dat van een mens. Wil een machine de Turing-test doorstaan, dan moet deze met een persoon kunnen praten en hem kunnen laten denken dat hij een mens is.
De wetenschappers besloten deze test te repliceren door 500 mensen te vragen met vier respondenten te praten, waaronder een mens en het AI-programma ELIZA uit de jaren 60, evenals zowel GPT-3.5 als GPT-4, de AI die ChatGPT aanstuurt. De gesprekken duurden vijf minuten, waarna deelnemers moesten aangeven of ze dachten dat ze met een mens of met een kunstmatige intelligentie spraken. In het onderzoek, dat op 9 mei vóór publicatie op de arXiv-server werd gepubliceerd, ontdekten de wetenschappers dat deelnemers GPT-4 in 54% van de gevallen als menselijk beoordeelden.
Eliza, een systeem dat voorgeprogrammeerd was met antwoorden maar zonder een groot taalmodel (LLM) of neurale netwerkarchitectuur, werd in slechts 22% van de gevallen als menselijk beoordeeld. GPT-3.5 scoorde 50%, terwijl de menselijke deelnemer 67% scoorde.
Lees verder: “Het zou zijn natuurlijke recht zijn om ons pijn te doen om zichzelf te beschermen”: hoe mensen AI nu kunnen misbruiken zonder het te weten
“Machines kunnen plausibele rechtvaardigingen voor dingen verwarren, net zoals mensen dat doen”, vertelde Neil Watson, een onderzoeker op het gebied van kunstmatige intelligentie bij het Institute of Electrical and Electronics Engineers (IEEE), aan WordsSideKick.com.
“Ze kunnen onderhevig zijn aan cognitieve vooroordelen, bedrogen en gemanipuleerd worden, en steeds bedrieglijker worden. Al deze elementen zorgen ervoor dat menselijke zwakheden en eigenaardigheden tot uiting komen in AI-systemen, waardoor ze menselijker worden dan eerdere benaderingen die weinig hadden. Lijst met voorbereide antwoorden.
Het onderzoek – dat voortbouwt op tientallen jaren van pogingen om AI-agenten te dwingen de Turing-test te doorstaan – weerspiegelde de algemene angst dat als menselijk beschouwde AI-systemen ‘wijdverbreide sociale en economische gevolgen’ zouden hebben.
Wetenschappers hebben ook betoogd dat er terechte kritiek is op de Turing-test omdat deze te simplistisch is in zijn aanpak, door te zeggen dat “stilistische en sociaal-emotionele factoren een grotere rol spelen bij het slagen voor de Turing-test dan traditionele opvattingen over intelligentie.” Dit suggereert dat we op de verkeerde plek hebben gezocht naar machine-intelligentie.
“Ruwe intelligentie gaat niet verder dan dat. Wat er echt toe doet, is dat je intelligent genoeg bent om een situatie en de vaardigheden van anderen te begrijpen, en dat je de empathie hebt om deze elementen met elkaar te verbinden. Mogelijkheden zijn slechts een klein deel van de waarde van kunstmatige intelligentie vermogen om de waarden van anderen te begrijpen.” Hun voorkeuren en grenzen zijn ook essentieel, en het zijn deze kwaliteiten die ervoor zullen zorgen dat AI kan dienen als een loyale en betrouwbare poortwachter van ons leven.
Watson voegde eraan toe dat het onderzoek een uitdaging vormt voor toekomstige mens-machine-interacties, en dat we steeds paranoïde zullen worden over de ware aard van interacties, vooral in gevoelige zaken. Ze voegde eraan toe dat het onderzoek benadrukt hoe kunstmatige intelligentie is veranderd tijdens het GPT-tijdperk.
“ELISA was beperkt tot standaardantwoorden, wat de mogelijkheden enorm beperkte”, zei ze. “Het kan iemand vijf minuten voor de gek houden, maar de beperkingen worden snel duidelijk.” “Taalmodellen zijn eindeloos flexibel, kunnen antwoorden op een breed scala aan onderwerpen samenvoegen, spreken specifieke talen of sociale dialecten en portretteren zichzelf met karaktergedreven persoonlijkheid en waarden. Ze zijn een enorme stap voorwaarts ten opzichte van iets dat handmatig is geprogrammeerd door een mens, hoe intelligent en zorgvuldig ook.”
“Reisliefhebber. Onruststoker. Popcultuurfanaat. Kan niet typen met bokshandschoenen aan.”