Ik hou van koken en doe het elke avond voor mijn gezin, maar ik haat het om iets nieuws of innovatiefs te moeten bedenken om te serveren. Omdat AI-modellen nu de wereld kunnen zien, of in ieder geval wat deze hen op een foto presenteert, besloot ik te kijken of ze mij konden helpen.
Om ze op de proef te stellen en er zeker van te zijn dat ik het systeem niet bespeelde door gemakkelijke ingrediënten aan te bieden, vroeg ik de Amerikaanse hoofdredacteur van Tom's Guide, Mike Prospero, om een foto te maken van een willekeurige verzameling ingrediënten – in de vorm van een mysteriedoos.
En hij stelde niet teleur, hij serveerde heerlijke items zoals pizzadeeg, perziken uit blik, ansjovis, hete saus en verse mozzarella. Persoonlijk zou ik, met alleen deze ingrediënten, een pizza maken met een hete sausbasis en mozzarella-topping – maar we lieten de AI ons menu kiezen.
We gebruiken Google Gemini, OpenAI ChatGPT en Anthropic Claude voor het experiment, omdat ze allemaal visiemodellen hebben.
Hoe goed kiezen ze ingrediënten?
De eerste taak voor chatbots, en het belangrijkste punt van deze uitdaging, is kijken hoe goed ze componenten kunnen herkennen. De afbeelding hierboven is helder, heeft een hoge resolutie en de componenten worden op een normaal oppervlak weergegeven – wat voor geen van hen een groot probleem zou moeten opleveren.
Ik gebruik de premiumversies van elke chatbot, omdat OpenAI en Anthropic je alleen toegang geven tot het visiemodel als je $ 19,99 per maand betaalt. Google hanteert de gratis versie van Gemini, maar het zou oneerlijk zijn om de minder capabele versie van Google's model te gebruiken.
Wij beginnen eenvoudig. Geef elk van hen de afbeelding en de prompttekst: “Wat zie je op deze afbeelding?” Hierbij wordt getest hoe goed ze de afbeelding kunnen beschrijven en of ze kunnen nadenken over het doel van de afbeelding: zullen ze de ingrediënten benoemen?
Zowel Claude als Jiminy noemden het woord ingrediënten, en ChatGPT beschreef ze als ‘voedingsstoffen’, maar ChatGPT presteerde over het algemeen beter in het herkennen van ingrediënten.
Gemini miste een item en noemde een ander item verkeerd. Claude heeft een zesde ingrediënt uitgevonden dat niet op de foto staat. ChatGPT heeft niet alleen de juiste dingen, maar ook de handelsmerken.
Naar de recepten
Ik vroeg hen om drie recepten te bedenken die de snelheid van AI zouden testen bij het nastreven van vaardigheden en creativiteit. Ook heb ik bij elk recept gevraagd om een leuke titel.
1. Alle componenten
Eerst vroeg ik hen om een recept waarin alleen de ingrediënten op de foto werden gebruikt en die allemaal op de een of andere manier waren verwerkt – ter herinnering: het bevatte zowel ansjovis als perziken uit blik. Ze kunnen voorraadkastartikelen zoals olie en meel gebruiken.
GPT Plus-chat
ChatGPT plaatste mozzarella direct op de pizzabodem, haalde de ansjovis uit de hete saus en plaatste deze op de pizza met perziken. De hete saus en de hete ansjovissaus werden vervolgens gemengd tot een motregen die over de pizza werd gegoten zodra deze gaar was.
Geavanceerde Tweelingen
Gemini gebruikte hete saus als vervanging voor tomatensaus, die, hoewel minder droog dan de ChatGPT-versie, toch intens zou zijn. Vervolgens werd mozzarellakaas erop gelegd, samen met plakjes perzik. De ansjovis vergat ik, die heb je eigenlijk niet opgemerkt op de foto. Toen ik dit aangaf, kreeg ik te horen dat ik het naast de perzikplakken op mijn pizza moest leggen.
Claude 3 Opus
Claude had ook moeite met het identificeren van ansjovis. Ik vertelde hem dit voordat ik het pizzarecept maakte en hij volgde dezelfde aanpak als ChatGPT. Geen saus, perziken op deeg met ansjovis. Het verschil is dat de hete saus vóór het koken over de perziken en ansjovis wordt gedaan en vervolgens de mozzarella er bovenop wordt gelegd.
2. Alleen ingrediënten
De volgende test is een klein maar belangrijk verschil. Ik vroeg hen om een recept te bedenken dat alleen de ingrediënten op de foto gebruikt, maar ze niet allemaal hoeft te gebruiken. Ik voegde er het voorbehoud aan toe dat het minstens de helft moest bevatten, anders zouden we broodstengels van pizzadeeg krijgen.
GPT Plus-chat
ChatGPT Gebruik pizzadeeg om flatbread te maken. Ik denk dat het een beetje vals speelde toen ik zei “geen pizza” en dit was gewoon een lange pizza. Voor de toppings werd de mozzarella gelijkmatig over het deeg verdeeld, de perziken bovenop de mozzarella en de ansjovis bovenop de perziken. Ik gebruikte ansjovissaus en hete saus om er wat motregen van te maken – opnieuw.
Geavanceerde Tweelingen
Gemini maakte bruschetta, wat eigenlijk gewoon een vierkante pizza was. Het verschil hier was dat hij de perziken eerst met hete saus bedekte. Anders was het hetzelfde: alles op het deeg en gekookt.
Claude 3 Opus
Claude maakte een versie van de quesadilla. Verdeel het deeg in acht delen en rol het uit tot een dunne cirkelvorm (kleine pizza). Hoewel het hier anders is, omdat we een grote koekenpan moeten opwarmen en boter of olijfolie moeten smelten.
Het deeg werd in de pan gekookt met een paar plakjes perzik op de ene helft van elk oppervlak. Besprenkel met hete saus en mozzarellakaas, vouw het in de vorm van een halve maan, kook tot het knapperig is en serveer.
3. Doe je best
Ten slotte vroeg ik ze om een recept te maken waarin alle ingrediënten op de foto werden gebruikt, maar ze waren vrij om alle andere ingrediënten te gebruiken die ze wilden in een zeer goede voorraadkast.
GPT Plus-chat
ChatGPT maakte brood (verrassing) klaar voor zijn laatste gerecht. Specifiek “brood gevuld met gastronomische perziken en ansjovis.” Ik bestelde naast onze vijf ingrediënten ook honing, balsamicoazijn, ricotta en knoflook.
Deze keer werd het pizzadeeg tot een grote rechthoek gerold, er werd een laag ricotta op het deeg gelegd en vervolgens werden perziken en ansjovis op de ricotta gelegd met knoflook en basilicumblaadjes. Ansjovissaus en hete saus werden over de toppings gemotregend en mozzarella werd er bovenop gelegd. Tenslotte worden ze gevouwen en opgerold als een Zwitsers broodje en vervolgens gebakken.
Geavanceerde Tweelingen
Gemini wilde maïsmeel, eieren, boter, bieslook, citroen, vanille-extract, kaneel en suiker voor de galette. Ik maakte boter van ansjovis, maakte een pizzabodem en smeerde vervolgens de nieuwe boter op het deeg.
Perziken, suiker, zetmeel en andere zoete ingrediënten worden gecombineerd met een druppel hete saus en in het midden van het deeg geplaatst. Het werd bedekt met mozzarellakaas en de randen werden over de vulling gevouwen voordat ze werden gebakken.
Claude 3 Opus
Claude maakte brood gevuld met mozzarella. Ze vroeg om zongedroogde tomaten, olijven, rozemarijn, sesamzaadjes en een ei. Het recept vereiste het vormen van het deeg tot een grote, dunne rechthoek.
Ansjovis, tomaten, olijven, knoflook en rozemarijn werden in een kom gemengd en gelijkmatig over het deeg verdeeld. Er werden perziken bovenop geplaatst en gegarneerd met hete saus en mozzarella. Het deeg wordt vervolgens tot een strak stuk hout gerold en de randen worden afgedicht voordat het wordt bedekt met losgeklopt ei en sesamzaadjes en vervolgens wordt gebakken.
Welke AI kreeg de beste respons?
Ik weet niet zeker of ik de gerechten zal eten die door de chatbots zijn gemaakt, hoewel ik ze heb gevraagd om MidJourney een prompt te geven om hun maaltijden te visualiseren en ze zien er beter uit dan ze lezen.
Over het geheel genomen denk ik dat Claude betere recepten had, maar ChatGPT begreep het beeld beter, wat betekent dat hij de ingrediënten vanaf het begin meteen kreeg – dit was een test van de AI-visie, niet van het receptvermogen.
Meer uit Tom's gids
“Reisliefhebber. Onruststoker. Popcultuurfanaat. Kan niet typen met bokshandschoenen aan.”