De nieuwe versie van ChatGPT: krachtig, maar ook bedenkelijk

Maandagavond is de nieuwe versie van ChatGPT, gebaseerd op GPT-4o, beschikbaar gekomen voor gebruikers. Deze applicatie heeft verder aan kracht gewonnen. De potentie voor leren, opleiden en onderwijs is vergroot. Maar er zitten ook enkele bedenkelijke kanten aan deze versie.

Tutoring door ChatGPT — Still uit video met Sal Khan en zijn zoon

GPT-4o -de ‘o’ staat voor ‘omni’- biedt verbeteringen in snelheid en functies voor tekst, spraak en beeldverwerking. Gebruikers kunnen volgens OpenAI nu bijvoorbeeld foto’s van menukaarten in vreemde talen uploaden en het model gebruiken om deze te vertalen en meer te leren over de gerechten. Verbeterde taalvaardigheden beïnvloeden kwaliteit en snelheid. Het model ondersteunt nu meer dan 50 talen. Dat betekent, en het is ook mijn eerste ervaring, dat de kwaliteit van de output beter is geworden. Binnenkort wordt bovendien de Voice Mode gelanceerd, waarmee gebruikers in realtime via spraak of video met ChatGPT kunnen communiceren (real-time multimodal conversation). ChatGPT kan daarbij schijnbaar ook emoties herkennen, en de omgeving van de gebruiker in zich opnemen. Je kunt nu al video’s bekijken waaruit onder meer blijkt dat ChatGPT met een leerling mee kan kijken en feedback kan geven als deze de sinus van een driehoek moet berekenen.

Ook gebruikers van de gratis versie van ChatGPT krijgen toegang tot GPT-4o, zij het met een beperkter aantal berichten (5x minder dan betaalde gebruikers, maar nog steeds zo’n 15 berichten per drie uur). De update van de gratis versie kent ook nieuwe functies, zoals data-analyse, het uploaden van bestanden voor hulp bij samenvatten en schrijven, het kunnen gebruiken -niet zelf maken van GPT’s- en interactie met foto’s. Deze functies waren al langer beschikbaar voor betaalde gebruikers.

Verder introduceert OpenAI een nieuwe desktopapp voor macOS, die een naadloze integratie belooft met dagelijkse computeractiviteiten. Deze app ondersteunt spraakgesprekken via een eenvoudige sneltoets en zal later ook voor Windows beschikbaar komen.

Tot slot is de interface van ChatGPT vernieuwd om gebruiksvriendelijker te zijn en, zoals gezegd, converseren via spraak mogelijk te maken. Voor meer info bekijk de opname van de lancering van GPT-4o.

In Is teaching becoming obsolete with GPT4o? Do we now have a UNIVERSAL TEACHER? bespreekt Donald Clark de mogelijke invloed van de nieuwe versie van ChatGPT op leren, opleiden en onderwijs. Hij beschrijft treffend de kracht en potentie voor leren, opleiden en onderwijs die ik ook in GPT-4o zie. Al durf ik -anders dan Donald- geen uitspraken te doen over de ‘revolutionaire’ gevolgen van deze toepassing. ‘Revoluties’ binnen het onderwijs als gevolg van technologie zijn immers vaak voorspeld, maar tot nu altijd uitgebleven.

Clark stelt dat het concept van de ‘universele docent’ hiermee sneller dan verwacht werkelijkheid lijkt te worden. Daarbij gaat het om een AI-toepassing die gratis, persoonlijk en in elke taal lesgeeft. Deze AI-toepassing kan dan spreken, luisteren, handschrift lezen, feedback geven en multimedia gebruiken.

Wat Clark vooral verraste bij de lancering van GPT-4o, is de snelheid waarmee deze ontwikkelingen zijn doorgevoerd. Tijdens de demonstratie van de nieuwe versie van ChatGPT liet OpenAI een zeer geavanceerde, gebruiksvriendelijke tutor zien. Deze AI-tutor kan realtime spraak begrijpen, emoties herkennen en gezichtsuitdrukkingen interpreteren. Dit betekent dat lerenden een dialoog kunnen voeren met de AI-tutor, vergelijkbaar met een echte docent. De AI-tutor kan in verschillende stijlen spreken – van grappig tot serieus – en klinkt daarbij buitengewoon realistisch.

Clark geeft in zijn bijdrage enkele praktijkvoorbeelden van hoe deze technologie werkt. In één voorbeeld wordt een wiskundeprobleem opgelost waarbij de lerende zijn handgeschreven vergelijking toont aan zijn smartphone. De AI-tutor begeleidt de lerende stap voor stap door de oplossing van de vergelijking, geeft hints en relevante feedback, en feliciteert de lerende bij elke juiste stap. Dit soort interactie zorgt volgens Clark voor een geduldige en persoonlijke leerervaring die zich aanpast aan het tempo van de lerende. Een andere toepassing is het onmiddellijk vertalen van een gesproken vreemde taal zodat conversaties tussen twee personen die een andere taal spreken gemakkelijker verlopen.

Een van de sterke punten van de nieuwe GPT-40 is volgens Clark het vermogen om multimodaal onderwijs te bieden. Dit betekent dat de AI-toepassing niet alleen tekst kan lezen en begrijpen, maar ook afbeeldingen en video’s kan herkennen. In een ander voorbeeld helpt de AI een lerende met een programmeerprobleem door de geschreven code op het scherm te begrijpen en stap voor stap uitleg te geven. De AI kan ook gegevensvisualisaties interpreteren en uitleggen, wat het leren van complexe onderwerpen zoals data-analyse vergemakkelijkt.

Een andere innovatie is de mogelijkheid van real-time vertaling. Dit betekent dat een docent in één taal kan lesgeven en feedback in een andere taal kan geven. Dit is vooral nuttig voor mensen die een tweede taal leren. Deze functie opent nieuwe mogelijkheden voor taalonderwijs en internationale communicatie.

Clark concludeert dat GPT-4 een significante verbetering is ten opzichte van zijn voorgangers. Er is volgens hem sprake van een enorme sprong voorwaarts op het gebied van gebruiksgemak in dialoog en intelligentie met een lage latentie. Dit is nodig voor de soepele dialoog bij doceren en begeleiden. De nieuwe versie van ChatGPT redeneert volgens hem via tekst, spraak en beeld, waardoor de onderwijservaring lijkt op een echte menselijke docent.

Mijn kanttekeningen bij deze versie

OpenAI heeft met deze versie nadrukkelijk weer een voorsprong verkregen in de ‘ratrace’ met de concurrenten. Het is indrukwekkend wat deze toepassing kan. Dat belooft wat voor de toekomst. Voor een deel zal de potentie echter nog aangetoond moeten worden. Het converseren via meerdere modaliteiten is nog niet beschikbaar, laat staan dat we er ervaringen mee hebben opgedaan (en kracht en zwaktes hebben kunnen ontdekken). Bij het gebruik van emoties vraag ik me bijvoorbeeld het volgende af: is ChatGPT ook in staat om op basis van waargenomen emoties te handelen? Want hoe authentiek, oprecht en zelfs ethisch is het als ChatGPT bijvoorbeeld ‘verwarring’ bij een lerende waarneemt, maar niet in staat bent om daar iets mee te doen (terwijl de lerende dat wel mag verwachten)? Is dan geen sprake van ‘fake tutoring’?

Verder is ChatGPT nog steeds in staat om onzin te verkopen of vooroordelen te hebben. Als ChatGPT dit doet in een gesproken dialoog, dan kan ChatGPT nog overtuigender overkomen, waardoor je eerder de kans loopt als gebruiker de mist in te gaan. Het is ook lastiger om gesproken tekst te verifiëren dan een geschreven tekst. Tenzij je van de gesproken tekst weer een uitgeschreven tekst maakt.Je moet je dus nog meer bewust zijn van mogelijke onzin als output en ‘bias’.

Daarnaast registreert deze nieuwe versie gezichtsuitdrukkingen en de fysieke omgeving waarin de gebruiker zich bevindt, indien de gebruiker converseert via video. Daarmee worden bijzondere persoonsgegevens en andere privacygevoelige data verwerkt. Vanuit het oogpunt van privacy kan dit een nachtmerrie worden. Herinner je je nog de studenten die bezwaar maakten tegen online proctoring omdat de computer hun slaap/studeerkamer inkeek? Organisaties mogen deze toepassing vanwege de AVG dan ook niet gebruiken. Individuen wel. Maar wees je als individu bewust van privacy risico’s. Wat gebeurt er met die data? Tijdens de presentatie leek OpenAI zich bewust van de risico’s. Maar ze werken hard, samen met diverse organisaties aan het beperken van die risico’s. Alweer en nog steeds, denk ik dan.

Daar komt bij dat ik me afvraag wat deze versie gaat doen met de afhankelijkheid van AI voor feedback (eerder aangetoond door onderzoek). Het klakkeloos overnemen van feedback wordt trouwens wel moeilijker gemaakt. Bovendien kost het converseren via video waarschijnlijk erg veel energie. Meer dan de eerdere versies van ChatGPT en andere generatieve AI-toepassingen.

Mijn belangrijkste kritiekpunt is dan ook dat OpenAI de nieuwe versie van ChatGPT nauwelijks heeft benut om bestaande tekortkomingen -zoals het genereren van onzin, ‘bias’ en het energieslurpen- aan te pakken. Waarschijnlijk omdat men hiermee geen voorsprong krijgt in de competitie met concurrenten zoals Google, Meta en Anthropic. Een gemiste kans, die weinig vertrouwen schept in de toekomst als het gaat om maatschappelijk verantwoordelijk gedrag van deze big tech-speler.

Mijn bronnen over (generatieve) artificiële intelligentie

Deze pagina bevat al mijn bijdragen over (generatieve) artificiële intelligentie, zoals ChatGPT.

2 reacties

Chatgpt Nederlands schreef:

17 mei 2024 om 05:21

Wilfred, jouw analyse van de mogelijkheden van GPT-4o en de ethische overwegingen zijn precies goed. Het is fascinerend om te zien hoe snel AI evolueert, en ik waardeer je genuanceerde kijk op zowel het potentieel voor onderwijs als de noodzaak om kritisch na te denken over het gebruik ervan. Ik ben vooral geïntrigeerd door het idee om AI te gebruiken om leerervaringen te personaliseren en er tegelijkertijd voor te zorgen dat het de menselijke interactie aanvult en niet vervangt. Bedankt voor dit inzichtelijke artikel!
Wilfred Rubens schreef:

17 mei 2024 om 06:02

Graag gedaan.

Geef een reactie