30 apr De prompt engineer en annotator
Nieuwe beroepen en bouwers van ChatGPT
Op 3 april (in Leiden bij De Clercq advocaten) en 13 april 2023 (webinar) hebben de KNVI en de Vri bijeenkomsten georganiseerd om de technieken achter de razend populaire kunstmatig intelligente chatbot ChatGPT beter te kunnen begrijpen. De KNVI en Vri zijn (beroeps)verenigingen van en voor professionals die werken in de digitalisering. Beide verenigingen stimuleren actieve kennisontwikkeling o.a. door ontmoetingen. De Vri beheert tevens het register van gecertificeerde informatici. Borging van kwaliteit en ethiek zijn belangrijke speerpunten bij certificering. Vanwege de grote invloed op maatschappelijk welzijn en duurzaamheid van digitalisering pleit de Vri voor meer gecertificeerde professionals.
Centraal bij beide bijeenkomsten in april stond de presentatie van Piek Vossen over technieken achter ChatGPT. Piek is hoogleraar aan de Vrije Universiteit van Amsterdam en expert op het gebied van Large Language Modellen (LLM), een van de technieken waarop ChatGPT is gebaseerd. Volgens ChatGPT: “een large language model gebruikt statistiek om te voorspellen welke woorden het meest waarschijnlijk in een bepaalde context worden gebruikt. Dit wordt gedaan door middel van een taalmodel, dat een schatting maakt van de kans dat een bepaalde zin of woordcombinatie voorkomt in een bepaalde taal. Door statistische analyse te gebruiken, kan een large language model de waarschijnlijkheid van verschillende woorden in verschillende contexten schatten en op die manier een betekenisvolle en natuurlijk klinkende zin produceren.” Dit vermogen noemt men het generatieve aspect van LLM’s.
In zijn presentatie verwijst Piek ook naar een aantal (voor de meeste mensen) nieuwe beroepen zoals de prompt engineer en annotator. Bouwers van kunstmatig intelligente systemen zoals ChatGPT zorgen voor een grote maatschappelijke impact is de verwachting. “300 miljoen banen worden geraakt” en de arbeidsmarkt wordt hierdoor “op zijn kop gezet” melden media zoals het fd.
Wat doen een prompt engineer en annotator eigenlijk? Opnieuw ChatGPT: “Een prompt engineer is verantwoordelijk voor het bedenken en optimaliseren van prompts binnen een LLM, zodat het LLM betere resultaten kan genereren op specifieke taken.” Prompts zijn specifieke taken zoals: vragen stellen; opdrachten geven; instructies geven en specifieke informatie opvragen. “Deze prompts kunnen worden gebruikt in verschillende contexten en kunnen dienen als uitgangspunt voor het genereren van tekst of het uitvoeren van taken binnen een LLM. Het is belangrijk dat de prompts goed zijn geformuleerd, zodat het LLM de juiste input ontvangt en de gewenste output kan genereren.”
Een andere functie is die van (data) annotator. ChatGPT zelf geeft wederom uitleg: “Data annotatie heeft raakvlakken met ethiek omdat de kwaliteit en nauwkeurigheid van de geannoteerde gegevens van invloed zijn op de prestaties van het machine learning-model. Als de gegevens vertekend, bevooroordeeld of onvolledig zijn, kan het model onnauwkeurige resultaten opleveren en kan dit leiden tot onbedoelde gevolgen of discriminatie. Bij het annoteren van gegevens is het belangrijk om aandacht te besteden aan de kwaliteit van de gegevens en om de privacy en veiligheid van de gegevens te waarborgen. Het is belangrijk om ervoor te zorgen dat de annotatie van gegevens ethisch verantwoord is en rekening houdt met de mogelijke impact van de technologie op de samenleving en individuele gebruikers.” Volgens de presentatie van Piek (slide 25) werken ongeveer 40 annotators aan ChatGPT. Zij bepalen in feite wat goed of slecht, geoorloofd en niet-geoorloofd is bij de output van ChatGPT. 40 mensen die voor meer dan 100 miljoen gebruikers (april 2023) dicteren wat ethisch verantwoord is, wat mag en niet mag, wat bijvoorbeeld discriminatie is en wat niet!
Andere beroepen die door de ontwikkelingen van LLM’s en AI in belang toenemen zijn Natural Language Processing experts. Deze zijn gespecialiseerd in de technologie die wordt gebruikt om LLM’s te ontwikkelen en te verbeteren. AI trainers zijn verantwoordelijk voor het trainen van LLM’s, zodat ze optimaal kunnen presteren bij specifieke taken. AI onderzoekers doen onderzoek naar nieuwe technieken om de nauwkeurigheid en efficiëntie van LLM’s te verbeteren, en werken aan het oplossen van problemen zoals vooroordelen en beperkte context begrip. Vertalers zijn nodig om de door LLM gegeneerde vertalingen te controleren en te corrigeren om een hogere kwaliteit te garanderen. En ja: deze laatste alinea is ook voor een groot deel door ChatGPT zelf gegenereerd.
Eerdere artikelen over ChatGPT:
- Wat weet een chatbot van het Rijnlands werken?
- Is ChatGPT geloofwaardiger dan Maarten van Rossem?
- Beschaafde digitalisering versus kapitalisme
- De emotionele intelligentie van ChatGPT
Dit artikel is ook gepubliceerd op ManagementSite: De prompt engineer en annotator.
Over de “auteur”
Leon Dohmen is consultant bij DiVetro en hij heeft een column op ManagementSite. “De vraag is niet óf we een bepaalde innovatie willen in onze samenleving, maar hóe beschaafd we die willen!” Leon Dohmen is bestuurslid van de Vereniging Register voor Informatici voor de portefeuille permanente educatie en voorzitter van de special interest group Onderzoek en Onderwijs ICT bij de Koninklijke Nederlandse Vereniging van Informatieprofessionals. Samen met vertegenwoordigers van de politiek, overheid, wetenschap, belangenverenigingen en bedrijfsleven houdt de special interest group zich bezig met het spanningsveld tussen digitalisering en (aantasting van) grondrechten van mensen. Een van de hoofddoelen is het vergroten van het bewustzijn van IT-professionals m.b.t. dit spanningsveld en de invloed die ze hierop kunnen uitoefenen.