GPT, 2017 von Google entwickelt und von OpenAI für vielfältige Zwecke weiterentwickelt, ist eine Familie von KI-Modellen, die auf der Transformer-Architektur basieren und hochmoderne Modelle zur Verarbeitung von Daten darstellen. Die GPT-Modelle eint, dass sie "vorab trainiert" wurden, d.h. sie werden mit großen Mengen Daten - zum Beispiel Texte, Bilder, Videos etc. - trainiert, bevor sie für spezifische Aufgaben feinabgestimmt werden.
Das bekannteste GPT-Modell ist wohl "ChatGPT", entwickelt von OpenAI, einem führenden Unternehmen im Bereich der KI-Forschung, und erstmals im November 2022 der Öffentlichkeit vorgestellt. ChatGPT funktioniert wie ein Chatbot und kann auf Fragen oder Anfragen reagieren, indem es maschinelles Lernen verwendet, um den Kontext der Konversation zu verstehen und angemessene Antworten zu generieren. ChatGPT wurde dazu mit einer großen Menge Daten aus dem Internet, einschließlich Büchern, Artikeln, Websites und sozialen Medien, sowie auf das Verstädnis menschlicher Sprache trainiert.
Von der GPT-3.5-Version generierte Antworten, wurden beispielsweise von mehreren tausend Probanden bewertet, um die Genauigkeit sowie die Qualität der Antworten aus moralischer und ethischer Sicht zu verbessern. Die Weiterentwicklung GPT-4 nutzt noch mehr Daten und mehr Rechenleistung, um immer komplexere Anfragen beantworten zu können. GPT-4 kann schwierige Probleme mit größerer Genauigkeit lösen, dank seines breiteren Allgemeinwissens und seiner Problemlösungsfähigkeiten. Es kann auch kreativer und kollaborativer sein als seine Vorgänger, indem es mit Benutzer:innen an kreativen und technischen Schreibaufgaben arbeitet und z.B. den Schreibstil eines:r Benutzer:in erlernt.
Wofür steht das Akronym „GPT“?
Die Abkürzung GPT steht für Generative Pre-Trained Transformer:
Generative (generierter Text)
Die Schwierigkeit besteht darin, intelligente Modelle und Algorithmen zu entwickeln, die unseren enormen Datenschatz an Informationen analysieren und verstehen können. Generative Modelle sind einer der vielversprechendsten Ansätze, um dieses Ziel zu erreichen.
Pre-Trained
Ein Pre-Trained Modell ist für eine allgemeinere Aufgabe trainiert und kann durch zusätzliches Training mit einem maßgeschneiderten Datensatz auf speziellere Anforderungen abgestimmt werden. Dieser Ansatz ist schneller und effizienter als die Erstellung eines Modells von Grund auf.
Transformer
Der Transformer ist ein maschinelles Lernmodell, das eine Textsequenz im Gesamten und nicht Wort für Wort verarbeitet und die Beziehung zwischen diesen Wörtern verstehen kann. Diese Erfindung hat den Bereich der Verarbeitung natürlicher Sprache grundlegend verändert.