Wie KI Inhalte generiert
In letzter Zeit taucht im Bereich der künstlichen Intelligenz zunehmend ein neuer Begriff auf: Generative KI. Er rückte insbesondere im Zusammenhang mit hochkomplexen Anwendungen wie ChatGPT in den Fokus und beschreibt eine neue Leistungsstufe der KI. Im Gegensatz zu KI-Funktionen, die Unterscheidungen treffen (daher diskriminierende KI), ist generative KI in der Lage, eigene Inhalte wie Texte, Bilder, Audioinhalte, Code und mehr zu erstellen.
Daten an Ausgabekriterien anpassen
Betrachtet man frühere Anwendungen von KI, so wird deutlich, dass die neue Technologie vor allem dazu dient, Unterscheidungen zu treffen: Lieferrechnung oder Rechnung? Verkehrszeichen oder Werbetafel? Spam oder kein Spam? Die Algorithmen haben dies durch sogenanntes überwachtes Lernen gelernt. Dabei werden sie mit Daten trainiert, die von Menschen vorbereitet wurden, d. h. der entsprechenden Ausgabekategorie zugeordnet wurden. Daraus extrahieren die Algorithmen die Merkmale, die ein Objekt von einem anderen unterscheiden, und können vorhersagen, zu welcher Kategorie ein unbekanntes Objekt am ehesten gehört.
Erweiterung der Horizonte der KI
Eine KI, die auf diese Weise gelernt hat, hat einen sehr begrenzten Horizont. In gewisser Weise kann dieser erweitert werden, indem man Algorithmen anders lernen lässt: unüberwacht oder halbüberwacht. Beim unüberwachten Lernen werden die Daten nicht gekennzeichnet; beim halbüberwachten Lernen wird nur ein kleiner Teil der Daten von Menschen gekennzeichnet. Der Algorithmus „erarbeitet“ selbstständig die Muster, nach denen er die ihm gegebenen Daten ordnet. Auf diese Weise kann er andere Muster erkennen als diejenigen, die beim überwachten Lernen die Zuordnung zu einer bestimmten Ausgabekategorie bestimmen. Die Hunde- und Katzenbilder könnten dann beispielsweise nach der Farbe des Fells der Tiere oder danach sortiert werden, ob sie auf der Wiese oder auf dem Sofa fotografiert wurden. Aber auch hier macht der Algorithmus nichts anderes als Unterscheidungen, allerdings in Bezug auf die Ausgabe ohne Eingabe durch den Menschen.
Wenn man unüberwachtes Lernen auf eine größere Ebene hebt, entsteht generative KI. „Auf eine größere Ebene heben“ bedeutet in diesem Fall, dass anstelle kleiner KI-Modelle, vordefinierter Regeln für die Verarbeitung von Eingaben und einer eher überschaubaren Menge an Trainingsdaten zunehmend größere und komplexere KI-Modelle zum Einsatz kommen, die mittels neuronaler Netze und riesigen Datenmengen aus einer Vielzahl digitaler Datenquellen lernen. Das KI-Modell erhält lediglich eine Vorgabe für die gewünschte Ausgabe, beispielsweise „Text zum aktuellen Stand der KI“, agiert jedoch unabhängig bei der Suche nach Eingaben und deren Verarbeitung, ohne dass weitere menschliche Eingriffe erforderlich sind. Neue Architekturen in neuronalen Netzen (z. B. GAN und Transformer) steigern die Leistungsfähigkeit der Modelle. Insbesondere mit Transformer ist die Erstellung sprachbasierter Inhalte auf recht hohem Niveau möglich, da anstelle einzelner Datenpunkte ganze Datensequenzen (Sätze und Textsegmente) verwendet werden.
Fazit
In Bezug auf die Unterscheidung zwischen „generativer KI“ und „diskriminierender KI“ sind einige Autoren der Ansicht, dass jede KI „generativ“ ist, selbst wenn sie „nur“ Unterscheidungen trifft, da sie diese auch generiert und nicht von irgendwoher übernimmt. Mit anderen Worten: „Generative KI“ macht technisch gesehen nichts anderes als das, was eine KI ohnehin kann, nämlich Unterscheidungen treffen, nur in viel größerem Umfang, mit viel mehr Ressourceneinsatz und mit deutlich weniger menschlichem Eingriff als die einfache diskriminative KI. Aber auch generative KI ist weit davon entfernt, selbstständig denken zu können; sie verarbeitet lediglich das, was sie auf Millionen von Seiten im Internet findet. Das reicht völlig aus, um im Backoffice E-Mails zu beantworten, Angebote, Vertragstexte, Marketingtexte oder Produktbeschreibungen zu erstellen, Texte zusammenzufassen, Werbung zu personalisieren oder als Chatbot im Kundensupport Fragen zu beantworten.