Was könnte die Zukunft der generativen KI verändern?

Veröffentlicht: 2023-09-22

Heutzutage wird viel darüber gesprochen, wie generative KI Menschen arbeitslos machen könnte. Es wird nicht so viel darüber nachgedacht, wie Menschen generative KI arbeitslos machen könnten. Aber sie könnten – und werden es möglicherweise auch tun.

GenAI und die zugrunde liegenden Modelle befinden sich derzeit auf dem schwindelerregenden Höhepunkt des Gartner-Hype-Zyklus. Wenn Gartners Modell stichhaltig ist, könnten diese Tools kurz davor stehen, in den „Tal der Ernüchterung“ zu stürzen, bevor sie in ein paar Jahren auf einem Plateau nützlicher Produktivität auftauchen.

Es gibt jedoch das Argument, dass die Desillusionierung GenAI-Produkte endgültig verschlingen könnte. Zusätzlich zu den Risiken, die damit verbunden sind, sich auf im Grunde unbewusste und amoralische „Intelligenz“ zu verlassen, sind Benutzer auch mit der sehr realen Gefahr konfrontiert, dass Urheberrechts- und Datenschutzprobleme große Sprachmodelle (LLMs) wie ChatGPT tödlich schädigen könnten.

Lassen Sie uns diese der Reihe nach durchgehen.

Ein nationales „Do Not Scrape“-Register?

Verlage monetarisieren Inhalte. Sie streben nicht danach, dass Dritte diese Inhalte ohne Erlaubnis monetarisieren, zumal die Herausgeber wahrscheinlich bereits dafür bezahlt haben. Professionelle Autoren monetarisieren, was sie schreiben. Auch sie streben nicht danach, dass Dritte von ihrer Arbeit profitieren, ohne dass der Urheber dafür entschädigt wird. Alles, was ich hier über schriftliche Inhalte sage, gilt gleichermaßen für Grafik-, Video- und andere kreative Inhalte.

Natürlich gibt es bei uns Urheberrechtsgesetze, die Verleger und Autoren vor direktem Diebstahl schützen. Diese helfen bei genAI nicht, da so viele Quellen gecrawlt werden, dass die endgültige Ausgabe möglicherweise nicht genau einer der einzelnen Quellen ähnelt (obwohl dies passieren kann).

Derzeit suchen Verlage aktiv nach Möglichkeiten, LLMs am Scraping ihrer Inhalte zu hindern. Es ist eine große technische Herausforderung

In diesem Video erörtert der MarTech-Mitarbeiter Greg Krehbiel Möglichkeiten, wie Verlage versuchen könnten, LLMs zu blockieren. Er plädiert außerdem dafür, die Allgemeinen Geschäftsbedingungen zu ändern, um die Grundlage für künftige Klagen zu schaffen. Er scheint anzuerkennen, dass keiner seiner Vorschläge ein Volltreffer ist. Ist es beispielsweise praktikabel, Google daran zu hindern, Ihre Website zu crawlen, um Inhalte abzurufen, ohne gleichzeitig das Crawlen Ihrer Website zu unterbinden, um sie in den Suchergebnissen zu platzieren? Zudem sind Klagen kostspielig.

Aber wie wäre es mit einer regulatorischen Lösung? Erinnern Sie sich an den endlosen Ärger mit Telefonmarketing-Anrufen? Das Nationale Do-Not-Call-Register hat dem ein Ende gesetzt. Jeder, der sich dafür interessierte, konnte seine Nummer registrieren und Telemarketer konnten sie weiterhin anrufen, nur auf die Gefahr hin, dass die FTC hohe Geldstrafen verhängen musste.

Die Registrierung von Domains bei einem nationalen Do-Not-Scrape-Register mag eine größere Aufgabe sein, aber man kann im Allgemeinen sehen, wie eine solche Regulierungsstrategie funktionieren könnte. Würde jeder Verstoß erkannt werden? Sicher nicht. Das Gleiche gilt aber beispielsweise auch für die DSGVO. Die DSGVO verlangt die Einhaltung nicht, weil jeder Verstoß erkannt wird, sondern weil die erkannten Verstöße schwere Sanktionen nach sich ziehen können – „beispiellos hohe Geldstrafen von bis zu 4 Prozent des weltweiten Gesamtumsatzes eines Unternehmens“.

Es ist zu spät. GenAI verfügt bereits über die Daten

Unabhängig davon, ob es eine technische oder behördliche Lösung gibt, um den Diebstahl von Inhalten durch genAI zu verhindern, hat dieses Pferd den Stall nicht bereits verlassen? LLMs wurden bereits an unvorstellbar großen Datensätzen trainiert. Sie mögen anfällig für Fehler sein, aber in gewisser Weise wissen sie alles.

Nun ja, sie wissen alles bis vor ein paar Jahren. ChatGPT-4 wurde anhand von Daten mit Stichtag September 2021 vorab trainiert. Das bedeutet, dass es vieles nicht weiß. Erinnern wir uns daran, womit wir es hier zu tun haben.

Gehen Sie tiefer: Künstliche Intelligenz: Ein Leitfaden für Einsteiger

GenAI verwendet Algorithmen, um basierend auf all den Millionen Textteilen, auf denen es trainiert wurde, den nächstbesten zu erstellenden Text vorherzusagen. Was es „intelligent“ macht, ist, dass es seine eigenen Algorithmen auf der Grundlage von Feedback und Reaktionen verbessern kann (ein Mensch muss nicht an den Algorithmen herumbasteln, obwohl er es natürlich könnte).

Was genAI nicht kann – ist, Dinge über die Welt herauszufinden, die außerhalb seines Datentrainingssatzes liegen. Dies unterstreicht den Standpunkt von Philosophen wie Donald ^Davidson1 , dass KI keine kausalen Zusammenhänge mit der Welt hat. Wenn ich wissen möchte, ob es regnet, verlasse ich mich nicht auf einen Datensatz; Ich schaue aus dem Fenster. Um es technisch auszudrücken: genAI mag eine großartige Syntax (Grammatik) haben, aber die Semantik (Bedeutung) ist ihr fremd.

Daraus lässt sich die Schlussfolgerung ziehen, dass KI vollständig auf Lebewesen wie uns angewiesen ist, die in einem kausalen Zusammenhang mit der Welt stehen ; Wer kann sagen, ob es regnet, ob ein Mond am Himmel ist, ob Jefferson die Unabhängigkeitserklärung verfasst hat. Bisher war es davon abhängig, was die Menschen in der Vergangenheit getan haben. Um relevant zu bleiben, muss es weiterhin davon abhängen, was die Menschen allein tun können.

Wenn die Fähigkeit von LLMs, weiterhin von Menschen erstellte Inhalte zu scannen, erheblich eingeschränkt ist, können sie ihre Datensätze in Zukunft nicht mehr ergänzen, aktualisieren, korrigieren und erweitern. Der Niedergang ihres Nutzens könnte zwar langsam erfolgen, wäre aber mehr oder weniger garantiert.

Hände weg von meinen PII!

Neben dem Drang von Verlegern, Autoren und anderen Urhebern, genAI von ihren Inhalten fernzuhalten, gibt es in naher Zukunft noch ein weiteres sehr reales Problem. Die Notwendigkeit, irgendwie zu gewährleisten, dass sie beim Entfernen von Millionen Gigabyte an Daten aus dem Internet nicht versehentlich personenbezogene Daten (PII) oder andere Arten von Daten beschlagnahmen, die durch bestehende Vorschriften geschützt sind.

Die FTC hat eine Untersuchung von OpenAI wegen Verbraucherschutzproblemen eingeleitet.
Wie weithin berichtet wurde, hat Italien OpenAI und ChatGPT einfach wegen der Verarbeitung personenbezogener Daten sowie des Fehlens von Altersüberprüfungskontrollen verboten. Nachdem den italienischen Forderungen entsprochen worden war, wurde der Betrieb wieder aufgenommen.
Die europäischen Herausforderungen sind noch lange nicht vorbei. In einer umfassenden Beschwerde in Polen wird behauptet, dass OpenAI einen „systematischen Verstoß“ gegen die DSGVO begeht.

Es genügt zu sagen, dass europäische Gerichte tendenziell mehr Verständnis für die Rechte der Bürger haben als für die Gewinne großer Technologieunternehmen.

Wir haben Vertrauen und Sicherheit noch nicht einmal erwähnt. Diese Bedenken wurden in meinem jüngsten Gespräch mit Afraz Jaffri, Experte für KI-Hype-Zyklen bei Gartner, angesprochen, der sagte:

Das erste Problem ist eigentlich der Vertrauensaspekt. Ungeachtet externer Vorschriften besteht immer noch die grundsätzliche Meinung, dass es sehr schwierig ist, die Ergebnisse der Modelle zu kontrollieren und sicherzustellen, dass die Ergebnisse tatsächlich korrekt sind. Das ist ein großes Hindernis.
Was hält die Zukunft für genAI bereit? Der Gartner-Hype-Zyklus

Wird das alles den Ausschalter auslösen?

Man kann leicht sagen, dass GenAI von Dauer sein wird. Viele Leute haben es gesagt. Und tatsächlich ist es höchst unwahrscheinlich, dass eine bedeutende – wenn nicht völlig neue – Entwicklung in der Technologie vergessen oder aufgegeben wird. Als absolutes Minimum werden Unternehmen diese Funktionen weiterhin für ihre eigenen Datensätze oder sorgfältig ausgewählte externe Datensätze nutzen, und das wird viele wichtige Anwendungsfälle abdecken.

Dennoch liegen die Chancen, dass genAI durch eine Kombination aus regulatorischen Blockaden, rechtlichen Herausforderungen, Vertrauensproblemen – und anderen bisher ungesehenen Hindernissen – gestört, eingeschränkt und stark verändert wird, deutlich über Null.

Donald Davison, „Turing's Test“, Mind 59 (1950) ↩︎

Fügen Sie MarTech zu Ihrem Google News-Feed hinzu.