Vor ein paar Wochen hat die NZZ einen Artikel veröffentlicht, in dem Petra Gössi das NZZ-Team erschreckte, weil via KI-Chatbot angeblich «beinahe der gesamte Inhalt des Artikels […] in der Antwort von Perplexity zu lesen» gewesen sei. Und nun könne «man gratis oder für eine Gebühr von etwa 20 Dollar pro Monat jede Zeitung auf der Welt durchforsten».
Dramatische Zeilen. Adrienne Fichter und ich wollten das für DNIP genauer wissen.
Die Langversion dieses Artikels — geschrieben gemeinsam mit Adrienne Fichter — findet ihr hier: Die KI-Modelle beklauen die Medien — Fehlender Faktencheck der NZZ
Was ist eigentlich eine Paywall?
Dazu schauen wir uns zuerst eine „normale“ Webseite an. Also, wie es vor 20 Jahren normal war: Ohne Paywall, ohne «789 ausgewählte Werbe- und Trackingpartner».
Keine Paywall («normal»)
Hier ein Screenshot eines Webbrowsers, der einen DNIP-Artikel offen hat und daneben die Entwicklertools, die jeder Browser beinhaltet und ohne die kein Webdesigner oder -entwickler arbeiten kann.
Links die Webseite aus Sicht der Leser:in; rechts was der Browser vom Webserver bekam.
Harte («hard») Paywall
Online-Medien haben schon früh begonnen, die Inhalte zu monetarisieren. Zum einen über Werbung und Tracking, zum anderen über Bezahlmodelle. Das einfachste ist, nur zahlenden Abonnent:innen den gesamten Artikeltext zur Verfügung zu stellen. Dazu müssen diese sich einloggen, bevor sie den ganzen Artikel sehen können.
Hier das Beispiel, wie ein Tagi-Artikel mit einer (sog. „harten“) Paywall aussieht: Nur die ersten paar Sätze sind sichtbar, der Webserver behält den Rest.
Weiche («soft») Paywall
Der Nachteil der obigen „harten“ Paywall: Suchmaschinen finden den Artikel auch nicht. Also haben die Online-Medien schon vor Jahrzehnten begonnen, diese anders zu behandeln. Eine Möglichkeit ist, die Crawler von Google & Co gezielt zu erkennen und ihnen trotzdem den ganzen Text zu servieren.
Eine andere Möglichkeit ist die „weiche“ (soft) Paywall: Da liefert der Webserver den ganzen Text an alle Anfrager; der Browser wird aber mittels JavaScript nach dem Laden angewiesen, ihn zu verstecken.
Hier die NZZ:
Die ganze Disziplin der Suchmaschinenoptimierung (SEO) beschäftigt sich seit Jahren damit. Und keine Zeitung, die etwas auf sich hält, kommt heute noch ohne SEO-Team aus. Weil die Suchmaschinen heute für einen Grossteil der Besuche auf den Seiten verantwortlich sind. Auch, weil die Zeitungen es nicht geschafft haben, ihre Leser:innen bei der Stange zu halten.
Um so erstaunlicher ist es, das angebliche Erstaunen und Entsetzen in der NZZ-Redaktion zu sehen, das im NZZ-Artikel vermittelt wird.
Wie kommen KI-Bots wie Perplexity an ihre Daten?
Zum einen durch Abgrasen des Internet nach von Menschen geschriebenen Texten. Diese dienen zwei Zwecken: Zum Einen dem Erlernen menschlicher Sprache, zum Anderen dem Erlernen von Fakten.
Beides passiert übrigens nicht scharf getrennt, sondern es werden „einfach“ Muster aus diesen gesamten (geschredderten!) Texten extrahiert. Die Reproduktion dieser Muster nennen wir dann „Antworten“ der KI.
Mehr dazu in früheren Erklärstücken zu KI und ihren Daten:
Das obige „Basiswissen“ hinkt aber meist mehrere Monate hinter dem aktuellen Stand des Internet her. Deshalb nutzen einige Chatbots (wie der von Bing/Microsoft oder eben Perplexity) aktiv Suchmaschinen, um aufgrund einer gut formulierten Suchanfrage Webseiten zu besuchen und deren Texte für die gewünschte Antwort mitzunutzen. Also eigentlich das, was, was ein Mensch, der gut mit Suchmaschinen umgehen kann, auch tun würde.
Was heisst das für den NZZ-Artikel?
- Seit zwei Jahren werden diese Punkte überall diskutiert, ganz besonders in der Medienbranche. Von dort jetzt Überraschung zu zeigen, wirkt, äh, seltsam.
- Ja, KI-Firmen nutzen zum Teil Praktiken, die zumindest an der Grenze der Urheberrechtsverletzung agieren.
- Es wird der KI unterstellt, dass sie an Informationen käme, die man ihnen nicht gäbe. Das stimmt so nicht. Und die Content-Anbieter haben da durchaus die Wahl.
Wieso dann dieser NZZ-Artikel?
Zumindest vom einen Autor des Artikels sollte man erwarten können, dass ihm zumindest ein Teil dieser Zusammenhänge klar gewesen seien.
Aber: Es läuft auch immer wieder die Diskussion um das Leistungsschutzrecht (1, 2, 3), bei dem der Bundesrat gerade wieder am arbeiten ist.
Die Hintergründe über das «Wieso?» kennen wir nicht. Aber es gibt einige Anzeichen: Es sieht von aussen so aus, als ob das Leistungsschutzrecht eine treibende Kraft hinter dem Artikel sein könnte.
Und anzudeuten, dass die in gewissem Masse «magisch» anmutende KI alleine dank ihrer besonderen «Magie» Daten klauen könnte, dürfte einige Politiker mehr zum Handeln animieren, als eine sachliche Darlegung der Eigenschaften.
Den ganzen Artikel von Adrienne Fichter und mir gibt es kostenlos und werbefrei bei DNIP: Die KI-Modelle beklauen die Medien — Fehlender Faktencheck der NZZ.
Künstliche Intelligenz
News (mehr…)
- Können KI-Systeme Artikel klauen?Vor ein paar Wochen hat die NZZ einen Artikel veröffentlicht, in dem Petra Gössi das NZZ-Team erschreckte, weil via KI-Chatbot… Können KI-Systeme Artikel klauen? weiterlesen
- Was verraten KI-Chatbots?«Täderlät» die KI? Vor ein paar Wochen fragte mich jemand besorgt, ob man denn gar nichts in Chatbot-Fenster eingeben könne,… Was verraten KI-Chatbots? weiterlesen
- Kritik an KI ist nötig. Aber wie?KI ist seit 1½ Jahren in aller Munde. Die Meinungen gehen von Woher kommt diese Uneinigkeit? Daran, dass die Kritik… Kritik an KI ist nötig. Aber wie? weiterlesen
Lange Artikel (mehr…)
- KI-DatenkreisläufeHier ein kleiner Überblick über die Datenkreisläufe rund um generative KI, insbesondere grosse Sprachmodelle (Large Language Model, LLM) wie ChatGPT, Gemini oder Claude.
- Der Homo Ludens muss Werkzeuge spielend erfahren. Auch KIFast alle Werkzeuge, die wir «spielend» beherrschen, haben wir spielend gelernt. Das sollten wir auch bei generativer KI.
- Der Turing-Test im Laufe der ZeitVor einem knappen Jahrhundert hat sich Alan Turing mit den Fundamenten der heutigen Informatik beschäftigt: Kryptographie, Komplexität/Rechenaufwand, aber auch, ob und wie wir erkennen könnten, ob Computer „intelligent“ seien. Dieses… Der Turing-Test im Laufe der Zeit weiterlesen
- «QualityLand» sagt die Gegenwart voraus und erklärt sieIch habe vor Kurzem das Buch «QualityLand» von Marc-Uwe Kling von 2017 in meinem Büchergestell gefunden. Und war erstaunt, wie akkurat es die Gegenwart erklärt. Eine Leseempfehlung.
- Neuralink ist (noch) keine Schlagzeile wertDiese Woche haben einige kurze Tweets von Elon Musk hunderte oder gar tausende von Artikeln ausgelöst. Wieso?
- «Quasselquote» bei LLM-SprachmodellenNeulich erwähnte jemand, dass man ChatGPT-Output bei Schülern häufig an der «Quasselquote» erkennen könne. Das ist eine Nebenwirkung der Funktionsweise dieser Sprachmodelle, aber natürlich noch kein Beweis. Etwas Hintergrund.
- «KI» und «Vertrauen»: Passt das zusammen?Vor einigen Wochen hat Bruce Schneier einen Vortrag gehalten, bei dem er vor der der Vermischung und Fehlinterpretation des Begriffs «Vertrauen» gewarnt hat, ganz besonders beim Umgang mit dem, was… «KI» und «Vertrauen»: Passt das zusammen? weiterlesen
- Wegweiser für generative KI-ToolsEs gibt inzwischen eine grosse Anzahl generativer KI-Tools, nicht nur für den Unterricht. Hier ein Überblick über verschiedene Tool-Sammlungen.
- KI-VergiftungEine aggressive Alternative zur Blockade von KI-Crawlern ist das «Vergiften» der dahinterliegenden KI-Modelle. Was bedeutet das?
- Lehrerverband, ChatGPT und DatenschutzDer Dachverband der Lehrerinnen und Lehrer (LCH) sei besorgt, dass es in der Schweiz keine einheitliche Regelung gäbe, wie Lehrpersonen mit Daten ihrer Schützlinge umgehen sollen und ob sie dafür… Lehrerverband, ChatGPT und Datenschutz weiterlesen
- Goethe oder GPThe?In «Wie funktioniert ChatGPT?» habe ich die Experimente von Andrej Karpathy mit Shakespeare-Texten wiedergegeben. Aber funktioniert das auch auf Deutsch? Zum Beispiel mit Goethe? Finden wir es heraus!
- KI: Alles nur Zufall?Wer von einer «Künstlichen Intelligenz» Texte oder Bilder erzeugen lässt, weiss, dass das Resultat stark auf Zufall beruht. Vor Kurzem erschien in der NZZ ein Beitrag, der die Unzuverlässigkeit der… KI: Alles nur Zufall? weiterlesen
- Hype-TechWieso tauchen gewisse Hype-Themen wie Blockchain oder Maschinelles Lernen/Künstliche Intelligenz regelmässig in IT-Projekten auf, obwohl die Technik nicht wirklich zur gewünschten Lösung passt? Oder es auch einfachere, bessere Ansätze gäbe?… Hype-Tech weiterlesen
- 📹 Die Technik hinter ChatGPTDer Digital Learning Hub organisierte 3 Impuls-Workshops zum Einsatz von ChatGPT in der Sekundarstufe II. Im dritten Teil präsentierte ich die Technik hinter ChatGPT. In der halben Stunde Vortrag werden… 📹 Die Technik hinter ChatGPT weiterlesen
- Ist ChatGPT für Ihre Anwendung ungefährlich?Ob man KI-Chatbots sicher einsetzen kann, hängt von der Anwendung ab. Aleksandr Tiulkanov hat deshalb ein Flussdiagramm als Entscheidungshilfe erstellt. Hier eine deutsche Übersetzung und ein paar Anmerkungen zum Korrekturlesen… Ist ChatGPT für Ihre Anwendung ungefährlich? weiterlesen
- Wie funktioniert ChatGPT?ChatGPT ist wohl das zur Zeit mächtigste Künstliche-Intelligenz-Sprachmodell. Wir schauen etwas hinter die Kulissen, wie das „large language model“ GPT-3 und das darauf aufsetzende ChatGPT funktionieren.
- Die KI ChatGPT und die Herausforderungen für die GesellschaftWas lange währt, wird endlich, äh, published. Mein neuer DNIP-Artikel zu ChatGPT ist online, in drei Teilen:
- Identifikation von KI-KunstKI-Kunst ist auf dem Vormarsch, sowohl was die Qualität als auch die Quantität betrifft. Es liegt (leider) in der menschlichen Natur, einiges davon als „echte“, menschgeschaffene Kunst zu vermarkten. Hier… Identifikation von KI-Kunst weiterlesen
- Die Lieblingsfragen von ChatGPTEntmutigt durch die vielen Antworten von ChatGPT, es könne mir auf diese oder jene Frage keine Antwort geben, weil es nur ein von OpenAI trainiertes Sprachmodell sei, versuchte ich, ChatGPT… Die Lieblingsfragen von ChatGPT weiterlesen
- Wie funktioniert Künstliche Intelligenz?Am vergangenen Mittwoch habe ich im Rahmen der Volkshochschule Stein am Rhein einen Überblick über die Mächtigkeit, aber auch die teilweise Ohnmächtigkeit der Künstlichen Intelligenz gegeben. Das zahlreich anwesende Publikum… Wie funktioniert Künstliche Intelligenz? weiterlesen
- Künstliche Intelligenz — und jetzt?Am 16. November 2022 halte ich einen öffentlichen Vortrag zu künstlicher Intelligenz an der VHS Stein am Rhein. Sie sind herzlich eingeladen. Künstliche Intelligenz ist derzeit in aller Munde und… Künstliche Intelligenz — und jetzt? weiterlesen
- Reproduzierbare KI: Ein SelbstversuchIm NZZ Folio vom 6. September 2022 beschrieb Reto U. Schneider u.a., wie er mit DALL•E 2 Bilder erstellte. Die Bilder waren alle sehr eindrücklich. Ich fragte mich allerdings, wie viele… Reproduzierbare KI: Ein Selbstversuch weiterlesen
- Machine Learning: Künstliche Faultier-IntelligenzMachine Learning („ML“) wird als Wundermittel angepriesen um die Menschheit von fast allen repetitiven Verarbeitungsaufgaben zu entlasten: Von der automatischen Klassifizierung von Strassenschilden über medizinische Auswertungen von Gewebeproben bis zur… Machine Learning: Künstliche Faultier-Intelligenz weiterlesen
Schreibe einen Kommentar