ifun.de — Apple News seit 2001. 44 232 Artikel

Datenmissbrauch durch KI-Bots

Reddit will seine Inhalte für das Internet Archive sperren

Artikel auf Mastodon teilen.
21 Kommentare 21

Der KI-Boom sorgt für Entwicklungen, mit denen zunächst wohl kaum jemand gerechnet hat. Wie das Magazin The Verge berichtet, hat die Diskussionsplattform Reddit angekündigt, den Zugriff des Internet Archive auf einen großen Teil seiner Inhalte deutlich zu reduzieren. Die vom Internet Archive betriebene Webseitensammlung Wayback Machine soll künftig lediglich die Startseite von Reddit.com erfassen dürfen. Beiträge, Kommentare und Nutzerprofile werden nicht mehr indexiert. Insofern können die archivierten Inhalte künftig nur noch Aufschluss darüber geben, welche Themen oder Schlagzeilen an bestimmten Tagen populär waren.

Reddit Bei Archive Org

Begründet wird diese restriktive Maßnahme damit, dass KI-Firmen Inhalte von Reddit über die Wayback Machine automatisiert abgerufen hätten, um Daten für das Training von Modellen zu sammeln. Auf diesem Weg wurden offenbar die für die Reddit-Webseite selbst platzierten Sperren umgangen. Reddit stuft dies als Verletzung der Plattformrichtlinien ein und hat erklärt, dass es die Privatsphäre der Nutzer dadurch wahren und auch verhindern will, dass gelöschte Inhalte über Umwege weiter zugänglich bleiben.

Die Einschränkungen sollen schrittweise eingeführt werden. Reddit hat gegenüber The Verge angegeben, das Internet Archive im Vorfeld über die Maßnahme informiert zu haben. So seien bereits in der Vergangenheit Bedenken hinsichtlich der Möglichkeiten geäußert worden, Inhalte aus den Archiven zu extrahieren.

Reddit zunehmend restriktiver

Reddit führt auf diesem Weg die Anstrengungen fort, den Zugriff auf die auf der Webseite veröffentlichten Daten strenger zu regulieren. Das Unternehmen hat zuletzt zum Teil auch Suchmaschinen daran gehindert, die Inhalte zu indexieren, sofern keine Lizenzvereinbarung besteht.

Bereits 2023 hat Reddit seine API-Richtlinien geändert, was zum Aus für mehrere Drittanbieter-Apps führte. Dieser Schritt wurde ebenfalls damit begründet, dass die zuvor frei zugänglichen Schnittstellen missbraucht wurden, um die Inhalte unrechtmäßig zu nutzen.

11. Aug. 2025 um 20:28 Uhr von Chris Fehler gefunden?


    21 Kommentare bisher. Dieser Unterhaltung fehlt Deine Stimme.
  • Versteh ich und unterstütze ich. Wegen A… die sich nicht an Regeln halten und Millionen scheffeln ohne was dafür zahlen zu wollen, muss jetzt die Allgemeinheit die Zeche zahlen

    • Reddit spielen solche Begründungen in die Karten. Seit letztem Jahr an der Börse, wird die Kommerzialisierung immer weiter getrieben. Aber auch schon vorher. Immer mehr gesponserte Inhalte (Werbung) tauchen auf und verschwimmen weiter mit den „echten“ Inhalten. Es soll immer mehr zu Premium getrieben werden, bestimmte Teile des Forums sollen zukünftig nur noch exklusiv durch Bezahlung aufgerufen werden. Der wahren Inhalt der Plattform kommt jedoch von den Nutzern und deren Inhalten, aber eben diese müssen die obigen Entwicklungen mittragen.

      Und Einschränkungen der Momentaufnahmen schlagen in eine ähnliche Kerbe, so kann die teils aggressive Moderation der Plattformbetreiber immer verdeckter erfolgen, am Ende auch wieder, um die Werbekundschaft nicht zu verprellen und Investoren anzulocken.

      Mal schauen ob es in gewisser Weise in die Richtung „Tom’s Hardware“ geht – dazu gab es gestern einen interessanten Artikel in „Igors Blog“.

      • Amen. Die Themendiversität wird seit Jahren kontinuierlich eingeschränkt, um den Werbetreibenden und Investoren besser zu gefallen. Kontroverse Themen werden gebannt und ein Austausch unterbunden.

    • Nicht nur das, die KI-Bot Seuche sorgt auch für höhere Serverkosten oder sorgt dafür, das Websites richtig langsam werden oder gar nicht mehr erreichbar sind.

  • Also hat Bbeispielsweise Copilot keinen Zugriff mehr auf Reddit Inhalten, habe ich das richtig verstanden?

  • Ein Problem ist doch auch, dass ALLE Inhalte für das KI-Wissen herangezogen werden. Bisher haben wir versucht, das Wissen der Menschheit in z.B. Wikipedia zu sammeln und zur Verfügung zu stellen. Jetzt kommt noch ganz viel Meinung und Gefühl dazu. DAS ist ganz sicher ein Schritt in die völlig falsche Richtung.

    • Und Wikipedia ist im Gegensatz zu de AI-Firmen nicht kommerziell.
      Was meinst du mit Meinung und Gefühl? Diese beiden Punkte werden genutzt um den Algorithmus menschlicher und intelligenter erscheinen zu lassen als er ist. Am Ende des Tages sind diese AI Dienste nur „Text-Spinner“ die aus geklauten Daten „neue“ generieren um damit Geld zu verdienen.

  • Dann können sie doch klagen.
    So wie andere es auch machen wegen urheberrechtliche Verletzung

    • Ja ganz toll! Dann haben die in 10 Jahren ein Urteil und wenn der Schaden ist bereits angerichtet.
      Unser politisches System und unsere Justiz sind viel zu eingerostet und altbacken um mit der Geschwindigkeit des technischen Fortschritt mithalten zu können.
      Dazu kommt noch ein technischer und digitaler Sachverstand der auf dem Niveau von einem Brötchen ist.

      • Es ist immer gut auf das politische System und die Justiz zu schimpfen. Rechtsstreitigkeiten werden meist durch die Parteien, respektive deren Anwälte, mit unzähligen Anträgen und Terminverschiebungen bewusst hinausgezögert. Das Gericht kann dabei meist nur zuschauen!

  • Seine Inhalte?
    Reddits Inhalte kommen von uns Usern.

    Und Reddit wird irgendwann anfangen mit der monetarisierung: Zugang zu gewissen subreddits nur mit Mitgliedsbeitrag. *aubergine*

    • Tja, die User haben Reddit aber freiwillig eine sehr ausschweifende Lizenz gegeben:

      „When Your Content is created with or submitted to the Services, you grant us a worldwide, royalty-free, perpetual, irrevocable, non-exclusive, transferable, and sublicensable license to use, copy, modify, adapt, prepare derivative works of, distribute, store, perform, and display Your Content and any name, username, voice, or likeness provided in connection with Your Content in all media formats and channels now known or later developed anywhere in the world. This license includes the right for us to make Your Content available for syndication, broadcast, distribution, or publication by other companies, organizations, or individuals who partner with Reddit. For example, this license includes the right to use Your Content to train AI and machine learning models, as further described in our Public Content Policy.“

      • Da steht aber auch „non-exclusive“.

      • was da nicht steht ist…

        Sind die Bedingungen für aktive user die den Inhalt beisteuern irgendwann so schlecht – oder anders ausgedrückt: woanders besser – kann sich reddit seine terms of service mit allem was da drin steht, in die Haare schmieren. Ohne aktive community keine Zielgruppen für Werbeflächen…

        diejenigen, die reddit zu dem Info Hub gemacht haben, was er heute ist, können ihn auch stürzen…

      • Das bedeutet nur, dass du deine Inhalte auch woanders nutzen kannst. Wäre ja noch schöner, wenn du ein Bild, das du bei Reddit hochlädtst nicht mehr wo anders veröffentlichen dürftest, weil du Reddit die Exklusivrechte abgetreten hast. Und am besten Verklagt dich Reddit dann noch …

  • Redet mit. Seid nett zueinander!

    Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

    ifun.de ist das dienstälteste europäische Onlineportal rund um Apples Lifestyle-Produkte.
    Wir informieren täglich über Aktuelles und Interessantes aus der Welt rund um iPad, iPod, Mac und sonstige Dinge, die uns gefallen.
    Insgesamt haben wir 44232 Artikel in den vergangenen 8695 Tagen veröffentlicht. Und es werden täglich mehr.
    ifun.de — Love it or leave it   ·   Copyright © 2025 aketo GmbH   ·   Impressum   ·      ·   Datenschutz   ·   Safari-Push aketo GmbH Powered by SysEleven