{"id":234300,"date":"2024-06-13T16:58:19","date_gmt":"2024-06-13T14:58:19","guid":{"rendered":"https:\/\/www.ifun.de\/?p=234300"},"modified":"2024-06-13T17:01:39","modified_gmt":"2024-06-13T15:01:39","slug":"applebot-apples-webcrawler-sammelt-daten-fuer-ki-training","status":"publish","type":"post","link":"https:\/\/www.ifun.de\/applebot-apples-webcrawler-sammelt-daten-fuer-ki-training-234300\/","title":{"rendered":"Applebot: Apples Webcrawler sammelt Daten f\u00fcr KI-Training"},"content":{"rendered":"<p>Auch wenn Apple bei der Integration von k\u00fcnstlicher Intelligenz ma\u00dfgeblich auf die Integration von externen L\u00f6sungen setzt &#8211; zum Start haben wir ja die Ank\u00fcndigung der Zusammenarbeit mit OpenAI gesehen &#8211; arbeitet der iPhone-Hersteller arbeitet parallel dazu auch daran, eigene Grundlagenmodelle zu erstellen. Ein wichtiges Standbein ist hier die automatisierte Indizierung von Webinhalten. Die Hauptrolle hierbei spielt der seither schon zur Unterst\u00fctzung von Funktionen wie Siri oder Spotlight-Vorschl\u00e4gen eingesetzte Webcrawler \u201eApplebot\u201c.<\/p>\n<p><a href=\"https:\/\/images.ifun.de\/wp-content\/uploads\/2024\/06\/appel-intelligence.jpg\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/images.ifun.de\/wp-content\/uploads\/2024\/06\/appel-intelligence-500x325.jpg\" alt=\"Appel Intelligence\" width=\"500\" height=\"325\" class=\"alignnone size-medium wp-image-234304\" srcset=\"https:\/\/images.ifun.de\/wp-content\/uploads\/2024\/06\/appel-intelligence-500x325.jpg 500w, https:\/\/images.ifun.de\/wp-content\/uploads\/2024\/06\/appel-intelligence-700x455.jpg 700w, https:\/\/images.ifun.de\/wp-content\/uploads\/2024\/06\/appel-intelligence-768x499.jpg 768w, https:\/\/images.ifun.de\/wp-content\/uploads\/2024\/06\/appel-intelligence.jpg 1400w\" sizes=\"auto, (max-width: 500px) 100vw, 500px\" \/><\/a><\/p>\n<p>Apple hat die Funktionsbeschreibung des Applebot nun dementsprechend erweitert und weist darauf hin, dass der Webcrawler jetzt auch verwendet wird, um die Inhalte von Webseiten zu erfassen, um sie anschlie\u00dfend zum Trainieren von Apples KI-Grundlagenmodellen verwenden zu k\u00f6nnen. Darauf basieren dann unter anderem die mit \u201eApple Intelligence\u201c neu vorgestellten KI-Funktionen zuk\u00fcnftiger Produkte und Betriebssysteme.<\/p>\n<h2>Rechtliche Basis zumindest diskutabel<\/h2>\n<p>Die rechtliche Basis hierf\u00fcr kann man zumindest als diskutabel betrachten. W\u00e4hrend Apple einen Teil des zur Erstellung der Grundlagenmodelle f\u00fcr generative KI-Funktionen genutzten Datenbestands laut eigenen Aussagen von Drittanbietern lizenziert hat, ist bei den vom Applebot erfassten Daten lediglich die Rede davon, dass es sich hier um im Internet \u00f6ffentlich zug\u00e4ngliche Informationen handelt.<\/p>\n<p>Damit setzt sich Apple in gleicher Weise zwischen zwei St\u00fchle, wie es Google mit der Anzeige von Suchergebnissen auf Nachrichtenseiten getan hat. Auch andere KI-Anbieter sahen sich mit dem Vorwurf konfrontiert, dass man die Tatsache, dass ein Webinhalt frei zug\u00e4nglich ist, nicht damit gleichzusetzen kann, dass die dort verf\u00fcgbaren Informationen auch ohne Einschr\u00e4nkungen weiterverwendet werden d\u00fcrfen. Ganz besonders d\u00fcrfte hier eine Rolle spielen, dass es sich bei Apples KI-Angeboten durchaus auch um eine kommerzielle Verwendung handelt.<\/p>\n<p><code>User-agent: Applebot-Extended<br \/>\nDisallow: \/private\/<\/code><\/p>\n<p>Betreiber von Webseiten, die mit einer solchen Nutzung nicht einverstanden sind, m\u00fcssen ihrerseits aktiv werden und entsprechende Anweisungen f\u00fcr die Webcrawler im Quellcode ihrer Seiten hinterlegen. Apple hat seine <a href=\"https:\/\/support.apple.com\/en-us\/119829\">Informationen zum Applebot<\/a> entsprechend erg\u00e4nzt und bietet hier alternativ zu einem generellen Indizierungsverbot nun auch die M\u00f6glichkeit ein, lediglich die automatische Datenerfassung f\u00fcr KI-Trainings zu untersagen. Diese l\u00e4uft bei Apple als \u201eApplebot-Extended\u201c und l\u00e4sst sich durch einen entsprechenden Zusatz in der Datei \u201erobots.txt\u201c verhindern.<img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/vg09.met.vgwort.de\/na\/fb63b32b02ee4845be8bf8499c77a80f\" width=\"1\" height=\"1\" no-lazy class=\"tracking\"><\/p>\n","protected":false},"excerpt":{"rendered":"<a href=\"https:\/\/www.ifun.de\/applebot-apples-webcrawler-sammelt-daten-fuer-ki-training-234300\/\"><img width=\"150\" height=\"150\" src=\"https:\/\/images.ifun.de\/wp-content\/uploads\/2024\/06\/appel-intelligence-feature-150x150.jpg\" class=\"alignright tfe wp-post-image\" alt=\"Appel Intelligence Feature\" decoding=\"async\" loading=\"lazy\" \/><\/a><p>Auch wenn Apple bei der Integration von k\u00fcnstlicher Intelligenz ma\u00dfgeblich auf die Integration von externen L\u00f6sungen setzt &#8211; zum Start haben wir ja die Ank\u00fcndigung der Zusammenarbeit mit OpenAI gesehen &#8211; arbeitet der iPhone-Hersteller arbeitet parallel dazu auch daran, eigene Grundlagenmodelle zu erstellen. Ein wichtiges Standbein ist hier die automatisierte Indizierung von Webinhalten. Die Hauptrolle [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":234303,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[1],"tags":[],"class_list":["post-234300","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-news"],"acf":[],"aioseo_notices":[],"featured_image":["https:\/\/images.ifun.de\/wp-content\/uploads\/2024\/06\/appel-intelligence-feature.jpg"],"subheadline":["\"Nur frei zug\u00e4ngliche Webinhalte\""],"rest_api_enabler":{"featured_image":"https:\/\/images.ifun.de\/wp-content\/uploads\/2024\/06\/appel-intelligence-feature.jpg","subheadline":"\"Nur frei zug\u00e4ngliche Webinhalte\""},"_links":{"self":[{"href":"https:\/\/www.ifun.de\/apiv2\/wp\/v2\/posts\/234300","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.ifun.de\/apiv2\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.ifun.de\/apiv2\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.ifun.de\/apiv2\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.ifun.de\/apiv2\/wp\/v2\/comments?post=234300"}],"version-history":[{"count":7,"href":"https:\/\/www.ifun.de\/apiv2\/wp\/v2\/posts\/234300\/revisions"}],"predecessor-version":[{"id":234312,"href":"https:\/\/www.ifun.de\/apiv2\/wp\/v2\/posts\/234300\/revisions\/234312"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.ifun.de\/apiv2\/wp\/v2\/media\/234303"}],"wp:attachment":[{"href":"https:\/\/www.ifun.de\/apiv2\/wp\/v2\/media?parent=234300"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.ifun.de\/apiv2\/wp\/v2\/categories?post=234300"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.ifun.de\/apiv2\/wp\/v2\/tags?post=234300"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}