Apple Intelligence darf auf viele große Websites nicht zugreifen, um deren Daten für das eigene KI-Training zu verwenden. Zahlreiche Betreiber haben Vorkehrungen getroffen, um den Zugriff durch Apples Systeme zu verhindern. Diese Entscheidung dürfte in erster Linie auf wirtschaftliche Überlegungen zurückzuführen sein.
Generative Sprachmodelle, wie etwa ChatGPT, funktionieren besser, je mehr Daten sie verarbeiten können. Die Vorhersage von Wörtern, die diese Modelle leisten, basiert auf umfangreichen Datensätzen, wodurch sie zunehmend menschlich klingende Sätze und Formulierungen erzeugen. Auch Apple Intelligence benötigt große Mengen an Daten, um sich zu verbessern. Allerdings haben zahlreiche große Websites und Onlinedienste laut Medienberichten entschieden, Apple den Zugriff auf ihre Inhalte zu verweigern. Diese Einschränkung lässt sich in der sogenannten „robots.txt“-Datei festlegen, die den Betreibern ermöglicht, genau zu steuern, welche Inhalte von Suchmaschinen und automatisierten Systemen durchsucht und indexiert werden dürfen. Apple hatte diese Option im Rahmen der WWDC 2024 erläutert.
Große Plattformen wollen Apple Intelligence ausschließen
Unter den Plattformen, die Apple den Zugriff verwehren, befinden sich bedeutende Namen wie Meta, das für Facebook und Instagram den Zugriff blockiert, sowie Medienhäuser wie die Financial Times, die New York Times, USA Today, und auch Dienste wie Craigslist und Tumblr. Diese Betreiber haben bewusst festgelegt, dass ihre Daten von Apple Intelligence nicht genutzt werden dürfen.
Hinter dieser Entscheidung stehen vermutlich finanzielle Interessen. Während Apple bereits begonnen hat, Daten aus dem Web zu sammeln, ist Apple Intelligence im Vergleich zu anderen KI-Systemen wie OpenAI noch relativ jung und hat daher Aufholbedarf. Dennoch könnte sich diese Situation noch ändern, da Apple die Möglichkeit hat, Vereinbarungen mit den betroffenen Plattformen zu treffen. Es ist wahrscheinlich, dass Betreiber wie Meta künftig eine Bezahlung verlangen werden, wenn Apple deren Datenbestände für das Training der eigenen KI nutzen möchte.
Meta könnte darin eine zusätzliche Einnahmequelle sehen, indem es Apple für den Zugriff auf Inhalte von Facebook und Instagram zur Kasse bittet. Auch große Verlage haben ein starkes Interesse daran, ihre hochwertigen Inhalte nicht kostenlos für das Training von KI-Systemen bereitzustellen. Diese Plattformen werden vermutlich eine finanzielle Entschädigung erwarten, wenn Apple deren Daten zur Weiterentwicklung von Apple Intelligence verwenden möchte.