Apple bereitet sich offenbar auf deutlich steigende Rechenanforderungen rund um eine neue Version seiner Sprachassistenz Siri vor. Nach einem Medienbericht von The Information hat das Unternehmen Google gebeten zu prüfen, ob Server in Googles Rechenzentren für die nächste, auf Gemini basierende Siri-Generation eingesetzt werden können.

Schon jetzt weicht Siri hin und wieder auf die Cloud aus

Derzeit fast keine Auslastung

Bislang verarbeitet Apple komplexere KI-Anfragen über die hauseigene „Private Cloud Compute„-Architektur. Dabei kommen firmeneigene Server mit Apple-Chips zum Einsatz. Nach Angaben von The Information wird diese Infrastruktur aktuell nur zu etwa zehn Prozent ausgelastet. Ein Teil der vorgesehenen Server soll sich sogar noch in Lagerhallen befinden und wurde bislang nicht installiert. Mit dem Start einer leistungsfähigeren Siri-Version könnte der Bedarf jedoch sprunghaft steigen.

Private Cloud Compute wurde eingeführt, um rechenintensive KI-Aufgaben in der Cloud auszuführen und gleichzeitig hohe Datenschutzstandards einzuhalten. Die Server verwenden Chips, die ursprünglich für Endgeräte entwickelt wurden und sind daher nicht speziell für große KI-Modelle optimiert. Zudem gelten Aktualisierungen als vergleichsweise aufwendig.

Strategiewechsel beim Cloud-Einsatz

Intern soll Apple über Jahre gezögert haben, die eigene Cloud-Infrastruktur stark auszubauen. Der Fokus lag traditionell auf Hardwareprodukten und nutzernahen Funktionen. Experten für Rechenzentren verließen das Unternehmen, während ältere, mit Nvidia-Technik betriebene Server schrittweise außer Betrieb genommen wurden. Parallel griff Apple verstärkt auf externe Anbieter wie Amazon zurück.

Lange Zeit untersagte Apple seinen KI-Teams die Nutzung von Googles Cloud-Diensten aus Datenschutzgründen. Der Softwarechef Craig Federighi soll entsprechende Projekte mehrfach gestoppt haben. Erst nachdem Google 2023 Änderungen an seinen Sicherheitsmechanismen vorgenommen hatte, begann Apple, Teile seiner KI-Workloads auf Googles Infrastruktur zu verlagern.

Vor dem erwarteten Start einer Gemini-gestützten Siri noch in diesem Jahr will Apple nun offenbar sicherstellen, dass ausreichend Rechenkapazität verfügbar ist. Eine mögliche Zusammenarbeit mit Google würde bedeuten, dass Teile der Siri-Verarbeitung direkt in fremden Rechenzentren stattfinden.