ifun.de — Apple News seit 2001. 45 394 Artikel

Dreidimensionale Szene in wenigen Sekunden

Apple Sharp: Offenes KI-Modell erstellt 3D-Landschaften aus Fotos

Artikel auf Mastodon teilen.
6 Kommentare 6

Apple hat ein neues, quelloffenes KI-Modell vorgestellt, das aus einem einzelnen zweidimensionalen Foto eine dreidimensionale Szene erzeugen kann. Der Ansatz mit dem Namen SHARP berechnet in weniger als einer Sekunde eine räumliche Darstellung, die sich anschließend auch aus leicht veränderten Blickwinkeln realistisch anzeigen lässt.

Apple beschreibt das Verfahren in einer begleitenden Forschungsarbeit und stellt den Quellcode öffentlich zur Verfügung.

SHARP macht Bilder zu 3D-Szenen

Im Kern schätzt SHARP aus einem einzelnen Foto eine dreidimensionale Repräsentation der dargestellten Umgebung. Dafür nutzt das Modell eine interne Beschreibung aus sehr vielen sogenannten 3D-Gaussians. Dabei handelt es sich um kleine Volumenelemente, die Farbe, Helligkeit und Position im Raum tragen. In ihrer Gesamtheit bilden sie eine Szene nach, die aus benachbarten Perspektiven neu gerendert werden kann.

Im Unterschied zu bisherigen Verfahren benötigt SHARP keine Vielzahl von Aufnahmen aus unterschiedlichen Blickwinkeln. Stattdessen berechnet ein neuronales Netz in einem einzigen Rechenschritt die räumliche Struktur. Grundlage dafür ist ein Training mit großen Mengen synthetischer und realer Bilddaten. Dadurch lernt das Modell typische Tiefenverhältnisse und geometrische Zusammenhänge, die es auf neue Fotos überträgt.

Die erzeugte Szene ist maßstabsgetreu, sodass Abstände und Kamerabewegungen konsistent bleiben. Die Berechnung erfolgt schnell genug, um eine direkte Darstellung ohne aufwendige Nachbearbeitung zu ermöglichen.

Grenzen und mögliche Einsatzfelder

SHARP ist darauf ausgelegt, Ansichten zu erzeugen, die nahe am ursprünglichen Kamerastandpunkt liegen. Bereiche, die auf dem Ausgangsbild nicht sichtbar sind, werden nicht vollständig ergänzt. Bewegungen durch die Szene sind daher nur in begrenztem Umfang möglich. Diese Einschränkung trägt dazu bei, die Rechenzeit gering zu halten und stabile Ergebnisse zu liefern.

Sharp Aufbau Apple Ml 2500

Apple hat das Modell auf dem Code-Portal GitHub veröffentlicht. Dort können Interessierte den Code selbst testen und anpassen. In der Praxis zeigen sich Einsatzmöglichkeiten etwa für Produktdarstellungen, Visualisierungen in der Architektur oder für Anwendungen in der erweiterten Realität. Auch Weiterentwicklungen sind denkbar, etwa die Nutzung der zugrunde liegenden Methode für animierte Inhalte.

18. Dez. 2025 um 14:48 Uhr von Nicolas Fehler gefunden?


    6 Kommentare bisher. Dieser Unterhaltung fehlt Deine Stimme.
  • Das ist doch das gleiche wie die neuen Bildschirmschoner von iOS 26?

  • Finde ich genial
    Bald kann man alte Fotos und Szenen von damals mit einer VR Brille nochmal wie live erleben

  • Schön, dass Apple zumindest in letzter Vergangenheit immer mal wieder in die Richtung quelloffener Standards / Methoden geht.

  • Redet mit. Seid nett zueinander!

    Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

    ifun.de ist das dienstälteste europäische Onlineportal rund um Apples Lifestyle-Produkte.
    Wir informieren täglich über Aktuelles und Interessantes aus der Welt rund um iPad, iPod, Mac und sonstige Dinge, die uns gefallen.
    Insgesamt haben wir 45394 Artikel in den vergangenen 8823 Tagen veröffentlicht. Und es werden täglich mehr.
    ifun.de — Love it or leave it   ·   Copyright © 2025 aketo GmbH   ·   Impressum   ·      ·   Datenschutz   ·   Safari-Push aketo GmbH Powered by SysEleven