Apple arbeitet auf überraschende Weise mit KI und veröffentlicht seine Fortschritte. Jetzt stellen sie ein neues Modell namens MM1 vor, mit dem Sie verschiedene Aufgaben ausführen können
Dank der umfangreichen Arbeit der Apple-Forscherhaben Fortschritte zu einer neuen Methode veröffentlichtum große Sprachmodelle durch die nahtlose Integration von Text und Informationen zu trainieren. Dem veröffentlichten Forschungsartikel zufolge wird ein neuer Ansatz zur Schaffung intelligenterer und flexiblerer Systeme der künstlichen Intelligenz aufgezeigt. Das neue Modell, das sie „MM1“ nennen, ist ein neuer Standard für die Fähigkeit der KI, einige Aufgaben wie Untertitelung von Bildern, visuelle Antworten auf Fragen und sogar natürliche Visualisierung auszuführen. Das kommt danacheine Neuerwerbung von Apple in Bezug auf KI selbst.
Apfel
Es ist kein offenes Geheimnis mehr, Apple arbeitet voll an KI
Bei dieser erstmals von VentureBeat veröffentlichten Studie handelt es sich um eine „sorgfältige Kombination verschiedener Arten von Trainingsdaten und Modellarchitekturen“, die zu einer wirklich Spitzenleistung bei KI-Benchmarks führen kann.
In dieser Arbeit analysieren wir die Konstruktion leistungsstarker großer multimodaler Sprachmodelle (MLLM). Wir untersuchen die Bedeutung verschiedener Architekturkomponenten und Datenoptionen.
Das MM1-Modell ist eine hochmoderne „multimodale Modellfamilie“ mit tollen attraktiven Eigenschaften. Darunter stechen „verbessertes Lernen im Kontext“ und „Multiple-Image-Argumentation“ hervor. Die neue Modellfamilie bietet eine unglaubliche und wettbewerbsfähige Leistung in einer Vielzahl von Benchmarks.
Nachrichten, die auf dem Papier schwer zu verdauen sind, sich aber bald in der Praxis zeigen werden
Es ist schwierig, vollständig zu verstehen, woran Apple-Forscher arbeiten. Wir können es jedoch zusammenfassen, da sie verschiedene Datentypen und Modellarchitekturen kombinieren. Die betreffende KI muss Sprache basierend auf einer Kombination von Signalen generieren, die sowohl visueller als auch sprachlicher Natur sein können. Es kann zur Interpretation von Bildern oder Videos, zur Beantwortung von Fragen zu verschiedenen Elementen, die auf dem Bildschirm angezeigt werden, usw. verwendet werden.
Die Einwohner von Cupertino wollen im Wettbewerb um künstliche Intelligenz nicht zurückbleiben, ein Trend, der seit letztem Jahr zunimmt und sich in konkurrierenden Geräten niederschlägt. NeuApple verhandelt mit Google über die Lizenzierung von Gemini für neue iOS 18-Funktionendas auf dem iPhone genutzt werden kann.
Du kannst folgeniPadisiertInFacebook,WhatsApp,Twitter (X)konsultieren oder konsultierenunser Telegram-Kanalum über die neuesten Technologienachrichten auf dem Laufenden zu bleiben.