Meta stellt bahnbrechendes Objekterkennungs-KI-Modell „SAM“ und unübertroffenen Datensatz vor
Facebooks Muttergesellschaft Meta hat ihren neuesten Vorstoß in die Welt der künstlichen Intelligenz angekündigt. Das neue KI-Modell von Meta mit dem Namen „Segment Anything Model“ kann einzelne Objekte in einem Bild oder Video mit bemerkenswerter Genauigkeit identifizieren und isolieren.
Laut Meta ist das „Segment Anything Model“ mehr als nur ein Werkzeug zur Inhaltserstellung und Fotobearbeitung; Es kann möglicherweise die Art und Weise verändern, wie wir die Welt um uns herum sehen und mit ihr interagieren. Die Fähigkeit des Tools, einzelne Objekte innerhalb eines Bildes zu identifizieren, eröffnet eine Vielzahl von Möglichkeiten für Branchen, die von AR (Augmented Reality) bis hin zur wissenschaftlichen Forschung reichen.
Neben der Vorstellung seines neuen KI-Modells hat Meta auch dieses zur Verfügung gestellt ein bahnbrechender Datensatz von Bildanmerkungen. Dieser Datensatz, von dem Meta behauptet, er sei der umfangreichste seiner Art, enthält Anmerkungen für eine Vielzahl von Objekten und Szenarien, von alltäglichen Haushaltsgegenständen bis hin zu komplexen wissenschaftlichen Bildern.
Das SAM-KI-Modell von Meta kann Objekte erkennen, die es hat Nicht darauf trainiert
Was SAM auszeichnet, ist seine Fähigkeit, Objekte zu identifizieren, auf die es nicht trainiert wurde, was ihm einen Vorteil gegenüber anderen KI-Modellen auf dem Markt verschafft. Benutzer können mithilfe der einfachen und benutzerfreundlichen Benutzeroberfläche von SAM Elemente in einem Video oder Bild auswählen, indem sie darauf tippen oder auf Textaufforderungen reagieren.
Bei einer kürzlichen Demonstration wurde das neue KI-Tool anhand eines Fotos auf die Probe gestellt mit mehreren Katzen. Um zu sehen, wie genau das Tool Objekte identifizieren konnte, gab der Benutzer als Eingabeaufforderung einfach das Wort „Katze“ ein. Innerhalb von Sekunden erkannte und zeichnete das Tool Kästchen um jede der Katzen auf dem Foto und demonstrierte damit seine bemerkenswerte Fähigkeit, Objekte leicht zu identifizieren.
Lesen Sie auch: Sagen Sie Hallo zum Chat GPT 4 – Eine intelligentere KI Bot
Wie funktioniert SAM?
SAM ist ein Basismodell, das Zero-Shot- und Fow-Shot-Lernen für neue Datensätze durchführen kann Aufgaben mithilfe von Aufforderungstechniken. Das Modell kann eine gültige Segmentierungsmaske für jede Eingabeaufforderung zurückgeben, einschließlich Vordergrund-/Hintergrundpunkten, groben Kästchen, Masken und Freiformtext. Das Modell muss in Echtzeit auf einer CPU in einem Webbrowser ausgeführt werden, damit Annotatoren SAM interaktiv nutzen können. SAM verwendet einen Bild-Encoder, einen Lightweight-Encoder und einen Lightweight-Decoder, um Segmentierungsmasken in nur 50 Millisekunden vorherzusagen
Was sagt Meta über SAM?
Um Fotos zu taggen, verbotenes Material zu moderieren und Beiträge für Personen auf Instagram und Facebook vorzuschlagen hat das Unternehmen eine SAM-ähnliche Technologie eingesetzt. Die Veröffentlichung von SAM wird den Zugang zu dieser Technologie einem breiteren Publikum zugänglich machen. Das neue KI-Modell und der neue Datensatz können unter einer nichtkommerziellen Lizenz von der Website des Unternehmens heruntergeladen werden. Bewerber der Demo müssen beim Hochladen ihrer Bilder zustimmen, das Tool nur zu Forschungszwecken zu verwenden.
Darüber hinaus hat das SAM-Modell potenzielle Anwendungen in der wissenschaftlichen Forschung. Es könnte Forschern helfen, bestimmte Objekte oder Tiere in Videoaufzeichnungen von Naturphänomenen im Weltraum oder auf der Erde zu identifizieren und zu überwachen.
Weitere Informationen zu den neuesten technischen Nachrichten, Listen, Anleitungen zur Fehlerbehebung sowie Tipps und Tricks dazu Windows, Android, iOS und macOS, folgen Sie uns auf , und Pinterest.
Lesen: 4