Zum Inhalt springen

Bild-Metadaten erzeugen. Lokal.

Erstelle reichhaltige, strukturierte Metadaten aus Bildern mit lokalen Vision-Modellen — ohne Uploads, Abos oder dass Daten deinen Mac verlassen.

Benötigt einen Apple Silicon-Mac mit macOS 26

Von VisionTagger erzeugte Metadaten für ein Bild mit lokaler KI

Wähle ein Modell — oder bring dein eigenes mit

Lade vorkonfigurierte Vision-Modelle in der App herunter oder verknüpfe dein eigenes GGUF-Modell und die passenden Projektor-Dateien. Wähle das Modell, das am besten zu deinen Bildern und deinen Qualitätsanforderungen passt, und feintune dann die Generierung mit anpassbaren Parametern, um konsistente, wiederholbare Ergebnisse zu bekommen. Die gesamte Verarbeitung läuft lokal auf Apple Silicon (M1 oder neuer) und nutzt die Leistung deines Macs statt eines Cloud-Dienstes.

VisionTagger-Oberfläche zur Modellauswahl

Definiere dein eigenes Metadaten-Schema

Erzeuge nur die Metadaten, die du wirklich brauchst. Aktiviere eingebaute Sektionen wie Titel, Beschreibung, Keywords, Inhalt & Stil und Sicherheit & Compliance — und erweitere sie dann um eigene Sektionen und Felder, die auf deinen Workflow zugeschnitten sind. Für jedes Feld wählst du einen Datentyp (Boolean, Text oder Liste von Texten) und schreibst einen Prompt, der dem Modell exakt sagt, was es extrahieren soll. Das Ergebnis sind strukturierte Metadaten, die zu deinen Konventionen passen und über große Batches hinweg konsistent bleiben.

VisionTagger-Inhaltskonfiguration mit anpassbaren Metadaten-Sektionen und Feldern

Exportiere Metadaten dorthin, wo du sie brauchst

Veröffentliche Metadaten in dem Format, das am besten zu deiner Pipeline passt. Für XMP-Sidecars und eingebettete Metadaten integriert sich VisionTagger mit ExifTool — einem Branchenstandard und weithin vertrauenswürdigen Tool. Deine Metadaten erscheinen in Apps wie Adobe Lightroom, Bridge, Capture One, Photo Mechanic und jeder anderen Software, die XMP liest. Schreib zurück in deine Fotos-Mediathek, exportiere JSON oder TXT pro Bild oder erzeuge eine einzelne Datei für einen kompletten Run. Füge Finder-Tags für schnelle Organisation in macOS hinzu. Wähle mehrere Ausgaben gleichzeitig und konfiguriere sie zusammen — damit ein Generierungslauf jedes Ziel versorgt, das du nutzt.

Beispiel für VisionTagger-Publish-Konfiguration

Anwendungsfälle

  • Für alle, die dieses eine Bild später wiederfinden wollen indem du durchsuchbare Titel, Beschreibungen, Keywords und Tags für deine Mediathek erzeugst.

  • Web-Teams, die Alt-Text in großem Umfang erstellen erstelle präzise, konsistente Alt-Texte für Website-Bilder, um Barrierefreiheit und SEO zu verbessern – lokal, ohne Upload.

  • Fotograf*innen, die große Shootings verwalten beschleunige Auswahl, Katalogisierung, Auslieferung und Archiv-Workflows mit konsistenten Metadaten.

  • Designer*innen, die Asset-Bibliotheken organisieren mache Stimmung, Stil, Motiv und Nutzung projektübergreifend leichter auffindbar.

  • Forscher*innen und Archivar*innen, die Sammlungen taggen erstelle strukturierte, konsistente Metadaten für Datensätze, Aufzeichnungen und langfristige Archivierung.

Systemanforderungen

  • macOS Tahoe 26.0 oder neuer

  • Apple Silicon erforderlich (M1 oder neuer)

  • Für optimale Leistung mit größeren Modellen werden 16 GB RAM oder mehr empfohlen

  • Modellspeicher: plane mit ca. 4–8 GB pro Modell (lokal heruntergeladen)

Von Bildern zu Metadaten — in sechs Schritten

Demo auf YouTube ansehen

Einmalkauf

29,99 €
Launch-Angebot 24,99 €

MwSt. inklusive

Kostenlose Testversion: 100 Bilder, ohne Zeitlimit
Einmal bezahlen. Keine laufenden Gebühren.
Ein Nutzer. Mehrere Macs.

VisionTagger FAQ

Welche Vision-Modelle sind enthalten?

VisionTagger enthält vier vorkonfigurierte Vision-Modelle: Qwen2.5-VL 7B Instruct, Gemma 3 4B IT, InternVL3 8B Instruct und Pixtral 12B. Kleinere Modelle laufen meist schneller, während größere Modelle je nach deinem Mac und den gewählten Einstellungen mehr Details liefern können, aber mehr Speicher brauchen. Nutze die Testversion, um Modelle zu vergleichen und Parameter so lange zu justieren, bis die Ergebnisse zu deinem Workflow und deinem gewünschten Detailgrad passen.

Kann ich eigene Modelle verwenden?

Ja. Wenn du ein GGUF-kompatibles Vision-Modell und die passende Projektor-Datei (auch GGUF) hast, kannst du sie in VisionTagger verknüpfen und wie die eingebauten Optionen nutzen. Du bist dafür verantwortlich sicherzustellen, dass deine Nutzung von Drittanbieter-Modellen ihren Lizenzen und Bedingungen entspricht.

Braucht VisionTagger eine Internetverbindung?

VisionTagger läuft lokal und lädt weder deine Bilder noch die erzeugten Metadaten hoch. Eine Internetverbindung brauchst du nur, um Modelle in der App herunterzuladen und um nach App-Updates zu suchen und sie herunterzuladen.

Wie funktioniert die kostenlose Testversion?

Mit der kostenlosen Testversion kannst du bis zu 100 Bilder ohne Kosten verarbeiten, ohne Zeitlimit. Du kannst den kompletten Workflow erkunden — Modellauswahl, eingebaute Sektionen, Custom-Felder und Export-Optionen — bevor du kaufst.

Welche Bildformate und Quellen werden unterstützt?

VisionTagger unterstützt gängige Bildformate wie JPEG, PNG, TIFF, HEIC und WebP. Du kannst Bilder aus Ordnern auf deinem Mac auswählen oder direkt aus deiner Fotos-Mediathek.

Kann ich die Metadaten-Felder anpassen?

Ja. Zusätzlich zu den eingebauten Sektionen (Titel, Beschreibung, Keywords, Inhalt & Stil, Sicherheit & Compliance) kannst du eigene Sektionen erstellen und deine eigenen Felder hinzufügen. Jedes Feld unterstützt einen Datentyp (Boolean, Text oder Liste von Texten) und einen eigenen Prompt, damit du genau festlegen kannst, was das Modell extrahiert.

Welche Ausgaben kann VisionTagger erzeugen?

VisionTagger kann pro Bild JSON oder TXT exportieren oder eine einzelne JSON/TXT-Datei für einen gesamten Batch. Außerdem kann es Finder-Tags anwenden. Für XMP-Sidecars und das Einbetten von Metadaten in Bilddateien integriert sich VisionTagger mit ExifTool (separat installiert).

Muss ich ExifTool installieren?

ExifTool wird nur für XMP-Sidecars und das Einbetten von Metadaten in Bilddateien benötigt. Wenn du nur JSON/TXT exportierst oder Finder-Tags anwendest, brauchst du ExifTool nicht.

Kann VisionTagger in meine Fotos-Mediathek zurückschreiben?

Ja. VisionTagger kann Metadaten zurück in deine Fotos-Mediathek schreiben, wenn du diese Ausgabeoption auswählst. Du siehst immer eine Veröffentlichungszusammenfassung, bevor irgendetwas geschrieben wird.

Kann ich die Modell-Parameter tunen?

Ja. In den Einstellungen kannst du Generierungsparameter wie Temperatur, Max Tokens, Kontextlänge, Top-P und Top-K über Slider anpassen. So kannst du Kreativität versus Konsistenz ausbalancieren und Ausgabelänge und Detailgrad steuern.

Wie schnell ist es, und welchen Mac brauche ich?

VisionTagger erfordert Apple Silicon (M1 oder neuer) und läuft unter macOS Tahoe 26.0 oder neuer. Die Geschwindigkeit hängt von deinem Mac, dem ausgewählten Modell, der Bildauflösung und deinen gewählten Metadaten-Feldern ab. Kleinere Modelle sind typischerweise schneller; größere Modelle können bessere Ergebnisse liefern, brauchen aber ggf. mehr RAM.

Wie viel Speicherplatz brauchen Modelle?

Modell-Downloads werden lokal gespeichert. Plane grob 4–8 GB pro Modell ein (variiert je nach Modell).

Überschreibt VisionTagger vorhandene Dateien oder Metadaten?

VisionTagger zeigt vor dem Schreiben von Ausgaben eine Veröffentlichungszusammenfassung und warnt dich, wenn vorhandene Dateien überschrieben werden könnten. Du kannst die Aktionen prüfen und bestätigen, bevor irgendetwas gespeichert wird.

Sammelt VisionTagger Nutzungsdaten oder Analytics?

Nein. VisionTagger enthält keine Analytics oder Telemetrie und lädt deine Daten nicht hoch. Lizenzaktivierung und Update-Checks beinhalten bei Bedarf Netzwerk-Anfragen für diese Funktionen.