Saltar al contenido

Genera metadatos de imagen. En local.

Crea metadatos ricos y estructurados a partir de imágenes usando modelos de visión locales — sin subidas, suscripciones ni datos saliendo de tu Mac.

Requiere un Mac Apple Silicon con macOS 26

Metadatos generados por VisionTagger para una imagen usando IA local

Elige un modelo — o trae el tuyo

Descarga modelos de visión preconfigurados desde la app, o vincula tu propio modelo GGUF y archivos de proyector. Elige el modelo que mejor se adapte a tus imágenes y requisitos de calidad, y luego ajusta la generación con parámetros configurables para obtener resultados consistentes y repetibles. Todo el procesamiento se ejecuta en local en Apple Silicon (M1 o posterior), usando el rendimiento de tu Mac en lugar de un servicio en la nube.

Interfaz de selección de modelos de VisionTagger

Define tu propio esquema de metadatos

Genera solo los metadatos que realmente necesitas. Activa secciones integradas como Título, Descripción, Palabras clave, Contenido y estilo, y Seguridad y cumplimiento — y luego amplíalas con secciones y campos personalizados adaptados a tu flujo de trabajo. Para cada campo, elige un tipo de dato (Booleano, Texto o Lista de textos) y escribe un prompt que indique al modelo exactamente qué extraer. El resultado son metadatos estructurados que encajan con tus convenciones y se mantienen consistentes en lotes grandes.

Configuración de contenido de VisionTagger mostrando secciones y campos de metadatos personalizables

Exporta metadatos donde los necesites

Publica metadatos en el formato que mejor encaje con tu flujo. Para sidecars XMP y metadatos incrustados, VisionTagger se integra con ExifTool — una utilidad estándar del sector y ampliamente confiable. Tus metadatos aparecerán en apps como Adobe Lightroom, Bridge, Capture One, Photo Mechanic y cualquier otro software que lea XMP. Escribe de vuelta en tu Fototeca, exporta JSON o TXT por imagen, o genera un único archivo para toda una ejecución. Añade etiquetas de Finder para organizarte rápido en macOS. Selecciona varias salidas a la vez y configúralas juntas — para que una sola pasada de generación alimente todos los destinos que uses.

Ejemplo de configuración de publicación de VisionTagger

Casos de uso

  • Cualquiera que quiera encontrar esa imagen más tarde generando títulos, descripciones, palabras clave y etiquetas buscables para tu biblioteca.

  • Equipos web que generan texto alternativo a gran escala crean texto alternativo preciso y consistente para imágenes del sitio web para mejorar la accesibilidad y el SEO, de forma local y sin subir nada.

  • Fotógrafos que gestionan sesiones grandes aceleran la selección, el catalogado, la entrega y el archivo con metadatos consistentes.

  • Diseñadores que organizan bibliotecas de recursos hacen que el estado de ánimo, el estilo, el tema y el uso sean más fáciles de buscar entre proyectos.

  • Investigadores y archivistas que etiquetan colecciones crean metadatos estructurados y consistentes para conjuntos de datos, registros y preservación a largo plazo.

Requisitos del sistema

  • macOS Tahoe 26.0 o posterior

  • Se requiere Apple Silicon (M1 o posterior)

  • Para un rendimiento óptimo con modelos más grandes, se recomiendan 16 GB de RAM o más

  • Almacenamiento de modelos: cuenta con ~4–8 GB por modelo (descargados localmente)

De imágenes a metadatos — en seis pasos

Ver demo en YouTube

Compra única

29,99 €
Oferta de lanzamiento 24,99 €

IVA incluido (excepto US & CA)

Prueba gratuita: 100 imágenes, sin límite de tiempo
Un solo pago. Sin cuotas recurrentes.
Un solo usuario. Varios Mac.
Descargar prueba gratuita
Comprar VisionTagger

Pago seguro a través de FastSpring

Preguntas frecuentes de VisionTagger

¿Qué modelos de visión están incluidos?

VisionTagger incluye cuatro modelos de visión preconfigurados: Qwen2.5-VL 7B Instruct, Gemma 3 4B IT, InternVL3 8B Instruct y Pixtral 12B. Los modelos más pequeños suelen ir más rápido, mientras que los más grandes pueden producir resultados con más detalle, pero requieren más memoria, según tu Mac y la configuración elegida. Usa la prueba para comparar modelos y ajustar parámetros hasta que los resultados encajen con tu flujo de trabajo y tu nivel de detalle preferido.

¿Puedo usar mis propios modelos?

Sí. Si tienes un modelo de visión compatible con GGUF y su archivo de proyector correspondiente (también GGUF), puedes vincularlos en VisionTagger y usarlos como las opciones integradas. Tú eres responsable de asegurar que tu uso de modelos de terceros cumpla con sus licencias y términos.

¿VisionTagger requiere una conexión a internet?

VisionTagger funciona en local y no sube tus imágenes ni los metadatos generados. Solo se necesita internet para descargar modelos dentro de la app y para comprobar y descargar actualizaciones.

¿Cómo funciona la prueba gratuita?

La prueba gratuita te permite procesar hasta 100 imágenes sin coste, sin límite de tiempo. Puedes explorar el flujo completo—selección de modelo, secciones integradas, campos personalizados y opciones de exportación—antes de comprar.

¿Qué formatos y fuentes de imagen son compatibles?

VisionTagger admite formatos de imagen comunes como JPEG, PNG, TIFF, HEIC y WebP. Puedes seleccionar imágenes desde carpetas de tu Mac o directamente desde tu Fototeca.

¿Puedo personalizar los campos de metadatos?

Sí. Además de las secciones integradas (Título, Descripción, Palabras clave, Contenido y estilo, Seguridad y cumplimiento), puedes crear secciones personalizadas y añadir tus propios campos. Cada campo admite un tipo de dato (Booleano, Texto o Lista de textos) y su propio prompt, para que puedas ajustar exactamente lo que extrae el modelo.

¿Qué salidas puede crear VisionTagger?

VisionTagger puede exportar JSON o TXT por imagen, o un único archivo JSON/TXT para un lote completo. También puede aplicar etiquetas de Finder. Para sidecars XMP e incrustar metadatos en archivos de imagen, VisionTagger se integra con ExifTool (se instala por separado).

¿Necesito instalar ExifTool?

ExifTool solo es necesario para sidecars XMP e incrustar metadatos en archivos de imagen. Si solo exportas JSON/TXT o aplicas etiquetas de Finder, no necesitas ExifTool.

¿Puede VisionTagger escribir de vuelta en mi Fototeca?

Sí. VisionTagger puede escribir metadatos de vuelta en tu Fototeca cuando eliges esa opción de salida. Siempre verás un resumen de publicación antes de que se escriba nada.

¿Puedo ajustar los parámetros del modelo?

Sí. En Ajustes puedes modificar parámetros de generación como temperatura, tokens máximos, longitud de contexto, top-P y top-K con deslizadores. Esto te ayuda a equilibrar creatividad frente a consistencia y a controlar la longitud y el nivel de detalle de la salida.

¿Qué tan rápido es y qué Mac necesito?

VisionTagger requiere Apple Silicon (M1 o posterior) y funciona en macOS Tahoe 26.0 o posterior. La velocidad depende de tu Mac, el modelo seleccionado, la resolución de la imagen y los campos de metadatos que elijas. Los modelos más pequeños suelen ser más rápidos; los más grandes pueden producir resultados de mayor calidad pero pueden requerir más RAM.

¿Cuánto espacio en disco usan los modelos?

Las descargas de modelos se almacenan en local. Cuenta con aproximadamente 4–8 GB por modelo (varía según el modelo).

¿VisionTagger sobrescribirá archivos o metadatos existentes?

VisionTagger muestra un resumen de publicación antes de escribir cualquier salida y te avisa si podrían sobrescribirse archivos existentes. Puedes revisar las acciones y confirmar antes de que se guarde nada.

¿VisionTagger recopila datos de uso o analíticas?

No. VisionTagger no incluye analíticas ni telemetría, y no sube tus datos. La activación de la licencia y las comprobaciones de actualización implican solicitudes de red cuando se necesitan para esas funciones.