跳到内容

生成图片元数据。本地完成。

用本地视觉模型从图片生成丰富、结构化的元数据——无需上传、无需订阅,数据也不会离开你的 Mac。

需要运行 macOS 26 的 Apple Silicon Mac

VisionTagger 使用本地 AI 为一张图片生成的元数据

选择一个模型——或用你自己的

在应用内下载预配置的视觉模型,或链接你自己的 GGUF 模型和 projector 文件。选择最适合你的图片与质量需求的模型,然后用可调参数微调生成设置,获得一致、可重复的结果。所有处理都在 Apple Silicon(M1 或更新机型)上本地运行,使用你 Mac 的性能,而不是云端服务。

VisionTagger 的模型选择界面

定义你自己的元数据 schema

只生成你真正需要的元数据。启用内置分区,比如 Title、Description、Keywords、Content & Style 和 Safety & Compliance —— 然后用贴合你工作流的自定义分区与字段来扩展它们。对每个字段,你都可以选择数据类型(Boolean、Text 或 List of Texts),并编写提示词,精准告诉模型该提取什么。最终得到的是结构化元数据,既符合你的规范,也能在大批量处理中保持一致。

VisionTagger 的内容配置示例,展示可自定义的元数据分区与字段

把元数据导出到你需要的地方

按最适合你流程的格式发布元数据。对于 XMP sidecar 和嵌入式元数据,VisionTagger 集成了 ExifTool —— 一个行业标准、广受信赖的工具。你的元数据会出现在 Adobe Lightroom、Bridge、Capture One、Photo Mechanic 等应用,以及任何读取 XMP 的其他软件中。你可以写回你的 Photos Library,按图片导出 JSON 或 TXT,或为整次运行生成一个单文件。还可以添加 Finder 标签,便于在 macOS 里快速整理。支持一次选择多个输出并统一配置——这样一次生成就能同时喂给你使用的每个目的地。

VisionTagger 的发布配置示例

使用场景

  • 任何想以后找到那张图的人 通过为你的图库生成可搜索的标题、描述、关键词和标签。

  • Web 团队批量生成替代文本 为网站图片生成准确、一致的替代文本,提升无障碍与 SEO —— 本地处理,无需上传。

  • 管理大型拍摄项目的摄影师 用一致的元数据加速筛选、编目、交付和归档流程。

  • 整理素材库的设计师 让情绪、风格、主题和用途在不同项目里更容易搜索。

  • 为收藏做标注的研究人员与档案工作者 为数据集、记录和长期保存创建结构化且一致的元数据。

系统要求

  • macOS Tahoe 26.0 或更高版本

  • 需要 Apple Silicon(M1 或更新机型)

  • 想在更大的模型上获得最佳性能,建议 16GB RAM 或更多

  • 模型存储:每个模型预留约 ~4–8 GB(本地下载)

从图片到元数据——六步完成

在 YouTube 上观看演示

一次性购买

€29.99
首发优惠 €24.99

已含增值税(US & CA 除外)

免费试用:100 张图片,无时间限制
一次付款。无重复费用。
单用户。多台 Mac。
下载免费试用版
购买 VisionTagger

通过 FastSpring 安全付款

VisionTagger 常见问题

内置了哪些视觉模型?

VisionTagger 内置了四个预配置的视觉模型:Qwen2.5-VL 7B Instruct、Gemma 3 4B IT、InternVL3 8B Instruct 和 Pixtral 12B。较小的模型通常运行更快;较大的模型可能输出更高细节,但会根据你的 Mac 和所选设置需要更多内存。你可以用试用版对比模型并调整参数,直到结果符合你的工作流和偏好的细节程度。

我可以使用自己的模型吗?

可以。如果你有兼容 GGUF 的视觉模型及其匹配的 projector 文件(同样是 GGUF),就能在 VisionTagger 里把它们链接起来,像内置选项一样使用。你需要自行确保对第三方模型的使用符合它们的许可与条款。

VisionTagger 需要联网吗?

VisionTagger 在本地运行,不会上传你的图片或生成的元数据。只有在应用内下载模型,以及检查并下载应用更新时才需要联网。

免费试用怎么用?

免费试用让你在没有时间限制的情况下免费处理最多 100 张图片。你可以在购买前完整体验工作流——模型选择、内置分区、自定义字段和导出选项。

支持哪些图片格式和来源?

VisionTagger 支持常见图片格式,如 JPEG、PNG、TIFF、HEIC 和 WebP。你可以从 Mac 上的文件夹选择图片,或直接从你的 Photos Library 选择。

我可以自定义元数据字段吗?

可以。除了内置分区(Title、Description、Keywords、Content & Style、Safety & Compliance)之外,你还可以创建自定义分区并添加自己的字段。每个字段都支持数据类型(Boolean、Text 或 List of Texts)以及独立的 prompt,让你能精确控制模型要提取的内容。

VisionTagger 能生成哪些输出?

VisionTagger 可以为每张图片导出 JSON 或 TXT,也可以为整批图片导出单个 JSON/TXT 文件。它还可以应用 Finder 标签。对于 XMP sidecar 和将元数据嵌入图片文件,VisionTagger 会集成 ExifTool(需另行安装)。

我需要安装 ExifTool 吗?

ExifTool 只在生成 XMP sidecar 和将元数据嵌入图片文件时需要。如果你只导出 JSON/TXT 或应用 Finder 标签,就不需要 ExifTool。

VisionTagger 能写回我的 Photos Library 吗?

可以。当你选择该输出选项时,VisionTagger 可以把元数据写回你的 Photos Library。写入之前你总会看到发布摘要。

我可以调模型参数吗?

可以。在设置里你可以用滑块调整 temperature、max tokens、context length、top-P 和 top-K 等生成参数。这能帮助你在创意和一致性之间做平衡,并控制输出长度与细节。

速度怎么样,我需要什么 Mac?

VisionTagger 需要 Apple Silicon(M1 或更新机型),并在 macOS Tahoe 26.0 或更高版本上运行。速度取决于你的 Mac、所选模型、图片分辨率以及你选择的元数据字段。较小的模型通常更快;较大的模型可能产出更高质量结果,但可能需要更多 RAM。

模型会占用多少磁盘空间?

模型下载会保存在本地。每个模型大约需要 4–8 GB(因模型而异)。

VisionTagger 会覆盖已有文件或元数据吗?

VisionTagger 在写入任何输出前都会显示发布摘要,并在可能覆盖已有文件时提醒你。你可以先检查将要执行的操作,并在保存前确认。

VisionTagger 会收集使用数据或分析信息吗?

不会。VisionTagger 不包含 analytics 或遥测,也不会上传你的数据。许可激活与更新检查会在这些功能需要时发起网络请求。