描述图像描述
上传图像并获得 AI 描述它是什么 。
描述图像是一个 AI 图像描述器 : 上传任何照片、 屏幕截图或扫描, 它会告诉你图片以清晰自然的语言显示什么 。 它没有在像 OCR 那样的图像中读取文字, 而是查看整个图片, 并解释它、 主要主题、 设置、 颜色、 动作 以及细节 。 如果您曾经在文件上看到过它, 并想知道它实际上是什么, 这会将图像转换成您可以读取、 复制或 输入到其它东西的描述 。
这部电影是为任何需要图片文字的人设计的:作者字幕、支持团队剪辑截图、研究人员编目图像、以及那些只想要理解不熟悉文件的人。 因为它在我们的高级AI愿景引擎上运行,处理普通照片、艺术作品、图表、产品图片甚至混乱的电话短片,不管图像是否包含任何文字,它都有效。
ocr.chat 简单易行: 没有可尝试的注册, 您的原始文件显示在描述旁边, 处理后自动删除文件 。 一旦您有描述, 您可以在 AI 所 看到的 上询问聊天板上图像的后续问题 。 免费识别覆盖打印文件; 图像描述器是 AI 级的附加费用的一部分, 包括5美元/ 美元( $) 的附加计划, 包括更多页、 批量处理和 API 访问 。
如何 描述图像描述
1
上传您的图像
拖曳到照片中,粘贴一个截图,或者选择一个您想要描述的图像文件。
2
让AI来看看
高档视觉引擎 检查整个情况 而不仅仅是任何文字 并研究它所显示的
3
读取描述
自然语言的描述 主题,设置, 和显著的细节, 除了你的原创。
4
复制、导出或询问更多
复制或下载描述, 或使用聊天面板询问有关图像的后续问题 。
通用用途
- 作家和销售商制作图片和股票图象的字幕和描述。
- 支助小组和温和小组迅速了解截图和用户提交的图像。
- 研究人员和档案学家将大量图像收藏编目成册,并附有可搜索描述。
- 商店和转售商描述供列入名单和库存的产品照片。
- 任何辨认出不熟悉的照片、艺术品、工厂、物品或现场的人
- 团队建立数据集,需要为每张图像提供书面描述。
经常问到的问题
OCR 读取图像中打印的文字, 并打印出来。 描述图像可以告诉你图片的内容、 主题、 场景和细节, 即使图像完全没有文字 。
照片、 截图、 艺术作品、 图表、 产品图片和扫描全部工作 。 AI 描述任何可见的东西, 从一个物体到一个复杂的场景 。
否。与OCR不同,它用于没有文字的图片。如果有可读文本,说明将简要提及其内容,但不需要文本。
AI 高级愿景引擎在识别共同主题、设置和细节方面非常有力。 您的原件在描述旁边显示, 以便您确认, AI 指示您不要猜测它看不见的东西 。
是的。在描述产生后,您可以与结果交谈,要求了解关于部分图像或具体事实的更多细节,答案以大赦国际所见为依据。
描述跟随您所支持的界面语言, 引擎可以描述含有100多种语言文本的图像 。
是的,它很好地利用了屏幕截图、网页和仪表板,总结了屏幕上的内容和可见的关键内容。
它描述了明显存在的东西,如个人、其衣物或活动,但并不试图识别或点名个人。
自由上传有大小上限; 付费计划会提高它。 大型图像会被接受, 并按视觉引擎需要调整大小 。
单个图像是即时的。 许多文件的批处理是付费计划和 API 的一部分, 这样您就可以描述整套图像文件夹 。
您的上传仅为生成描述而处理, 之后自动删除。 我们从不出售或共享您的图像 。
您可以在不注册的情况下尝试, 免费账户包括每月一页的纸桶。 图像描述器是 AI 级的保险金的一部分; 5美元/ mo 的付款计划会增加更多页、 批量处理和 API 访问 。
通过 API 使用此功能
程序运行此工具时使用一个 POST 。 验证时使用账户页面上的 API 符号 。
curl -X POST https://ocr.chat/api/v1/ocr/ \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-F "file=@your-file.png" \
-F "tool=describe-image"
5页以下的文件, 5页以下的文件返回结果内线; 否则对任务进行民意调查, 然后按 txt:
curl -L "https://ocr.chat/api/v1/ocr/JOB_UUID/download/?format=txt" \
-H "Authorization: Bearer YOUR_API_TOKEN" -o result.txt
读取 API 文档 →