JSON 文档到 JSON 文档
将任何文档转换为结构清晰的 JSON 或 CSV 。
JSON 将任何文档转换成干净、结构化的数据而不是文字墙。 上传一张发票、 表格、 报告或表格作为图像或 PDF, 并使用 IP AI 引擎读取它, 并返回关键字段、 重复的线条项目、 以及任何表格作为结构化 JSON 或 CSV 电子表格。 这使得 OCR 可用于自动化的步骤是: 而不是手工复制数字, 而是将机器可读的记录装入数据库、 工作表 或其他系统。
其设计师和业务团队需要从规模文档中获取数据。 由于AI 引擎阅读了布局而不是匹配固定模板,它处理发票、采购订单、应用表、报表和表格报告,而没有设置每个文件,它使用100+识别语言。 外地标签成为键,逐项列出的行成为一系列对象,网格作为表格返回,每次形状都相同,这样管道就可以依赖它。
ocr.chat 显示原始值旁边的结构结果, 这样您就可以在下游流动之前验证值, 并且 / api/ v1/ ocr/ 的 REST API 允许您将整个接收量自动化。 没有注册可尝试、 文件自动删除, 也没有任何东西被出售或共享。 结构提取在 AI 级上运行; 5/ mo 的付款计划会增加页数、 批量处理和 API 访问 。
如何 json 文档到 json 文档
1
上传文档
拖曳到一张图像或发票、表格、报表或表格的PDF中,您想要将表格变成数据。
2
让AI引擎读读它
溢价引擎自动提取字段、细列项目和表格,绘制键的标签。
3
审查结构数据
检查 JSON 字段和行与原始的对齐, 并标明任何不确定之处, 以便快速编辑 。
4
JSON或CSV出口
下载您的代码或电子表格 CSV 的干净 JSON, 或者通过 API 程序将其提取 。
通用用途
- 开发者建造自动管道,将文件张贴到API,并储存归还的JSON。
- 操作团队在数据库中将表格或应用程序堆叠成行。
- 财务小组从发票和会计系统报表中提取外地和细列项目。
- 分析员将PDF报告表格输入CSV,以供分析,不重排类型。
- 采购工作人员将定购单转换成结构化记录,以与发票相符。
- 任何人用结构化的、可重复的出口取代手工输入文件数据。
经常问到的问题
它将文档的键字段作为 JSON 对象返回,将任何重复行作为列列项目,并将任何网格作为表格,与转录文本一起,这样你就能得到结构化的数据,而不仅仅是文本倾弃。
发票、收据、表格、订购单、报表和表格作为图像或PDF报告所有工作,作为图像或PDF。 由于它读的是布局而不是固定模板,它处理的新格式没有设置。
是。下载结构化的JSON用于程序,或CSV直接在Excel、数字或谷歌工作表中打开线条项目和字段。
是的。每个结果都使用相同的顶层形状、字段、行项目和表格,所以您的代码可以每次都用同样的方式分析。
是。 POST 是一个文件, 使用工具=Explet- data, 并下载结果 : JSON 或 CSV。 整个输入过程可以无人看管 。
是。分条目行,如发票线条或订单项目,作为一组带有一致键的物体返回,以便逐行装入。
非线条项目的网格在表格矩阵中作为单元格行返回,头行首先,准备写入电子表格。
是,承认涵盖100以上语言,因此,从国际来源提取的文件与从当地来源提取的文件相同,其价值以其原始语言和格式保存。
缺失的字段被忽略而不被猜测, 引擎无法读取的任何内容都标记了, 这样您就可以在使用数据前对照原始数据校正 。
您可以上传图像和多页 PDF。 信用额按页计算, 因此较长的文档和较大批量的批量只是从您的计划中提取更多的信用额。
文件只处理为提取数据,然后自动删除。我们从不出售或分享您的文件。
您可以在不注册的情况下尝试, 免费账户包括每月一页的纸桶。 结构提取使用保险金AI级; 5美元/ mo的付款计划增加页数、 批量处理和 API 访问。
通过 API 使用此功能
程序运行此工具时使用一个 POST 。 验证时使用账户页面上的 API 符号 。
curl -X POST https://ocr.chat/api/v1/ocr/ \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-F "file=@your-file.png" \
-F "tool=extract-data"
5页以下的文件, 5页以下的文件返回结果内线; 否则对任务进行民意调查, 然后按 json:
curl -L "https://ocr.chat/api/v1/ocr/JOB_UUID/download/?format=json" \
-H "Authorization: Bearer YOUR_API_TOKEN" -o result.json
读取 API 文档 →