문서를 JSON으로
모든 문서를 깨끗한 구조의 JSON 또는 CSV로 변환합니다.
Document to JSON은 문서를 텍스트 벽 대신 깨끗하고 구조화된 데이터로 변환합니다. 청구서, 양식, 보고서 또는 표를 이미지 또는 PDF로 업로드하면 프리미엄 AI 엔진이 읽어 키 필드, 반복 행 항목 및 모든 표를 구조화된 JSON 또는 스프레드시트용 CSV로 반환합니다. 이 단계는 OCR을 자동화에 유용하게 만듭니다. 숫자를 손으로 복사하는 대신 데이터베이스, 시트 또는 다른 시스템에 로드할 준비가 된 기계 판독 가능한 기록을 얻을 수 있습니다.
AI 엔진은 고정된 템플릿과 일치하는 대신 레이아웃을 읽기 때문에 문서별 설정 없이 청구서, 구매 주문서, 신청서, 명세서, 표 보고서를 처리할 수 있으며 100개 이상의 인식 언어에서 작동합니다. 필드 라벨은 키가 되고, 항목 행은 개체의 어레이가 되며, 그리드는 테이블로 반환되며, 파이프라인이 신뢰할 수 있도록 매번 동일한 형태로 반환됩니다.
ocr.chat은 구조화된 결과를 원본과 함께 표시하여 다운스트림으로 흐르기 전에 값을 확인할 수 있으며 /api/v1/ocr/의 REST API를 통해 전체 흡수를 자동화할 수 있습니다. 시도하기 위해 가입할 필요가 없으며 파일은 자동으로 삭제되며 판매 또는 공유되지 않습니다. 구조화된 추출은 프리미엄 AI 계층에서 실행되며, 월 5달러부터 유료 계획을 통해 더 많은 페이지, 일괄 처리 및 API 액세스를 추가할 수 있습니다.
어떻게 문서를 json으로
일반적인 사용
- API에 문서를 게시하고 반환된 JSON을 저장하는 자동 파이프라인을 구축하는 개발자.
- 운영팀이 양식 또는 애플리케이션 스택을 데이터베이스의 행으로 변환합니다.
- 재무팀이 회계 시스템을 위해 청구서 및 명세서에서 필드 및 행 항목을 추출합니다.
- 분석가가 PDF 보고서에서 테이블을 CSV로 끌어들여 재타이핑 없이 분석합니다.
- 구매 주문을 구조화된 기록으로 변환하여 청구서와 일치시키는 조달 직원.
- 문서에서 수동 데이터 입력을 구조화되고 반복 가능한 내보내기로 대체하는 사용자.
자주 묻는 질문
API를 통해 이것을 사용
단일 POST로 프로그래밍 방식으로 이 도구를 실행합니다. 계정 페이지에서 API 토큰으로 인증합니다.
curl -X POST https://ocr.chat/api/v1/ocr/ \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-F "file=@your-file.png" \
-F "tool=extract-data"
5페이지 이하의 파일은 인라인 결과를 반환합니다. 그렇지 않으면 작업을 폴링한 다음 다음과 같이 다운로드합니다. json:
curl -L "https://ocr.chat/api/v1/ocr/JOB_UUID/download/?format=json" \
-H "Authorization: Bearer YOUR_API_TOKEN" -o result.json
API 문서 읽기 →