문서를 JSON으로

모든 문서를 깨끗한 구조의 JSON 또는 CSV로 변환합니다.

✨ 프리미엄 AI 엔진
🔒 이것은 프리미엄 AI 도구입니다. 무료 계정을 만들어 사용하십시오. 무료로 가입하세요 로그인
🧩

스크린샷 드래그 앤 드롭 또는 붙여넣기

이미지, PDF, Word (DOCX) 또는 텍스트 - 드롭, 검색, 붙여넣기 또는 URL 사용

🔒 파일은 비공개로 처리되고 자동으로 삭제됩니다.

Document to JSON은 문서를 텍스트 벽 대신 깨끗하고 구조화된 데이터로 변환합니다. 청구서, 양식, 보고서 또는 표를 이미지 또는 PDF로 업로드하면 프리미엄 AI 엔진이 읽어 키 필드, 반복 행 항목 및 모든 표를 구조화된 JSON 또는 스프레드시트용 CSV로 반환합니다. 이 단계는 OCR을 자동화에 유용하게 만듭니다. 숫자를 손으로 복사하는 대신 데이터베이스, 시트 또는 다른 시스템에 로드할 준비가 된 기계 판독 가능한 기록을 얻을 수 있습니다.

AI 엔진은 고정된 템플릿과 일치하는 대신 레이아웃을 읽기 때문에 문서별 설정 없이 청구서, 구매 주문서, 신청서, 명세서, 표 보고서를 처리할 수 있으며 100개 이상의 인식 언어에서 작동합니다. 필드 라벨은 키가 되고, 항목 행은 개체의 어레이가 되며, 그리드는 테이블로 반환되며, 파이프라인이 신뢰할 수 있도록 매번 동일한 형태로 반환됩니다.

ocr.chat은 구조화된 결과를 원본과 함께 표시하여 다운스트림으로 흐르기 전에 값을 확인할 수 있으며 /api/v1/ocr/의 REST API를 통해 전체 흡수를 자동화할 수 있습니다. 시도하기 위해 가입할 필요가 없으며 파일은 자동으로 삭제되며 판매 또는 공유되지 않습니다. 구조화된 추출은 프리미엄 AI 계층에서 실행되며, 월 5달러부터 유료 계획을 통해 더 많은 페이지, 일괄 처리 및 API 액세스를 추가할 수 있습니다.

어떻게 문서를 json으로

1
문서 업로드
데이터로 변환할 청구서, 양식, 보고서 또는 표의 이미지 또는 PDF를 드래그합니다.
2
AI 엔진이 읽도록 허용
프리미엄 엔진은 필드, 행 항목, 테이블을 추출하고 키에 라벨을 자동으로 매핑합니다.
3
구조화된 데이터 검토
원본과 비교하여 JSON 필드와 행을 확인하고 불확실한 부분은 빠른 편집을 위해 플래그로 표시합니다.
4
JSON 또는 CSV 내보내기
코드에 대한 깨끗한 JSON 또는 스프레드시트에 대한 CSV를 다운로드하거나 API를 통해 프로그래밍으로 끌어옵니다.

일반적인 사용

  • API에 문서를 게시하고 반환된 JSON을 저장하는 자동 파이프라인을 구축하는 개발자.
  • 운영팀이 양식 또는 애플리케이션 스택을 데이터베이스의 행으로 변환합니다.
  • 재무팀이 회계 시스템을 위해 청구서 및 명세서에서 필드 및 행 항목을 추출합니다.
  • 분석가가 PDF 보고서에서 테이블을 CSV로 끌어들여 재타이핑 없이 분석합니다.
  • 구매 주문을 구조화된 기록으로 변환하여 청구서와 일치시키는 조달 직원.
  • 문서에서 수동 데이터 입력을 구조화되고 반복 가능한 내보내기로 대체하는 사용자.

자주 묻는 질문

문서의 키 필드를 JSON 객체로 반환하고, 반복되는 행을 라인 항목의 배열로 반환하고, 격자를 테이블로 반환합니다. 이렇게 하면 텍스트 덤프가 아닌 구조화된 데이터를 얻을 수 있습니다.

청구서, 영수증, 양식, 구매 주문, 명세서, 표 보고서는 모두 이미지 또는 PDF로 작동합니다. 고정 템플릿 대신 레이아웃을 읽기 때문에 설정 없이 새로운 형식을 처리합니다.

프로그래밍을 위해 구조화된 JSON을 다운로드하거나 Excel, Numbers 또는 Google 스프레드시트에서 직접 행 항목 및 필드를 열기 위해 CSV를 다운로드할 수 있습니다.

모든 결과는 동일한 최상위 형태, 필드, line_items, 테이블을 사용하여 코드가 매번 동일한 방법으로 파싱할 수 있습니다.

tool=extract-data 를 사용하여 /api/v1/ocr/에 파일을 POST한 다음 JSON 또는 CSV로 결과를 다운로드합니다. 전체 흡입은 무인으로 실행할 수 있습니다.

청구서 행이나 주문 항목과 같은 항목화된 행은 일관된 키를 가진 객체의 배열로 반환되므로 행별로 로드할 수 있습니다.

라인 항목이 아닌 그리드는 테이블 배열에서 셀의 행으로 반환되며, 헤더 행이 먼저 스프레드시트에 쓰기 준비가 됩니다.

네, 인식은 100개 이상의 언어를 포함하므로 국제 소스의 문서는 현지 문서와 동일한 방식으로 추출됩니다. 값은 원본 언어와 형식으로 유지됩니다.

누락된 필드는 추측하는 대신 간단히 빠져 나가며, 엔진이 읽을 수 없는 모든 것은 표시되므로 데이터를 사용하기 전에 원본 데이터와 비교하여 수정할 수 있습니다.

이미지와 다중 페이지 PDF를 업로드할 수 있습니다. 크레딧은 페이지당 계산되므로 긴 문서와 큰 배치는 플랜에서 더 많은 크레딧을 얻을 수 있습니다.

문서는 데이터를 추출하기 위해서만 처리되며, 이후 자동으로 삭제됩니다. 저희는 절대로 파일을 판매하거나 공유하지 않습니다.

가입 없이 시험해 볼 수 있으며 무료 계정에는 월간 페이지 버킷이 포함됩니다. 구조화 추출은 프리미엄 AI 계층을 사용합니다. $5/mo부터 유료 계획은 더 많은 페이지, 일괄 처리 및 API 액세스를 추가합니다.

API를 통해 이것을 사용

단일 POST로 프로그래밍 방식으로 이 도구를 실행합니다. 계정 페이지에서 API 토큰으로 인증합니다.

curl -X POST https://ocr.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@your-file.png" \
  -F "tool=extract-data"

5페이지 이하의 파일은 인라인 결과를 반환합니다. 그렇지 않으면 작업을 폴링한 다음 다음과 같이 다운로드합니다. json:

curl -L "https://ocr.chat/api/v1/ocr/JOB_UUID/download/?format=json" \
  -H "Authorization: Bearer YOUR_API_TOKEN" -o result.json
API 문서 읽기 →
이 페이지 평가하기
5.0/5 (0)

개선할 수 있는 점은 무엇입니까? 고객님의 피드백은 문제를 해결하는 데 도움이 됩니다.