文書をJSONに変換

どんな文書も清潔な構造の JSON または CSV に変換します。

✨ プレミアムAIエンジン
🔒 これはプレミアム AI ツールです。使用するには無料アカウントを作成してください。 無料で登録 ログイン
🧩

スクリーンショットをドラッグ&ドロップまたは貼り付け

画像、PDF、Word (DOCX) またはテキスト - ドラッグ、ブラウズ、貼り付け、URLを使用

🔒 ファイルは 個人的に処理され 自動的に削除されます

Document to JSON は、テキストの壁の代わりに、どんな文書も清潔で構造化されたデータに変換します。請求書、フォーム、レポート、または表を画像または PDF としてアップロードすると、プレミアム AI エンジンがそれを読み取り、キーフィールド、繰り返し行項目、すべての表を構造化 JSON またはスプレッドシートの CSV として返します。これが、OCR を自動化に有用にするステップです。手で数字をコピーする代わりに、データベース、シート、その他のシステムにロードするための機械読み取り可能なレコードを作成します。

文書から大規模なデータを取得する必要がある開発者や運用チームのために作られた。AIエンジンは固定テンプレートにマッチするのではなく、レイアウトを読み取るため、文書ごとの設定なしに請求書、購入注文、応募フォーム、説明書、表記レポートを扱い、100以上の認識言語で動作します。フィールドラベルはキーになり、項目列はオブジェクトの配列になり、グリッドはテーブルとして返されます。毎回同じ形状で、パイプラインがそれに依存できます。

ocr.chatは、構造化された結果を元の結果と並んで表示し、値が下流に流れる前に確認できるようにし、/api/v1/ocr/にあるREST APIを使って、全体の取り込みを自動化できます。試行するための登録はありません、ファイルは自動的に削除され、売却や共有はありません。構造化抽出は、AIのプレミアムレベルで実行されます。有料プランは月額5ドルからで、より多くのページ、バッチ処理、APIアクセスを追加します。

どうやって 文書をjsonに変換

1
文書をアップロード
データに変換する請求書、フォーム、レポート、表の画像または PDF をドラッグしてください。
2
AIエンジンに読ませて
プレミアムエンジンはフィールド,行項目,表を抽出し,ラベルをキーに自動的にマッピングする。
3
構造化データを見直す
原始データと JSON フィールドと行を比較し、不確実なものは迅速な編集のためにフラグ付けします。
4
JSON または CSV をエクスポート
コードのためのクリーンな JSON をダウンロードし、スプレッドシートのための CSV をダウンロードし、API を通してプログラム的に引き出す。

一般的な用途

  • 開発者は,文書をAPIに投稿し,返されたJSONを保存する自動化パイプラインを構築した。
  • フォームやアプリケーションの積み重ねをデータベースの列に変換するオペレーションチーム。
  • 財務チームが会計システムに対して請求書や報告書からフィールドや行項目を抽出する。
  • 分析者は,再タイプせずに分析のためにPDFレポートから表をCSVに引き出す。
  • 調達スタッフが購入オーダーを構造化記録に変換し 請求書と一致させる
  • 文書から手動でデータを入力するのを構造化された繰り返し可能なエクスポートに置き換える人。

よくある質問

文書のキーフィールドを JSON オブジェクトとして返し、繰り返し行を行項目の配列として、グリッドを表として、転写テキストと共に返します。

請求書、レシート、フォーム、購入注文、決算書、表記レポートはすべて画像または PDF として動作します。固定テンプレートではなくレイアウトを読み込むので、設定なしで新しいフォーマットを扱います。

プログラム的に使うための構造化 JSON をダウンロードし、または CSV をダウンロードして Excel、Numbers、Google Spreadsheet で直接行の項目とフィールドを開きます。

はい。すべての結果は同じトップレベルの形、フィールド、line_items、テーブルを使用します。コードは毎回同じ方法で解析できます。

ファイルを /api/v1/ocr/ に tool=extract-data で POST し、結果を JSON または CSV としてダウンロードします。全体のインテークは無人で実行できます。

はい。請求書行や注文項目のような項目化された行は、一貫したキーを持つオブジェクトの配列として返されます。それを行ごとにロードできます。

行項目ではないグリッドは、ヘッダ行が最初にセルの列としてテーブルアレイに返され、スプレッドシートに書き込む準備ができています。

はい。認識は 100 以上の言語をカバーします。国際的な文書は、地元の文書と同じように抽出されます。値は、元の言語とフォーマットで保持されます。

欠落したフィールドは推測するよりも単に省略され,エンジンが読めないものはマークされ,データを使用する前に原稿と比較して修正できる。

画像や複数ページの PDF をアップロードできます。クレジットはページごとに計算されます。長い文書や大きなバッチは単にプランからより多くのクレジットを引き出します。

文書はデータを抽出するために処理され、その後自動的に削除されます。私たちはあなたのファイルを売ることも共有することもしません。

構造化抽出はプレミアムAIの階層を使用し、有料プランは$5/月から、より多くのページ、バッチ処理、APIアクセスを追加します。

API を通してこれを使う

このツールをプログラム的に実行します。一つの POST で実行します。アカウントページから API トークンで認証します。

curl -X POST https://ocr.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@your-file.png" \
  -F "tool=extract-data"

5 ページ以下のファイルはインラインで結果を返します。それ以外の場合はジョブをポールし、次にダウンロードします。 json:

curl -L "https://ocr.chat/api/v1/ocr/JOB_UUID/download/?format=json" \
  -H "Authorization: Bearer YOUR_API_TOKEN" -o result.json
API ドキュメントを読む →
このページを評価
5.0/5 (0)

改善できることは何ですか?フィードバックは問題を解決するのに役立ちます。