Tài liệu sang JSON

Đổi bất kỳ tài liệu nào thành JSON hoặc CSV có cấu trúc sạch.

✨ Công cụ AI cao cấp
🔒 Đây là công cụ AI cao cấp. Tạo một tài khoản miễn phí để sử dụng nó. Đăng ký miễn phí Đăng nhập
🧩

Kéo và thả, hoặc dán một bức ảnh màn hình

Hình ảnh, PDF, Word (DOCX) hoặc văn bản - thả, lướt, dán, hoặc sử dụng URL

🔒 Tập tin của anh được xử lý riêng tư và tự động xóa.

Document to JSON chuyển bất kỳ tài liệu nào thành dữ liệu sạch, cấu trúc thay vì một bức tường văn bản. Tải lên một hóa đơn, một mẫu, một báo cáo, hoặc một bảng như một hình ảnh hoặc PDF, và bộ máy AI cao cấp đọc nó và trả lại các trường chính, các mục lặp lại dòng, và bất kỳ bảng nào như JSON cấu trúc, hoặc như CSV cho một bảng tính. Đây là bước làm cho OCR hữu ích cho tự động hóa: thay vì sao chép số bằng tay, bạn có các ghi chép đọc máy sẵn sàng để tải vào cơ sở dữ liệu, một bảng, hoặc một hệ thống khác.

Nó được xây dựng cho các nhà phát triển và các nhóm hoạt động cần lấy dữ liệu từ tài liệu theo quy mô. Bởi vì động cơ AI đọc bảng bố trí thay vì tương ứng với một mẫu cố định, nó xử lý hóa đơn, đơn đặt hàng, mẫu ứng dụng, báo cáo, và báo cáo bảng mà không cần thiết lập mỗi tài liệu, và nó hoạt động trên hơn 100 ngôn ngữ nhận dạng. Nhãn trường trở thành khóa, hàng mục trở thành một dãy các đối tượng, và lưới trở lại như bảng, cùng hình dạng mỗi lần để đường ống của bạn có thể dựa vào nó.

ocr.chat hiển thị kết quả cấu trúc bên cạnh nguyên bản để bạn có thể kiểm tra các giá trị trước khi chúng chảy xuống, và một API REST tại /api/v1/ocr/ cho phép bạn tự động hóa toàn bộ việc nhập. Không có đăng ký để thử, các tập tin được xóa tự động, và không có gì được bán hoặc chia sẻ. Việc trích xuất cấu trúc chạy trên cấp AI cao cấp; các kế hoạch trả tiền từ $5/mo thêm nhiều trang, xử lý hàng loạt, và truy cập API.

Làm thế nào tài liệu sang json

1
Tải lên tài liệu của bạn
Kéo vào một hình ảnh hoặc PDF của hóa đơn, mẫu, báo cáo, hoặc bảng mà bạn muốn chuyển thành dữ liệu.
2
Để AI đọc nó
Động cơ premium trích xuất các trường, mục dòng và bảng, bản đồ nhãn cho các chìa khóa tự động.
3
Xem lại dữ liệu cấu trúc
Kiểm tra các trường và hàng JSON so với bản gốc, với bất kỳ điều gì không chắc chắn được đánh dấu để sửa nhanh.
4
Xuất JSON hoặc CSV
Tải xuống JSON sạch cho mã hoặc CSV cho một bảng tính, hoặc kéo nó theo chương trình thông qua API.

Dùng chung

  • Các nhà phát triển xây dựng một đường ống tự động gửi tài liệu đến API và lưu trữ JSON được trả lại.
  • Các nhóm hoạt động chuyển các đống các mẫu hoặc ứng dụng thành hàng trong cơ sở dữ liệu.
  • Các đội tài chính trích xuất các trường và các mục dòng từ hóa đơn và báo cáo cho hệ thống kế toán của họ.
  • Các nhà phân tích kéo các bảng từ báo cáo PDF vào CSV để phân tích mà không cần gõ lại.
  • Nhân viên mua sắm chuyển đổi đơn đặt hàng thành hồ sơ cấu trúc để phù hợp với hóa đơn.
  • Bất kỳ ai thay thế nhập dữ liệu thủ công từ tài liệu với một cấu trúc, xuất khẩu lặp lại.

Câu hỏi thường gặp

Nó trả về các trường khóa của tài liệu như một đối tượng JSON, bất kỳ hàng lặp lại như một dãy các mục dòng, và bất kỳ lưới như bảng, bên cạnh văn bản được phiên âm, vì vậy bạn sẽ có dữ liệu cấu trúc hơn là chỉ một văn bản ném.

Các hóa đơn, hóa đơn, mẫu, đơn đặt hàng, báo cáo, và báo cáo bảng đều hoạt động, như hình ảnh hoặc PDF. Bởi vì nó đọc bảng sắp xếp thay vì một mẫu cố định, nó xử lý các định dạng mới mà không cần cài đặt.

Có. Tải xuống JSON cấu trúc để sử dụng lập trình, hoặc CSV để mở các mục và trường trực tiếp trong Excel, Numbers, hoặc Google Sheets.

Có. Mỗi kết quả sử dụng cùng một hình dạng cấp trên, các trường, line_items, và bảng, vì vậy mã của bạn có thể phân tích nó theo cùng cách mỗi lần.

Đúng. POST một tập tin vào /api/v1/ocr/ với tool=extract-data, sau đó tải về kết quả như JSON hoặc CSV. Toàn bộ việc nhập liệu có thể chạy không cần người quản lý.

Có. Các hàng được phân loại, như hàng hóa đơn hay hàng hóa đơn đặt hàng, được trả về như một dãy các đối tượng với các chìa khóa đồng nhất, vì vậy bạn có thể tải chúng hàng hàng.

Lưới không phải là các mục dòng được trả lại trong một ma trận bảng như hàng của các tế bào, hàng đầu tiên đầu tiên, sẵn sàng để viết vào một bảng tính.

Có. Việc nhận dạng bao gồm hơn 100 ngôn ngữ, vì vậy tài liệu từ nguồn quốc tế được trích ra theo cách giống như tài liệu địa phương. Các giá trị được giữ trong ngôn ngữ và định dạng gốc.

Các trường thiếu đơn giản là bỏ qua thay vì đoán, và bất kỳ điều gì mà động cơ không thể đọc được được đánh dấu để bạn có thể sửa nó so với bản gốc trước khi sử dụng dữ liệu.

Bạn có thể tải lên ảnh và PDF nhiều trang. Điểm được tính theo trang, vì vậy tài liệu dài hơn và các tập lớn hơn chỉ đơn giản là rút thêm điểm từ kế hoạch của bạn.

Tài liệu chỉ được xử lý để trích dữ liệu và tự động xóa sau đó. Chúng tôi không bao giờ bán hay chia sẻ tập tin của bạn.

Bạn có thể thử nó mà không cần đăng ký, và một tài khoản miễn phí bao gồm một thùng trang hàng tháng. Việc trích xuất cấu trúc sử dụng cấp AI cao cấp; các kế hoạch trả tiền từ $5/mo thêm nhiều trang, xử lý hàng loạt, và truy cập API.

Dùng nó qua API

Chạy công cụ này theo lập trình với một POST duy nhất. Xác thực với token API từ trang tài khoản của bạn.

curl -X POST https://ocr.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@your-file.png" \
  -F "tool=extract-data"

Tập tin có 5 trang hoặc ít hơn trả về kết quả trong dòng; nếu không thì hỏi công việc, sau đó tải về nó như json:

curl -L "https://ocr.chat/api/v1/ocr/JOB_UUID/download/?format=json" \
  -H "Authorization: Bearer YOUR_API_TOKEN" -o result.json
Đọc tài liệu API →
Đánh giá trang này
5.0/5 (0)

Chúng tôi có thể cải thiện gì? phản hồi của bạn giúp chúng tôi khắc phục vấn đề.