Image to Text (OCR)

Extract text from images — free

Pull editable text out of photos, screenshots and scans with accurate OCR — copy it or download in a click, in 100+ languages.

  • Accurate OCR in 100+ languages
  • Copy the text or download it instantly
  • Free · no signup · files deleted automatically

JPG, PNG, WEBP and more · Up to 50 MB

Extracted text
Extracting text

Tải lên PDF

Thả một tệp PDF để trích xuất văn bản

PDF up to 50MB

Tệp được tự động xóa sau khi xử lýKhông có hình mờSử dụng miễn phí — không cần đăng ký

Xong với PDF sang văn bản? Hãy thử tiếp các công cụ này

Những công cụ được chọn lọc kết hợp tốt với PDF sang Văn Bản. Tiếp tục làm việc mà không mất tệp của bạn.

Xem tất cả công cụ

Frequently Asked Questions

Tải lên PDF của bạn và công cụ phát hiện xem nó chứa lớp văn bản thực hay chỉ là hình ảnh quét. PDF có lớp văn bản xuất ra tức thì. PDF chỉ có hình ảnh (sách quét, hóa đơn chụp ảnh, báo cáo cũ) được chạy qua OCR tự động. Dù theo cách nào, bạn đều nhận được tệp .txt gọn gàng với đoạn văn, ngắt dòng và khoảng cách giữa các phần được giữ nguyên.

usage

Có. Nếu file PDF chỉ gồm ảnh (thường gặp với bản quét, trang chụp ảnh hoặc bản xuất từ fax), bộ máy OCR sẽ tự động kích hoạt — bạn không cần một công cụ riêng. Hỗ trợ đa ngôn ngữ được tích hợp sẵn, nên ngay cả văn bản song ngữ hay chữ viết không phải Latinh (tiếng Trung, Ả Rập, Hindi) cũng được trích xuất trong cùng một lượt.

features

Dấu ngắt đoạn, dòng trống giữa các phần, ký hiệu đầu dòng và tiền tố danh sách đánh số được giữ lại dưới dạng văn bản thuần. Tiêu đề được hiển thị bằng chữ hoa hoặc giữ nguyên kiểu chữ gốc tùy thuộc vào font nguồn. Nhấn mạnh trực quan (in đậm, in nghiêng) không được mã hóa trong văn bản thuần — để có những thứ đó, hãy dùng công cụ chuyển PDF sang Word.

technical

Có. Nhập mật khẩu vào ô nhắc sau khi tải lên, và công cụ sẽ mở khóa file trong bộ nhớ vừa đủ lâu để trích xuất văn bản. Mật khẩu không bao giờ được lưu trên ổ đĩa hay truyền tới các dịch vụ bên thứ ba. Các file PDF bị khóa mà không có mật khẩu thì không thể xử lý — vì lý do bảo mật, không có thao tác phá mật khẩu nào được thực hiện.

features

Tệp lên đến 50 MB và 500 trang được xử lý suôn sẻ. Tài liệu lớn hơn cũng được nhưng mất nhiều thời gian hơn — một kho lưu trữ pháp lý 2000 trang có thể mất vài phút để chạy OCR. Với các lô tệp khổng lồ, hãy tách PDF trước bằng công cụ Tách PDF rồi xử lý song song từng phần.

technical

Quá trình xử lý diễn ra trên các máy chủ bảo mật và tệp được xóa trong vòng vài phút. Tệp .txt đầu ra là của bạn — không hình mờ, không ghi nguồn, không theo dõi. Các nhà nghiên cứu, nhà báo, luật sư và sinh viên dùng công cụ này để trích xuất văn bản từ các báo cáo mật, yên tâm rằng tệp PDF nguồn không được lưu lại sau khi chuyển đổi.

privacy

How PDF to Text helps you get it done

Real problems it solves every day — for businesses, creators, and everyday tasks. Find the use case that fits you and start in seconds.

Education

Trích ghi chú bài giảng & khóa học

Học sinh trích xuất văn bản thuần từ bài giảng PDF và sổ tay thí nghiệm do giáo sư cung cấp để dán đoạn trích vào Notion, Obsidian và thẻ ghi nhớ học tập.

Personal Use

Trích xuất nội dung CV để nộp hàng loạt

Người tìm việc trích văn bản thuần từ CV PDF để dán vào biểu mẫu ATS, LinkedIn Easy Apply và các ô nhập liệu trên cổng tuyển dụng vốn không cho tải tệp lên.

For Business

Bản nháp email từ báo cáo PDF

Các nhà phân tích trích xuất phần tóm tắt điều hành từ những báo cáo PDF dài để dán vào email, tin nhắn Slack và cuộc trò chuyện Teams, giúp các bên liên quan nắm bắt thông tin then chốt nhanh chóng.

For Business

Kiểm tra SEO cho các tài nguyên PDF hiện có

Người làm tiếp thị trích văn bản từ các tài liệu chuyên đề PDF và eBook cũ để rà soát độ phủ từ khóa, tìm ra khoảng trống nội dung và đăng lại thành bài blog mới phục vụ tìm kiếm tự nhiên.

For Business

Chuẩn bị quy trình dịch thuật

Người dịch trích xuất văn bản từ nguồn PDF trước khi dán vào các công cụ bộ nhớ dịch như Trados, MemoQ hay DeepL Pro để bản địa hóa nhanh hơn, chính xác hơn.

Productivity

Tạo prompt AI từ các báo cáo PDF dài

Người dùng chuyên sâu trích xuất văn bản từ các bài nghiên cứu PDF và đưa vào ChatGPT, Claude hoặc Gemini làm ngữ cảnh để tóm tắt, hỏi đáp và rút trích các điểm chính.

For Business

Lưu trữ sao lưu văn bản thuần

Các nhóm CNTT và lưu trữ hồ sơ trích xuất văn bản thuần từ kho tài liệu PDF để tạo các bản sao lưu nhẹ, bền vững với thời gian, không phụ thuộc vào trình xem PDF sau 20 năm nữa.

Education

Danh sách trích dẫn & tài liệu tham khảo

Các nhà nghiên cứu trích xuất phần tài liệu tham khảo từ tệp PDF thành văn bản thuần để có thể dán vào Zotero, Mendeley hoặc EndNote mà không phải gõ lại thủ công từng mục.