Изображение в поисковый PDF — генератор текстового слоя OCR

Сделайте любое изображение поисковым, выбираемым PDF с скрытым слоем OCR-текста. Идеально подходит для отсканированных документов, архивирования и юридических документов.

Загрузить изображение

Отсканированное изображение или документ

PNG, JPG, WEBP, GIF, TIFF, BMP

О поисковом PDF

Создаётся PDF, который выглядит идентично вашему изображению, но содержит невидимый текстовый слой Тессеракта под ним, чтобы пользователи могли копировать текст, искать внутри документа, а экранные ридеры могли его читать.

Продолжайте улучшать свои изображения

Выведите редактирование фотографий на новый уровень с помощью этих популярных инструментов

Frequently Asked Questions

Обычный PDF с изображением — это плоская картинка, завернутая в .pdf контейнер — вы не можете выбрать, скопировать или искать текст в нём. Поисковый PDF имеет невидимый слой OCR-текста, выровнянный за каждым видимым символом, поэтому Ctrl+F находит слова, Copy работает, а экранные читатели могут читать страницу вслух, при этом визуальный вид остаётся одинаковым.

usage

Движок OCR читает каждое слово и сохраняет текст и ограничивающую рамку за оригинальным изображением на точные координаты пикселей. Визуально страница выглядит идентично оригинальному скану, но Adobe Acrobat, Preview, Chrome и каждый современный просмотрщик PDF теперь могут выбирать, искать и копировать текст, как будто это родной цифровой текст.

technical

Да. Текстовый слой — стандартный PDF (без проприетарных расширений), поэтому Adobe Acrobat (Reader и Pro), macOS Preview, встроенный PDF-просмотр Chrome, Firefox, Edge и мобильные ридеры, такие как Files, Drive и Dropbox, индексируют и ищут их. Ctrl+F или Cmd+F находит слова за считанные секунды, даже в длинных отчётах.

features

Да. Если передать несколько языковых кодов (например, eng+chi_sim+hin), OCR учитывает их все при чтении символов. Документы с смешанным шрифтом, такие как двуязычные меню, международные контракты и государственные формы, работают чисто. Для наилучших результатов сначала назначите наиболее вероятный язык в списке.

features

Текстовый слой обычно добавляет 5–15% к размеру PDF — обычно несколько сотен килобайт на 100 страниц. По сравнению с приростом (полнотекстовый поиск по всему архиву документов) это небольшая цена. Если размер важен для электронной почты, пропустите результат через PDF Compress, чтобы дополнительно обрезать большие встроенные изображения.

technical

Загрузки обрабатываются в временной рабочей папке и автоматически удаляются в течение нескольких минут после завершения конвертации. Мы никогда не обучаем модели на пользовательских файлах, не делимся ими и не добавляем водяные знаки. Это делает инструмент безопасным для юридических, HR, медицинских и бухгалтерских архивов, где конфиденциальность имеет наибольшее значение.

privacy

Use Cases

Архивы юридических документов с поиском

Юридические фирмы добавляют слои OCR-текста в отсканированные контракты, допросы и документы по раскрытию информации, чтобы параюристы могли переключаться на тысячи страниц за считанные секунды во время судебного разбирательства.

business

Архивы кадров и личных дел.

HR-команды преобразуют отсканированные файлы сотрудников, письма с предложениями и подписанные контракты в поисковые PDF, которые любой человек с разрешением может быстро найти с помощью полнотекстового поиска.

business

Справочная библиотека исследователей

Учёные и аспиранты превращают отсканированные статьи из журналов и библиотечные копии в поисковые PDF-файлы, чтобы цитаты и цитаты мгновенно появлялись в обзорах литературы.

education

Поисковые архивы рецептов и кулинарных книг

Домашние повара оцифровывают семейные кулинарные книги и старые кулинарные журналы в поисковые PDF, которые можно запросить по ингредиентам — найти каждый рецепт шоколадного торта за считанные секунды.

personal

Поиск патентов и товарных знаков

Специалисты по интеллектуальной собственности преобразуют отсканированные патентные документы и заявки на товарные знаки в поисковые PDF-файлы для запроса по ключевым словам по предыдущим произведениям и заявкам конкурентов, не допуская отсутствующего языка в цифрах.

business

Следы аудита банковских выписок

Аудиторы и судебные бухгалтеры преобразуют отсканированные банковские выписки в поисковые PDF-файлы, чтобы искать конкретных получателей, суммы и даты по годам записей.

business

Архивы налоговых документов

Частные лица и малый бизнес преобразуют отсканированные налоговые декларации, квитанции и формы 1099 в поисковые PDF-файлы, которые принимают IRS, CRA или HMRC, и которые вы можете самостоятельно проверять.

business

Поисковые отсканированные книги

Любители, библиотекари и переплётчики превращают отсканированные не изданные книги в поисковые PDF, которые работают как электронные книги — текст можно выбирать, копировать и индексировать электронными книгами.

personal