Adobe OCR не распознает текст [Fix]

Оптическое распознавание символов (OCR) может быть лучше, чем нарезанный хлеб, для тех, кто должен преобразовывать страницы текста в редактируемый текст. может быть, у вас есть страницы текста, которые вы сканируете на свой компьютер, и теперь их нужно преобразовать в редактируемую форму. Может быть, не хватает времени, чтобы печатать, или просто слишком много, чтобы печатать. Что ж, оптическое распознавание символов может помочь именно в этом. Вы можете отсканировать страницы на компьютер и открыть их с помощью Adobe Acrobat и попытаться использовать функцию распознавания текста, чтобы распознать текст и предоставить редактируемую версию. Как только вы собираетесь исполнить танец победы, вы получаете сообщение об ошибке Acrobat не может выполнить распознавание (OCR) на этой странице, поскольку эта страница содержит отображаемый текст.

Adobe OCR не распознает текст

Adobe OCR не распознает текст

Acrobat Professional имеет возможности OCR, которые позволяют сохранять отсканированные документы в формате RTF или в виде документов Microsoft Word, как Doc, так и Docx. Может быть случай, когда вы открываете документ в Adobe Acrobat Professional и видите текст, однако Acrobat выдает ошибку. Acrobat не может использовать OCR для текста, это может быть вызвано несколькими причинами.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

  1. Рендерируемый/редактируемый текст
  2. Искаженный или размытый источник
  3. Некачественный оригинал
  4. Графика и формы

Acrobat не смог выполнить распознавание (OCR) на этой странице, поскольку эта страница содержит отображаемый текст.

1]Рендерируемый/редактируемый текст

Воспроизводимый текст — это редактируемый текст, существующий в файле, для которого вы хотите выполнить распознавание символов. Acrobat не может выполнять распознавание текста в документе, содержащем отображаемый текст. Это наименее очевидная причина ошибки сканирования OCR, потому что мы всегда предполагаем, что читаемый текст также должен сканироваться OCR.

Решение:

Есть два способа справиться с ошибкой, если это проблема.

  1. Попытайтесь получить копию документа, в котором нет отображаемого текста.
  2. Преобразуйте PDF в TIFF, затем обратно в PDF и повторите попытку распознавания текста.

Чтобы преобразовать PDF в TIFF, откройте его в Acrobat и выберите «Файл», затем «Сохранить как». Когда появится диалоговое окно «Сохранить как», выберите TIFF (*.tif, *.tiff) в списке «Тип файла». Укажите место, где вы хотите сохранить файл, затем нажмите «Сохранить». Acrobat сохраняет каждую страницу PDF-документа в виде отдельного последовательно пронумерованного файла TIFF. Затем вы открываете каждый из файлов TIFF и используете Acrobat для их распознавания.

Если вы хотите объединить документы в один, сделайте следующее:

  1. Откройте Acrobat, выберите «Файл», затем «Создать PDF», затем «Из нескольких файлов».
  2. Нажмите кнопку Обзор, чтобы выбрать и добавить каждый файл PDF. Расположите файлы так, как вы хотите, чтобы они отображались в новом PDF-файле.
  3. Выберите ОК.

2]Искаженный или размытый источник

Размытый документ

Еще одна причина, по которой Acrobat не может выполнить распознавание текста в документе, заключается в том, что он имеет низкое разрешение. Документы с низким разрешением могут стать размытыми, и Acrobat не сможет выполнять для них распознавание символов.

Решение:

Получите источник документа с высоким разрешением. Если вы сканируете бумажный документ, отрегулируйте разрешение сканера так, чтобы он выполнял сканирование с более высоким разрешением.

Искаженный документ

Возможно, Acrobat не сможет выполнить распознавание текста в документе, который не выровнен должным образом. Возможно, документ был отсканирован неправильно, поэтому Acrobat не может выполнить для него распознавание символов.

Решение:

Перед началом сканирования убедитесь, что бумага, с которой вы сканируете, ровная. Вы также можете открыть искаженный документ в Photoshop и выпрямить его. Вот пост, который покажет вам, как использовать инструмент выпрямления в фотошопе. Этот инструмент может помочь вам выпрямить отсканированный документ перед выполнением оптического распознавания символов в Acrobat.

3]Некачественный оригинал

Если исходный материал имеет низкое качество, например факс, Acrobat может не выполнить его распознавание должным образом. Затем вам придется стремиться получить лучшее качество или рискнуть исправить вывод.

Решение:

Получите источник лучшего качества для выполнения OCR. Если документ низкого качества — это все, что у вас есть, вам, возможно, придется запустить OCR и надеяться, что хотя бы некоторые из них будут распознаны, а затем ввести недостающие части.

4]Графика и формы

Документы, в которых смешаны графика и формы, не будут обрабатываться OCR в Acrobat. Документы, которые будут использоваться для OCR с помощью Acrobat, не должны содержать графики или смешанные формы, иначе это может привести к ошибке, или вывод может быть неверным.

Решение:

Найдите текстовую версию документа для выполнения оптического распознавания символов. Возможно, вам также придется выполнить распознавание документа с графикой и формами, если это сработает, вам, возможно, придется внести исправления в вывод.

Что такое OCR в Adobe Acrobat?

OCR — это процесс, с помощью которого Acrobat проверяет пиксельный текст или изображение. Каждый символ распознается и превращается в текст. Acrobat сравнивает форму изображения и толщину линии со шрифтами, уже установленными на вашем ПК, в процессе распознавания текста. Ниже приведены причины ошибки сканирования OCR.

Какой формат файла не подходит для OCR?

Формат файла JPEG не является лучшим для сохранения для OCR, поскольку JPEG имеет тенденцию терять свое качество при каждом сохранении. Даже если вы конвертируете JPEG в PDF, он все равно может иметь низкое качество. Лучше всего сохранять документы в формате PDF или TIFF, если вы собираетесь выполнять в них распознавание символов.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *