Что такое оптическое распознавание символов (OCR)?

Оглавление:

Что такое оптическое распознавание символов (OCR)?
Что такое оптическое распознавание символов (OCR)?
Anonim

Оптическое распознавание символов (OCR) относится к программному обеспечению, которое создает цифровую версию печатного, машинописного или рукописного документа, которую компьютеры могут читать без необходимости вручную печатать или вводить текст. OCR обычно используется для отсканированных документов в формате PDF, но может также создавать машиночитаемую версию текста в файле изображения.

Что такое OCR

OCR, также называемое распознаванием текста, представляет собой программную технологию, которая преобразует такие символы, как цифры, буквы и знаки препинания (также называемые глифами) из печатных или письменных документов в электронную форму, более легко распознаваемую и читаемую компьютерами и компьютерами. другие программные продукты. Некоторые программы OCR делают это, когда документ сканируется или фотографируется цифровой камерой, а другие могут применять этот процесс к документам, которые ранее были отсканированы или сфотографированы без OCR. OCR позволяет пользователям выполнять поиск в документах PDF, редактировать текст и переформатировать документы.

Image
Image
Сканирование исторической газеты с помощью программы OCR.

Getty Images

Для чего используется OCR?

Для быстрого повседневного сканирования OCR может не иметь большого значения. Если вы выполняете большой объем сканирования, возможность поиска в PDF-файлах, чтобы найти именно тот, который вам нужен, может сэкономить немало времени и сделать функциональность OCR в вашей программе сканера более важной. Вот некоторые другие вещи, с которыми помогает OCR:

  • Автоматизированная обработка данных и ввод данных (Пример: системы отслеживания соискателей для резюме).
  • Предоставление возможности поиска по отсканированным книгам.
  • Преобразование рукописных отсканированных изображений в текст, читаемый компьютером.
  • Повышение удобства использования документов с помощью программ для чтения, помогающих слабовидящим пользователям.
  • Сохранение исторических документов и газет, а также обеспечение возможности поиска по ним.
  • Извлечение данных и передача в бухгалтерские программы (Пример: квитанции и счета-фактуры).
  • Индексирование документов для использования поисковыми системами.
  • Распознавание номерных знаков водителя камерой контроля скорости и программным обеспечением для камер на красный свет.
  • Синтезаторы речи для людей, которые не могут говорить – физик-теоретик Стивен Хокинг, пожалуй, самый известный пользователь программы синтезатора речи.

Итог

Почему бы просто не сфотографировать, верно? Потому что вы не сможете ничего редактировать или искать текст, потому что это будет просто изображение. Сканирование документа и запуск программного обеспечения OCR могут превратить этот файл во что-то, что вы сможете редактировать и иметь возможность искать.

История OCR

В то время как самое раннее использование распознавания текста относится к 1914 году, широкое развитие и использование технологий, связанных с OCR, всерьез началось в 1950-х годах, в частности, с создания очень упрощенных шрифтов, которые было легче преобразовать в цифровой формат. читаемый текст. Первый из этих упрощенных шрифтов был создан Дэвидом Шепардом и широко известен как OCR-7B. OCR-7B до сих пор используется в финансовой индустрии для стандартного шрифта, используемого на кредитных и дебетовых картах. В 1960-х годах почтовые службы в нескольких странах начали использовать технологию OCR для значительного ускорения сортировки почты, включая США, Великобританию, Канаду и Германию. OCR по-прежнему является основной технологией, используемой для сортировки почты почтовыми службами по всему миру. В 2000 году ключевые знания об ограничениях и возможностях технологии OCR были использованы для разработки программ CAPTCHA, используемых для остановки ботов и спамеров.

За десятилетия OCR стал более точным и сложным благодаря достижениям в смежных областях технологий, таких как искусственный интеллект, машинное обучение и компьютерное зрение. Сегодня программное обеспечение OCR использует распознавание образов, обнаружение признаков и интеллектуальный анализ текста, чтобы преобразовывать документы быстрее и точнее, чем когда-либо прежде.

FAQ

    Как сканировать документы с помощью телефона или планшета?

    В iOS откройте приложение «Заметки» и создайте новую заметку. Откройте камеру и нажмите Сканировать документы. На Android откройте Google Диск и выберите Plus (+), затем нажмите Scan, чтобы отсканировать документ с помощью телефона.

    Как использовать OCR в Adobe Acrobat?

    Откройте файл PDF, содержащий отсканированное изображение, затем выберите Инструменты > Редактировать PDF. Acrobat автоматически применит OCR, чтобы вы могли редактировать текст. Просто выберите, где вы хотите внести изменения, и начните печатать.

    В чем разница между OCR и OMR?

    Оптическое распознавание меток (OMR) - это программное обеспечение, которое обнаруживает метки на бумаге, обычно на пузырьковом листе. OMR используется для обработки результатов экзаменов, опросов, анкет и даже выборов. В отличие от OCR, OMR не может расшифровать метки на странице, а только проверяет наличие меток.

Рекомендуемые: