Что такое оптическое распознавание символов (OCR)?

👤 Автор Abigail Brown 📧 brown@technologyhumans.com.
⏱ Public 2023-12-17 06:59.
🖍 Последнее изменение 2025-06-01 07:17.

Оптическое распознавание символов (OCR) относится к программному обеспечению, которое создает цифровую версию печатного, машинописного или рукописного документа, которую компьютеры могут читать без необходимости вручную печатать или вводить текст. OCR обычно используется для отсканированных документов в формате PDF, но может также создавать машиночитаемую версию текста в файле изображения.

Что такое OCR

OCR, также называемое распознаванием текста, представляет собой программную технологию, которая преобразует такие символы, как цифры, буквы и знаки препинания (также называемые глифами) из печатных или письменных документов в электронную форму, более легко распознаваемую и читаемую компьютерами и компьютерами. другие программные продукты. Некоторые программы OCR делают это, когда документ сканируется или фотографируется цифровой камерой, а другие могут применять этот процесс к документам, которые ранее были отсканированы или сфотографированы без OCR. OCR позволяет пользователям выполнять поиск в документах PDF, редактировать текст и переформатировать документы.

Сканирование исторической газеты с помощью программы OCR.

Getty Images

Для чего используется OCR?

Для быстрого повседневного сканирования OCR может не иметь большого значения. Если вы выполняете большой объем сканирования, возможность поиска в PDF-файлах, чтобы найти именно тот, который вам нужен, может сэкономить немало времени и сделать функциональность OCR в вашей программе сканера более важной. Вот некоторые другие вещи, с которыми помогает OCR:

Автоматизированная обработка данных и ввод данных (Пример: системы отслеживания соискателей для резюме).
Предоставление возможности поиска по отсканированным книгам.
Преобразование рукописных отсканированных изображений в текст, читаемый компьютером.
Повышение удобства использования документов с помощью программ для чтения, помогающих слабовидящим пользователям.
Сохранение исторических документов и газет, а также обеспечение возможности поиска по ним.
Извлечение данных и передача в бухгалтерские программы (Пример: квитанции и счета-фактуры).
Индексирование документов для использования поисковыми системами.
Распознавание номерных знаков водителя камерой контроля скорости и программным обеспечением для камер на красный свет.
Синтезаторы речи для людей, которые не могут говорить - физик-теоретик Стивен Хокинг, пожалуй, самый известный пользователь программы синтезатора речи.

Итог

Почему бы просто не сфотографировать, верно? Потому что вы не сможете ничего редактировать или искать текст, потому что это будет просто изображение. Сканирование документа и запуск программного обеспечения OCR могут превратить этот файл во что-то, что вы сможете редактировать и иметь возможность искать.

История OCR

В то время как самое раннее использование распознавания текста относится к 1914 году, широкое развитие и использование технологий, связанных с OCR, всерьез началось в 1950-х годах, в частности, с создания очень упрощенных шрифтов, которые было легче преобразовать в цифровой формат. читаемый текст. Первый из этих упрощенных шрифтов был создан Дэвидом Шепардом и широко известен как OCR-7B. OCR-7B до сих пор используется в финансовой индустрии для стандартного шрифта, используемого на кредитных и дебетовых картах. В 1960-х годах почтовые службы в нескольких странах начали использовать технологию OCR для значительного ускорения сортировки почты, включая США, Великобританию, Канаду и Германию. OCR по-прежнему является основной технологией, используемой для сортировки почты почтовыми службами по всему миру. В 2000 году ключевые знания об ограничениях и возможностях технологии OCR были использованы для разработки программ CAPTCHA, используемых для остановки ботов и спамеров.

За десятилетия OCR стал более точным и сложным благодаря достижениям в смежных областях технологий, таких как искусственный интеллект, машинное обучение и компьютерное зрение. Сегодня программное обеспечение OCR использует распознавание образов, обнаружение признаков и интеллектуальный анализ текста, чтобы преобразовывать документы быстрее и точнее, чем когда-либо прежде.

FAQ

Как сканировать документы с помощью телефона или планшета?

В iOS откройте приложение «Заметки» и создайте новую заметку. Откройте камеру и нажмите Сканировать документы. На Android откройте Google Диск и выберите Plus (+), затем нажмите Scan, чтобы отсканировать документ с помощью телефона.

Как использовать OCR в Adobe Acrobat?

Откройте файл PDF, содержащий отсканированное изображение, затем выберите Инструменты > Редактировать PDF. Acrobat автоматически применит OCR, чтобы вы могли редактировать текст. Просто выберите, где вы хотите внести изменения, и начните печатать.

В чем разница между OCR и OMR?

Оптическое распознавание меток (OMR) - это программное обеспечение, которое обнаруживает метки на бумаге, обычно на пузырьковом листе. OMR используется для обработки результатов экзаменов, опросов, анкет и даже выборов. В отличие от OCR, OMR не может расшифровать метки на странице, а только проверяет наличие меток.

Рекомендуемые:

Что такое оптическое распознавание символов (OCR)?

Оглавление:

Что такое OCR

Для чего используется OCR?

Итог

История OCR

FAQ

Как сканировать документы с помощью телефона или планшета?

Как использовать OCR в Adobe Acrobat?

В чем разница между OCR и OMR?

Рекомендуемые:

Используйте функцию Excel RIGHT для извлечения символов

Что такое блок питания? Что такое блок питания ATX?

Что такое кнопка питания и что такое символы включения/выключения?

Что такое цифровое оптическое соединение?

Распознавание лиц ищет вас в Интернете

Как исправить, если Spotify не может воспроизвести текущую песню

Почему приложения для фитнеса и привычек должны быть добрее

Выражение лица может сделать виртуальную реальность более доступной и захватывающей

50 лучших селфи-титров 2022 года

Дроны могут помочь фермерам выращивать больше еды

Как отключить Pandora

Команды поиска Google: полный список

Как заставить Alexa воспроизводить Amazon Music

Как удалить часто посещаемые сайты на вашем iPhone

Как удалить Windows 10

Используйте безопасный режим для диагностики проблем с запуском Microsoft Word

Знайте и управляйте своими параметрами представления значков в Finder

Обзор Sonos Play:1: маленькая мощная колонка для потоковой передачи

The Beatles: Список песен рок-группы

Что такое антивирус и что он делает?