Оглавление:
- Определение - Что означает оптическое распознавание символов (OCR)?
- Techopedia объясняет оптическое распознавание символов (OCR)
Определение - Что означает оптическое распознавание символов (OCR)?
Оптическое распознавание символов (OCR) относится как к технологии, так и к процессу чтения и преобразования напечатанных, напечатанных или рукописных символов в машинно-закодированный текст или что-то, чем может манипулировать компьютер. Это подмножество распознавания изображений и широко используется в качестве формы ввода данных, причем ввод представляет собой некий печатный документ или запись данных, такую как банковские выписки, счета-фактуры, паспорта, резюме и визитные карточки. Документ либо отсканирован, либо сделан снимок, и программа должна распознавать символы и выводить текст в виде текстового документа.
Techopedia объясняет оптическое распознавание символов (OCR)
Оптическое распознавание символов - это распознавание специфических для языка символов компьютером путем анализа изображения, которое уже читается компьютером. Это часто делается, сначала снимая изображение документа, сканируя его или делая цифровую фотографию. Это создает растровое изображение, состоящее из данных, которые понимает компьютер, и с помощью специально запрограммированных алгоритмов, большинство из которых используются в области искусственного интеллекта, компьютер распознает узоры на изображении, и в этом случае узоры являются символами. Затем программа создает или выводит коды символов, обычно ASCII, которые эквивалентны распознанным символам из входного изображения. Большинство программ OCR должны быть обучены, чтобы они могли лучше распознавать персонажей.
