Размещение текста на изображении

В настоящее время я работаю над проектом, и моя цель - найти текст на изображении. В мои намерения пока не входит распознавание текста. Я хочу в основном получить границы текста в изображении. Я использую компонент обработки изображений AForge.Net для манипуляций. Любая помощь в том или ином смысле?

Обновление 2/5/09: с тех пор я пошел другим путем в моем проекте. Однако я попытался получить текст с помощью MODI (Microsoft Office Document Imaging). Он позволяет с легкостью распознавать изображение и извлекать из него текст.

Ответов (4)

Решение

Это активная область исследований. На эту тему написано буквально куча научных статей. Будет сложно оказать вам помощь, особенно без дополнительных деталей. Вы ищете определенные типы текста? Шрифты? Только английский? Вы знакомы с академической литературой?

«Обнаружение текста» - это стандартная проблема в любой системе OCR (оптического распознавания символов), и, следовательно, существует множество битов кода в сети, которая занимается этим.

Я мог бы начать перечислять груды ссылок из Google, но я предлагаю вам просто выполнить поиск по запросу «обнаружение текста» и начать читать :). Также доступно множество примеров кода.

Преобразование ширины штриха может сделать это за вас. По крайней мере, это то, что MS разработала для ОС своего мобильного телефона. Обсуждение реализации находится здесь на https://stackoverflow.com/

Распознавание текста внутри изображения действительно является горячей темой для исследователей в этой области, но начало выходить из-под контроля только тогда, когда капча стала «нормой» с точки зрения защиты от спам-ботов. Зачем использовать капчу в качестве защиты? ну, потому что очень трудно найти (и прочитать) текст внутри изображения!

Причина, по которой я упоминаю капчи, заключается в том, что наибольший прогресс * достигается в этой крошечной области, и я думаю, что ваше решение может быть лучше всего найдено там. особенно потому, что капчи действительно предназначены для поиска текста (или чего-то, что напоминает текст) внутри загроможденного изображения и последующей попытки правильно прочитать буквы.

так что если вы можете найти себе инструмент хороший открытый источник CAPTCHA , нарушение вы , вероятно , есть все , что вам нужно , чтобы продолжить поиски ...
Вы могли бы даже выбросить большинство dificult код , который обрабатывает распознавание символов сам, потому что используются те - х OCR для чтения искаженный текст, то, что вам не нужно делать.

*: продвижение с точки зрения видимой, полезной и практической информации для "неисследователя"

Если вы согласны с использованием онлайн-API для этого, API на http://www.wisetrend.com/wisetrend_ocr_cloud.shtml может выполнять обнаружение текста в дополнение к только OCR.