Распознавание текста на изображениях. Tesseract презентация

Содержание


Презентации» Информатика» Распознавание текста на изображениях. Tesseract
Распознавание текста на изображениях. Tesseract.Использованные статьи
 Документация Tesseract:https://github.com/tesseract-ocr/docs
 Вейвлет-преобразование: http://www2.isye.gatech.edu/~brani/wp/kidsA.pdf
 Приложение вейвлет-преобразования:
 http://www.sciencedirect.com/science/article/pii/S0262885605000107
 http://link.springer.com/article/10.1007/s13042-011-0049-51985 – Hewlett-Packard, C, проприетарность
 1985 – Hewlett-Packard, C, проприетарность
 1996PipelineАнализ макета страницыПоиск блобовПоиск строкПоиск слов: случай моноширинного шрифтаПоиск слов: случай пропорционального шрифтаПоиск слов: случай пропорционального шрифтаПоиск слов: случай пропорционального шрифтаРазрезание и объединение символовСтатическая классификация символовИ что, это работает?Как сделать, чтобы заработало?
 Текст упорядочен в один или несколько столбцов
Использованные пакеты
 Tesseract для Python: pytesseract
 Обработка изображений: scikit-image
 Вейвлеты: PyWavelets



Слайды и текст этой презентации
Слайд 1
Описание слайда:
Распознавание текста на изображениях. Tesseract.


Слайд 2
Описание слайда:
Использованные статьи Документация Tesseract:https://github.com/tesseract-ocr/docs Вейвлет-преобразование: http://www2.isye.gatech.edu/~brani/wp/kidsA.pdf Приложение вейвлет-преобразования: http://www.sciencedirect.com/science/article/pii/S0262885605000107 http://link.springer.com/article/10.1007/s13042-011-0049-5

Слайд 3
Описание слайда:
1985 – Hewlett-Packard, C, проприетарность 1985 – Hewlett-Packard, C, проприетарность 1996 – порт на Windows 1998 – переход от C к C++ 2005 – открытый исходный код 2006 – Google

Слайд 4
Описание слайда:
Pipeline

Слайд 5
Описание слайда:
Анализ макета страницы

Слайд 6
Описание слайда:

Слайд 7
Описание слайда:

Слайд 8
Описание слайда:

Слайд 9
Описание слайда:

Слайд 10
Описание слайда:

Слайд 11
Описание слайда:
Поиск блобов

Слайд 12
Описание слайда:
Поиск строк

Слайд 13
Описание слайда:
Поиск слов: случай моноширинного шрифта

Слайд 14
Описание слайда:
Поиск слов: случай пропорционального шрифта

Слайд 15
Описание слайда:
Поиск слов: случай пропорционального шрифта

Слайд 16
Описание слайда:
Поиск слов: случай пропорционального шрифта

Слайд 17
Описание слайда:
Разрезание и объединение символов

Слайд 18
Описание слайда:
Статическая классификация символов

Слайд 19
Описание слайда:
И что, это работает?

Слайд 20
Описание слайда:

Слайд 21
Описание слайда:

Слайд 22
Описание слайда:
Как сделать, чтобы заработало? Текст упорядочен в один или несколько столбцов Нет посторонних изображений Нет сильных искажений и шума Высота символов >= 20 пикселей Бинарное изображение на входе (иначе тессеракт сам его бинаризует)

Слайд 23
Описание слайда:
Использованные пакеты Tesseract для Python: pytesseract Обработка изображений: scikit-image Вейвлеты: PyWavelets Нейронные сети: PyBrain

Слайд 24
Описание слайда:

Слайд 25
Описание слайда:

Слайд 26
Описание слайда:

Слайд 27
Описание слайда:

Слайд 28
Описание слайда:

Слайд 29
Описание слайда:

Слайд 30
Описание слайда:

Слайд 31
Описание слайда:

Слайд 32
Описание слайда:

Слайд 33
Описание слайда:

Слайд 34
Описание слайда:

Слайд 35
Описание слайда:

Слайд 36
Описание слайда:


Скачать презентацию на тему Распознавание текста на изображениях. Tesseract можно ниже:

Похожие презентации