rimeApr 7, 12:02

Машинное обучение и распознавание восточных рукописных текстов 


Для распознавания древних манускриптов создается программа оптического распознавания и машинного перевода восточных текстов. В качестве графической свертки признаков мы использовали фокальные точки и фокальные линии изображения, описанные кривыми Безье.

image

image

На конечном этапе сравнение ведется по признакам на основе трехслойного неокогнитрона. Этот метод свертки более медленный, но обладает очень высокой различающей способностью и устойчивостью к шуму в пределах до 1/5 от линейного размера признака. Реализация неокогнитрона на базе регистровых команд позволила добиться скорости распознавания. Такой подход хорошо себя показал при распознавании печатных текстов.

image

Задача. На следующем этапе для уверенного распознавания рукописного и ксилографического текста необходимо решить задачу машинного обучения. Каждый текст отличается от предыдущего, часто даже страницы в рукописи не похожи одна на другую.

image

Одним из методов, позволяющим обучить нейросеть и выявлять закономерности в графическом узоре является генетический алгоритм. 
Этот алгоритм позволяет создать множество вариаций сети для решения задачи и выбрать наилучший. Постепенно  в результате скрещивания и отбора вариантов построения нейросети выявляется оптимальная конфигурация. Метод позволяет например обучить сеть играть в компьютерные игры. Пример реализации этого алгоритма для игры Марио:



Мы воспроизвели код целиком на с++ и будем рады поделится.

Для распознавания рукописного текста необходимо решить задачу выявления паттернов и их сочетаний в графическом узоре. Нужно научить программу разделять задачу на этапы, выявлять закономерности, создавать на их основе гипотезы и подтверждать или опровергать эти гипотезы на основе опыта.

image

В первом приближении задачу можно рассмотреть как выбор метода графических сверток и задачу оптимизации Беллмана решаемую методом сверточной нейросети.

image

Однако сложность в том, что в отличие от печатного текста не удается определить вероятность сочетания признаков на основе только размеченной обучающей выборки. Необходимо понять, как применить машинное обучение для поиска и классификации закономерностей распределения признаков на основе самого текста.

Решение этой задачи имеет применение и в других задачах машинного обучения. Например при выявлении графических образов, колоризации изображения и машинном переводе.

Одним из вариантов обучения является программное создание онтологии. Этот подход применяется при машинном переводе и создании чат-ботов. 

В этом случае взаимосвязь образов и понятий записывается в виде небольшой подпрограммы на скриптовом языке и выполняется в момент распознавания. Подход аналогичен записи весовых коэффициентов в нейронной сети.