Шаг 1: Пожалуйста напечатайте ваш Е-МАЙЛ для получения результатов распознавания (*)

* Ваш реальный е-мейл

Шаг 2: Выберите ваш файл нажав на кнопку загрузки

Шаг 3: Выберите нужное действие

Шаг 4: Отошлите Ваш файл, нажав на кнопку. Если Вы натащили файл на форму, он пересылается немедленно.

ДОРОГИЕ ДРУЗЬЯ!
ДЛЯ ПОЛУЧЕНИЯ РЕЗУЛЬТАТОВ РАСПОЗНАВАНИЯ И ПЕРЕВОДА ПРОСЬБА УКАЗЫВАТЬ ВАШ АДРЕС ЭЛЕКТРОННЫЙ ПОЧТЫ

བརྩེ་བའི་གྲོགས་པོ་རྣམ་པ། དཔེ་ཆ་ཡར་བཞག་ཚར་རྗེས་ཁ་བྱང་ GOMDE@MAIL.RU ཐོག་བརྡ་ལན་ཞིག་གནང་རོགས།

Ваш адрес нужен для того, чтобы переслать Вам результат распознавания текста. Мы можем помочь Вам распознать Тибетски, Санскритский, Сингальский печатный текст
Для получения результатов распознавания нужно некоторое время. Обычно мы пересылаем результаты через несколько дней.



(*)Соглашение использования.
1. Все работы по распознаванию производятся бесплатно.
2. Если присланые Вами файлы не могут быть опубликованы в библиотеке, просьба написать об этом по адресу библиотеки gomde@mail.ru
3. В случае если Вы не предоставили Ваш адрес для обратной связи, к нашему сожалению мы не сможем помочь Вам распознать текст.
4. Пересылая текст для распознавания, Вы предоставляете библиотеке право один раз в год ознакомить Вас с новостями библиотеки
5. Пусть все будут счастливы изучая и практикуя Учение Будды во всем мире!
Благодарим вас за интерес к библиотеке Будда Дхармы
Этот сервис OCR бесплатен для всех книг по Дхарме. На сегодня с его помощью распознано более миллиона страниц для бибилотек www.tbrc.org, www.dharmadownload.org, www.dharmabook.ru при поддержке Trace Foundation www.trace.org и многих наших друзей из буддийской сангха по всему миру. Это замечательная возможность также поклонится нашим Учителям, которые вдохновили и поддержали разработку этой бибилиотеки.

Основные особенности системы OCR включают в себя:

1. В настоящее время разработаа серверная версия программы распознавания для Тибетского, Санскрита, Сингали, Каннады, Русского и Английского языка.

2. Распознавание основано на проверке грамматики и словаре в 360 000 слов в более чем 8 миллионов фраз.

3. Высокая точность распознавания. Для печатного тибетского текста аккуратность распознавания составляет 3 ошибки на 1000 знаков. Для хорошо напечатанного текста - 1 ошибка на несколько страниц. Также можно распознавать словари и другие смешанные тексты. Для рукописного текста уровнь распознавания составляет пока около 80%

4. Локальная версия написана на C++ для MacOS 10.8-10.9 с интерфейсом на Cocoa, PHP и HTML.

Здесь можно посмотреть пример распознавания:

Для подготовки сканированных материалов вы можете использовать эту программу.

http://www.buddism.ru///ocrlib/Image2TIFF.zip

Это небольшая полезная программа для PC. С ее помощью можно подготовить небольшие черно-белые файлы из отсканированных страниц книги. 1-2 мегабайтный файл она сжимает до 40 киллобайт (более чем в 200 раз).
Также программа использует адаптивную бинаризацию и исправляет наклон строк в странице. Готовые файлы можно сжать ZIP

С уважением
www.dharmabook.ru