ОТКРЫТАЯ БИБИОТЕКА БУДДИЙСКИХ ТЕКСТОВ

ИСТОРИЯ ВОПРОСА
Во время последнего визита Его Святейшества Богдо Гегена Ринпоче в Россию в 2007 году состоялся обстоятельный разговор с Ринопче. Его Святейшество поручил нам создание общебуддийской открытой библиотеки.
Ринопче поставил задачу сделать общедоступными книги собраний трех библиотек - Государственной Библиотеки Монголии, Библиотеки Института Востоковедения в Санкт-Петербурге
и библиотеки Трудов и Архивов в Дхармсале.

В 2007 году в помощью Бориса Ерохина мы получили возможность отсканировать и разместить в интернете библиотеку российского отделения  КИБИ - Института Его Святейшества Кармапы.
В 2009 под по договору с Жене Смитом мы получили возможность использовать материалы TBRC. 
Также при содействии Ранрига Ринпоче были отсканированы и размещены в библиотеке книги заложенные в две московские Ступы.

Все вместе это составило около 25 тысяч отсканированный книг и около 7500 текстовых документов. Также библиотека включает более 2 террабайт аудио и видеозаписей Учений Дхармы.
Посещаемость библиотеки на сегодня составляет более миллиона посетителей в год.

ЗАДАЧА.
Для решения основной задачи библиотеки создается необходимое программное обеспечение с открытым исходным кодом:
1. Программа распознавания тибетского печатного текста. Распознано более 1.2 миллиона страниц, включая Канон, тибетские словари  и основные собрания текстов различных Школ. По этой теме был получен грант Петербургского Университета и выполнен договор с TBRC. Более 7 лет работает бесплатный онлайн сервис распознавания тибетских книг.
2. Объединенный тибетско-санскритский-русско-английский словарь. Словарь включает в себя как доступные электронные источники так и материалы распознанных бумажных словарей. Всего это более 360 000 уникальных статей на тибетском и более 250 000 статей санскрита. Словарь включает в себя перевод более 35 000 устойчивых выражений добавленных в словарь на основе базы переводов.
Словарь доступен в онлайн версии и как локальная программа.
3. В результате сотрудничества с Петербургским Университетом создан прототип программы грамматического анализа тибетского текста. Программа работает на основе базы переводов устойчивых выражений, свода правил тибетской грамматики и анализа корпуса тибетских текстов библиотеки. 

ЗАДАЧИ НА 2018 ГОД.
1. В настоящее время на основе 3 летних исследований разработан алгоритм распознавания тибетского рукописного и ксилографического текста. Достигнута 85% точность распознавания тибетских манускриптов. На базе проведенных исследований возможно достижение точности сопоставимой с распознаванием печатных текстов.
2. Разработаны принципы создания программы корректуры текста на основе сравнительного анализа распознавания. 
3. После разработки такой программы можно поставить задачу распознавания и подстрочного перевода всех материалов библиотеки и создания единого корпуса тибетских текстов, включая печатные издания и тибетские манускрипты.
5. На базе результатов разработки программы грамматического анализа возможно основать бесплатный сервис академического перевода с тибетского языка в объеме 3 томов в год.


В завершении имена драгоценных Учителей поддержавших проект своим благословением
Его Святейшество Сакья Тридзин Ринпоче, 
Его Святейшество Богдо Гоген Ринпоче, 
Его Святейшество Кьябже Цетрул Ринпоче, 
Кхенпо Пален Шераб Ринпоче, 
Намкай Норбу Ринпоче, Гарчен Ринпоче,  
Аянг Тулку Ринпоче, 
Досточтимый Сумонатиссу Теро, 
Досточтимый Махиндаванса Теро 
Досточтимый Дхаммаджоти Теро 
и многие и многие драгоценные Наставники Дхармы

Проект библиотеки поддерживает также рабочие связи с несколькими университетами и буддийскими организациями
монастырь Ласей Линг
монастырь Сера
монастырь Миндроллинг
Кафедра вычислительной математики МГУ
Факультет тибетологии Питербургского университета
SOAS
ACIP
BDRC



С уважением и добрыми пожеланиями
Александр Строганов 
www.buddism.ru