Re: Мне нравится.


Автор сообщения: gorm
Дата и время сообщения: 21 January 2005 at 01:44:59:

В ответ на сообщение: Re: Мне нравится.

В связи с работой над комментариями к Святскому я прочесал и даже два раза все 42 тома ПСРЛ, немного образовался также, читая специальную литературу, в некоторых местах даже зарылся весьма глубоко. Поэтому попробую изложить свое представление о том, что могли бы сделать мы - дилетанты, но с технарским и программистским подходом, обращая большее внимание на различные технические вопросы.

1. Самый идеальный, на мой взгляд, способ компьютерного перевода источников в электронный вид, который удовлетворил бы подавляющее большинство исследователей от любителей до профессионалов.

Сканируется оригинал источника, желательно в цвете, и эти графические образы сохраняются. Одновременно готовится текст в электронном виде. И текст и графика размечаются, чтобы обеспечить взаимно однозначное соответствие. Размеченный текст хранится в виде удобном для чтения (html или более гибкий xml). Любой фрагмент в тексте может быть тут же показан в виде соответстствующего графического фрагмента оригинала. Должна сохраняться возможность и просмотра графических стран полностью. Должен быть написан софт для интелектуального поиска, что, учитывая особенность языка летописей и разнообразия соглашений при издании отдельных томов летописей в разные годы является нетривиальной задачей.
Приведу один пример для иллюстрации. В ПВЛ под 912 годом описана комета Галлея:
"Явися звезда велика на западе, копейным образом". Так вот способов написания слово копейным в разных томах ПСРЛ я насчитал девять! И поисковик должен уметь это отрабатывать.

Это, конечно, работа не для нас (все упирается в сканирование оригиналов списков), но такой флагманский проект с демонстрацией идеи вполне возможен и напрашивается, поскольку есть факсимильное издание Радзивилловской летописи, сопровождаемое уже вполне размеченным текстом. Хорошо бы еще сделать перекрестные ссылки на страницы академического издания Радзивилловской в ПСРЛ (т.19, 1989 г.). К тому же в таком издании могут быть вполне заинтересованы любители Фоменко, который так много (ерунды) написал про эту летопись, а так каждый сможет самостоятельно все проверить. Для этого проекта вполне можно сделать отдельный сайт.

2. Простое сканирование летописей из ПСРЛ и выкладывание их в сеть. Здесь все существенно упрощается тем, что только первые тома в 19-ом веке издавались по принципу максимального графического соответствия оригиналу и как раз эти-то сложные тома (Ипатьевская и Лаврентьевская) уже были отсканированы украинскими энтузиастами. Правда, текст для простых любителей в таком виде трудно читать, поэтому здесь мое такое предложение - сканировать и распознавать в виде максимально приближенном к изданию ПСРЛ с обязательным сохранением примечаний и номеров страниц, что для белорусско-литовских украинские друзья, к сожалению, не сделали). Здесь графические образы вроде бы и не нужны, но все-таки хорошо было бы их участникам проекта где-то сохранять для контроля возможных при распознавании ошибок.

3. Разработка программного обеспечения для поиска дублировок и заимствований в летописи и для сопоставления различных летописей. Известно, что по разным причинам, в основном, связанным с хождением разных календарных стилей одни и те же события могут в разных летописях и даже в одной и той же летописи появиться под разными годами. Надо придумать способы их выявления. То есть какого-то преобразования фрагментов текста (предложений или отдельных словосочетаний) в такой вид, чтобы их можно было успешно сравнивать между собой. Какие-то алгоритмы на этот счет существуют. Если эти методы помогут фоменковцам выявить их "дубликаты" - ради бога. Желающие могут даже поэкспериментировать с методами "выявления дубликатов" самого Фоменко и убедиться в их туфтовости, было бы только на чем играться.

4. Создание программного обеспечения для строго формального построения на основе сопоставительного анализа разных летописей и списков их генеалогического дерева. Здесь есть большие наработки на основе байесовского подхода в генетике и те же самые методы заимствуются в глотохронологии.

Одна база данных для игр из пункта 4 уже есть. Это моя база данных по астрономическим наблюдениям в русских летописях. Это существенно расщиренный и исправленный вариант по сравнению с тем, что лежит на сайте и, кроме того, каждая цитата снабжена в ней точной сылкой (около 1050 цитат и около 170 различных явлений). Она, надеюсь, будет опубликована в приложении к Святскому и вскоре после этого выложена в сети.


1905. О кризисе "Цивилизации" - gorm 18:11 20.01.05 (88)
К списку тем на странице