По существу


Автор сообщения: gorm
Дата и время сообщения: 20 December 2005 at 19:25:24:

В ответ на сообщение: Re:

А в томах ПСРЛ? Кроме первых?

И кроме первых тоже есть.

Вы, действительно, попробовали бы хотя бы страничку распознать из переиздания досоветского тома, почуствовали бы разницу. Если без всякого инструментария, приходится каждую буквочку выверять. А варианты мелким шрифтом - вообще жуть. Кроме того, ЯСК во многом схалтурили и плохо вычистили сканы / плохо отрегулировали контраст, буквы разваливаются, особенно в самых последних их томах - там даже чьи-то современные рукописные пометки на полях остались - так что распознавание в муку превращается, почти как ручной набор заново. Поверьте, это две большие разницы с 30-ми томами. Может надо доставать немецкие переиздания - русские оригиналы будут хуже. Это отпугивает многих пытавшихся. Я восхищаюсь подвигом, совершенным украинскими коллегами. Я на это не способен.

Кстати - а о чем вообще речь? Насколько я понимаю, все яти и юсы уже и так есть в Юникоде - та же ять - номер 1142 (Ѷ) десятичный. Это если заглавная.

В Юникоде они, может, и есть (только 1122 Ѣ), но их нет почти ни в одном шрифте, а если есть, то как-то случайно. Скажем, в Palatino есть юс малый, но нет большого и т.п. Вообще нет в юникоде йотированного а и проблемы с уком - который нужен для цифр (не во всех томах цифры переведены в арабские). Из микрософтовских полный комплект только Arial - но выглядит древнерусский текст в нем ужасно. Да, да, цвет крема пирожных, знаю, но я делаю сайт в первую очередь для собственного удовольствия (естественно, с желанием принести заодно и пользу), Вы, думаю, тоже. И не собираюсь следовать совету уважаемого Глеба Бараева - сплошь сканировать рекомендованную в пособиях для студентов историков литературу. Этим пусть занимаются студенты составителей этих пособий.

Вручную-то зачем? Достаточно при входе на HTML-страницу указать в какой символ перекодировать ту же ять и при наличии соответствующего скрипта вообще никакой работы не будет. И никто никаких вопросов не увидит.

Не все так просто, к сожалению. Взять те же проблемы с ОУ. В общем, не хотелось бы слесарить. Прежде чем что-то делать, хочется немного поразбираться в проблеме, посмотреть, что есть и что действительно нужно в первую очередь. Делать интернет копии с копий дореволюционных не очень хороших изданий имеет смысл только для полноты.

Увы, есть. Это полное отсутствие какого-либо решения, при многочисленных существующих прожектах. Что и наблюдается.

Любые интернет прожекты двигаются исключитально на энтузиазме прожектеров. При этом, по моему личному опыту, скорость продвижения зависит экспоненциально от числа участников, а при одном участнике показатель экспоненты отрицательный и прожект быстро затухает Z*exp[(a*N-b)t], b>a. Именно поэтому комментарии к реферату писались активно, пока их писал не только я, и вскоре затухли совсем. Прожекты в одиночку могут быть доведены до конца и многие я довел, только при большой начальной собственной заинтересованности (Z). Например, лично мне очень интересен проект древних затмений, и я его постоянно двигаю, хоть и с перерывами, хотя никому другому это здесь, похоже, не интересно. Вас раздражает, что я, выкликнув призывы, не побежал вслед за Вами сразу сканировать летопись за летописью? Но мне казалось важнее закончить книгу об астрономических явлениях в летописях и каталог к этой книге по всем летописям.

//у Вас в Постниковском так ведь и нет разметки годов и примечаний (да и вообще никакой), а ведь обсуждали и планировали//

Во-первых никто ничего не обсуждал, во-вторых никто ничего не планировал, в третьих ссылки на года можно поставить за пару дней при наличии электронного текста. А разметка примечаний - это что?

Что-то, Виктор, Вы совсем в расстроенных чувствах. Во-первых и обсуждали и во-вторых, планировали.
http://hbar.phys.msu.ru/gorm/wwwboard/messages96/41148.html
Разметка примечаний - это и есть отличие интернета от бумаги. Когда, нажав на ссылку на примечание, Вы сразу можете примечание прочитать, а не шарить и листать (в интернет публикации это еще менее удобно чем в книге). Лучше всего это делать в виде фреймов. Как удобнее и лучше это сделать и стоит обсудить. Руками (хотя я до сих пор это делал руками) это делать очень занудно и долго. Хорошо бы иметь некоторый набор утилит для этого.

А про выделение жирным шрифтом - это не ко мне. Это к летописцу, который зачем-то часть букв выделял киноварью, и к издателям ПСРЛ, которые посчитали нужным это выделение отметить. И если кто-то еще не понял - у меня выложены электронные копии бумажных изданий. То есь не Постниковского летописца, а соответствующих страниц 34-го тома ПСРЛ. И именно так это и надо воспринимать.

Это в высшей степени идиотизм советского издания. Полностью оскопили оригинал, лишив оригинальной орфографии, но зато обозначили киноварные буквы. Не могу представить себе исследователя, который бы изучал практику применения киноварных букв по такому изданию. Но, конечно, для "адекватности воспроизведения" - пусть будет. Правда зеленого цвета выделений ведь там не было :-)?


//Лично мне простая задача тупо перевести в интернет все летописи не очень интересна.//

А идея выложить все тома ПСРЛ была Ваша, кстати. Даже на украинском сайте писали о "группе Городецкого". Расхотелось?

Нет, нисколько не расхотелось. Я говорю о моем личном частном интересе в этом проекте (который как проект мне тоже интересен в общем плане). Любые начинания энтузиастов в этом направлении готов всемерно поддерживать, и томами и сканером (но лишь в малой степени распознаванием) и местом на сайте и оформлением. И чем больше будет энтузиастов, тем больше будет моя помощь, поддержанная общим энтузиазмом.

Можно ведь и просто все отсканировать и в картинках все выложить, тем более, что у ЯСК все сканы есть.

Можно. Только никто не выкладывает.

Если бы у меня был хостер с десятками гигабайт, я бы выложил. Да google все равно выложит лет через пять, я не сомневаюсь.

Так вот я и говорю - главный бич - лучшее враг хорошего. Тот кто хочет что-то сделать лучше в современном мире не имеет ничего. Потому что кто-то уже сделает это до него, пусть и похуже.

По моему опыту это не так. Но делать плохо только чтобы быть первым я тоже не хочу. И зря Вы на меня так набрасываетесь. Я лично все-таки отсканировал и выложил достаточно много хроник. И летопись небольшая у меня тоже на подходе, правда, не из ПСРЛ.


2192. Шрифты для проекта оцифровки летописей - gorm 17:24 16.12.05 (30)
К списку тем на странице