Re: никаких ассоциаций


Автор сообщения: gorm
Дата и время сообщения: 19 July 2005 at 11:26:29:

В ответ на сообщение: никаких ассоциаций

искусственных языков - море. От эсперанто и фень до языков ЭВМ.

Есть очень простой статистический закон (точнее их несколько), которому не удовлетворяют искусственные языки, если только они не были специально сконструированы, чтобы ему удовлетворять (что довольно трудно). Это закон (законы) Дж. Зифа. Отсортируем слова в некоем большом тексте по частоте встречаемости и построим в двойном логарифмическом масштабе график зависимости частоты f встречаемости от места слова в отсортированном списке n. Получатся некоторые кривые. В естественных языках они будут близки к прямым вида f=C*1/n1+d. Причем, чем старше и дольше в употреблении язык, тем ближе d будет к нулю, то есть для естественных старых языков выполняется закон обратной пропорциональности. Тот же закон выполняется для распределения длин слов в зависимости от их частоты, длин предложений, частоты встречаемости букв. И есть еще статистические законы для самых редко встречающихся слов. Это связано с естественным процессом оптимизации скорости передачи информации любого типа. Я в как-то игрался с построением таких графиков для разных текстов и разных языков. Программы где-то валяются, могу по предложенным текстам повыкатывать картинки. Помнится, что глядя только на значение d можно сказать, что латынь старше и русского языка и английский тоже.

Языки ЭВМ тут вообще никаким боком не сядут - минимизация словаря для ограниченного употребления. Фени также - шифровка информации для посторонних. Эсперанто - конечно лучше, поскольку в основном заимствует корни из известных языков, но жесткие правила и грамматика также приведут к заметным отличиям. Кроме того, перемешивание основ из разных языков должно сильно нарушить распределение длин слов по частости.


2088. Латынь - Trasher 03:48 18.07.05 (143)
К списку тем на странице