«Выдумывают язык, на котором нельзя солгать, но язык, на котором нельзя солгать, это не язык, на котором можно сказать правду».
В. В. Бибихин.
Сияющий небоскреб точных наук, опертый на физику, химию, и биологию, затенил неброское здание количественной лингвистики, о которой пойдет речь. Нам продолжает казаться, что всякая человеческая мысль погружена в темную, непроницаемую материю языка, по-прежнему мрачно нависающую над разумом. Талантливые философы, Хайдеггер и Бибихин, погружая бытие в черную дыру языка, выводили лингвистику из поля рационального знания. Очарование их текстов убеждало: к языку с евклидовой меркой не подступишься. В самом деле, точное, математическое доказательство преимуществ «Войны и Мира» перед «Вечный Зовом» количественной лингвистике не под силу. Водородной бомбой, овечкой Долли и суперкомпьютерами количественная лингвистика тоже похвастаться не может, а между тем, ее негромкие достижения — поразительны. Поразительны, но очень мало известны неспециалистам и почти не отрефлексированы философски.
***
Основы современной количественной лингвистики заложил Джордж Кингсли Ципф (1902-1950).1-2 Ципф установил несколько универсальных закономерностей справедливых для столь разных языков, как: английский, латынь, немецкий, китайский (мандарин), лакота, ноотка и др. Наиболее известная закономерность, носящая название закона Ципфа, такова: если все слова достаточно длинного текста упорядочить по убыванию частоты их использования, то частота n-го слова в таком списке окажется приблизительно обратно пропорциональной его порядковому номеру n; попросту говоря, если в некотором достаточно длинном тексте наиболее часто встречается предлог «на», а вслед за ним по частоте появления расположился предлог «в», то ожидаемое отношение частот — 1/2. Эта зависимость обнаружена в огромном количестве языков, и что уж совсем поразительно — верна и для языков программирования, по крайней мере для таких, как JAVA и С++.3 Это означает, что языки обладают скрытой универсальной внутренней структурой; данное наблюдение настолько впечатляющее, что некоторые специалисты полагают, что языком следует считать символьную систему, для которой выполняется частотное соотношение Ципфа.
Мне с талантливым аспирантом, Женей Шульзингером удалось показать, что универсальными внутренними структурами наделены не только тексты, но и словари. Бедным, но уже женатым студентом, мне доводилось зарабатывать на хлеб переводами. Я заметил, что в знаменитом англо-русском словаре Мюллера слова, начинающиеся на букву “S”, занимают десятки страниц, между тем как слов, стартующих с “Z” и “X” — раз-два и обчелся. Меня сразу разобрало любопытство: верно ли это и для других словарей. Прошло три десятка лет, пока дошли руки до этой задачи (к тому же, появились компьютеры, неслыханно облегчившие исследования в области количественной лингвистики). Мы с Женей обследовали Английские, Немецкие, Французские, Итальянские, Испанские Русские, Польские, Чешские, Латвийские и Ивритские словари, представляющие Германскую, Романскую, Балтийскую и Семитскую языковые группы, и обнаружили, что распределение количества слов, начинающихся с определенной буквы, недурно ложится на универсальную экспоненциальную кривую.4 Меняется ли эта кривая для данного языка со временем, и эволюционирует ли его распределение Ципфа? Это пока не известно.
В чем причина внутреннего структурирования языков? И этого мы не знаем. Сам Ципф полагал, что обнаруженная им частотная зависимость оптимальна для облегченной передачи информации.1-2,5 Многие математики считают, что она вырастает из чистейшей комбинаторики языка.6 Возможно, эти гипотезы друг другу и не противоречат.
***
Когда говорят о Ципфовской модели языка, как правило, имеют в виду открытый им частотный закон, а между тем, идеи Ципфа куда глубже и богаче, ибо охватывают и эволюцию языка.1-2 Согласно Ципфу, язык развивается следующим образом: на стадии возникновения в нем преобладают фонетически короткие, вполне однозначные слова. Поясним: открыв толковый словарь на слове «койот» мы найдем короткое, вразумительное толкование этого слова, означающего определенное животное. Слово «койот» вполне однозначно.
Открыв тот же словарь на слове «сила», мы прочитаем добрую дюжину страниц, оказывается, бывает сила физическая, и это совсем не то же самое, что сила, как физическое понятие, и уж совсем не то, что в старинной физике именовалось «живой силой», которая и вообще не сила, а кинетическая энергия; а ионная сила раствора, тоже отнюдь не сила, а мера интенсивности поля. А «сила божия», она и вовсе, в христианской схоластике — благодать; в последнее время на свет народилась «мягкая сила». И уж совсем невозможно указать пальцем на объект, именуемый «сила». «Сила» представляет собою слово многозначное, полисемантическое, нагруженное и перегруженное смыслами и оттого неопределенное. Всегда ли оно было таковым?
Ципф давал на этот вопрос четкий ответ: не всегда. Согласно Ципфовской модели развития языка, поначалу он состоит из коротких, однозначных слов. Много лет тому назад поле было пшеничное, ржаное, соседское. А сегодня оно бывает к тому же электромагнитным, фермионным, тензорным, гравитационным… Короткие, базовые, ключевые слова языка со временем не только становятся многозначными, но согласно Ципфу, и наиболее употребимыми в речи и на письме; это легко показывает компьютерный анализ. Длинные слова — напротив молоды и редко востребованы.
***
Философские последствия этой картины развития языка — глубоки и вполне неожиданы. Простые слова утрачивают свой первоначальный смысл и становятся непонятны. Мы наивно предполагаем, что интенсивное обсуждение сложного понятия ведет к его прояснению. Между тем, результат оказывается прямо обратным. До Маркса люди, в общем, недурно понимали, что есть «капитал». Деньги в тумбочке, подполе или в банке и были «капитал». Марксова «самовозрастающая стоимость», превращающая Капитал в абстрактное, туманное понятие, устрашает, «как неведомые письмена».
До Фрейда и Юнга, говоря о сознании, философы имели в виду примерно одно и то же, а вот после…
«Основной парадокс психоанализа, может быть (как и парадокс феноменологии и экзистенциализма), состоит в том, что термин «сознание» стал двусмысленным, расплылся. Проблемой стало не бессознательное, а сознание, которое, осталось непонятным и непонятым. Фрейд и Юнг открыли цивилизованному миру бессознательное в порядке отчленения, в порядке аналитического процесса, отчленяющего бессознательное от сознательного, чтобы сделать более содержательным аналитическое понятие сознание. А на самом деле, аналитическое понятие сознания обнаружило свою полную бессодержательность именно в результате введения бессознательного (М. Мамардашвили, А. Пятигорский «Символ и сознание»)».
Мераб Константинович и Александр Моисеевич все подметили и описали верно, но утрата «сознания», быть может, лишь частный пример, следующий из эволюции языка.
Едва ли не наиболее поразительный пример, в этом смысле, — пространство и время, совершенно утратившие «понятность», после того как о них были исписаны «волюмы», как любил писать великий насмешник Лев Николаевич Толстой. Ученые ХХ века потратили громадные усилия, вырабатывая искусственные языки, содержащие однозначные соответствия слов и того, что они означают, языки на которых невозможно солгать, но для введения этих языков потребуется нормальная человеческая речь. А наш с вами человеческий язык, развиваясь, затемняет, размазывает смысл слов. И более того, А. Воронель заметил, что наиболее значимые для человека слова: Б-г, любовь, счастье одновременно и наиболее размыты, неоднозначны, неопределенны, перегружены смыслами, и оттого наиболее бессмысленны.
***
Значительно позже работ Ципфа вышла в свет замечательная работа немецких физиков Альтмана и Герлаха, посвященная эволюции английского языка.7 Альтман и Герлах весьма разумно предложили разделить словарный запас языка на «ядро» и «периферию» (заметим в скобках, что физики, изучая язык, работают с моделью языка, а не с языком, в той же мере в какой, исследуя мир, они работают с моделью природы, но не с природой. Именно сделав эту впечатляющую уступку, физика достигла всего, чего она достигла).
Слова, составляющие твердое ядро, употребляются часто и не препятствуют возникновению новых лексических единиц.7 Напротив, периферийные слова в ходу не часто, и понижают вероятность появления в языке новых слов.7 Исследование в рамках подобной модели громадной базы данных Google Gram привело к поразительным результатам, главный из которых таков: твердое ядро английского языка ссыхается, уменьшается со скоростью примерно тридцать слов в год. За последнее время твердое ядро покинули слова: «величество», «монсеньер», «Наполеон».7 Зато, в него проникли «контекст» и «компьютер». Куда это процесс ведет неведомо.
Заметим, что и символьная основа письменной речи подсыхает со временем. Первый алфавит английского языка, составленный монахом Биртфертом (Byrhtferth), содержал 29 знаков; современный английский алфавит насчитывает 26 букв. Еще большую утруску претерпел русский алфавит. Первоначально кириллица насчитывала 43 символа. Несложно догадаться, что более всего русский алфавит претерпел от Петра, ну а потом и большевики приложили к алфавиту свою шаловливую руку. Впрочем, обеднение алфавита происходит не всегда; финикийский алфавит, предшественник ивритского, уже насчитывал 22 знака.
Совсем непросто и, кажется, немонотонно, меняется фонетика языков, но в этой интереснейшей области пока еще мало, что прояснено.
***
С философской точки зрения громадное значение имеет эволюция во времени грамматики. Качественный скачок, переход от примитивных языков к развитым и развивающимся, грамматически сложным, не только делает понятное непонятным, перегружая слова смыслами, но и объективирует то, что овеществлению не подлежит. Например, язык издевательски приучает нас думать о времени, как об объекте, предмете, реально существующей вещи. Как это происходит? «Мы говорим «ten men» десять человек» и «ten days» — десять дней». Десять человек мы можем себе представить, как реальную группу, например, десять человек на углу улицы. Но десять дней мы не представляем в виде совокупности, группы. Если это и есть группа, то воображаемая и состоящая не из дней, ибо день не есть предмет, а из каких-либо предметов, которые связаны с днями лишь условно, например, из листков календаря… Таким образом, временная последовательность и пространственная совокупность передаются у нас одним и тем же языковым аппаратом, и нам кажется, что это сходство лежит в самой природе вещей. В действительности же это совсем не так. Отношения «быть позже» и «быть распложенным вблизи» не имеют между собой ничего общего. Уподобление временной последовательности пространственной совокупности дано нам не в восприятии, а в языке».8
Поразительно то, что примитивные языки, не подталкивают мышление к подобным обобщениям-объективациям. «В языке хопи множественное число и количественные числительные употребляются только для обозначения предметов, которые могут образовать реальную группу. Выражение «десять дней» не употребляется. Вместо «they stayed ten days» — они пробыли десять дней», хопи скажет: «они уехали после десятого дня». Сказать «десять дней больше, чем девять дней» нельзя, надо сказать «десятый день позже девятого»… Само понятие «время» в европейской культуре есть результат объективизации отношения раньше-позже… Мы создаем в своем воображении несуществующие предметы — год, день секунда, а вещество, из которого они состоят, называем временем. Мы говорим «мало времени», «много времени», и просим дать час времени, как если бы просили литр молока».8 А в примитивной грамматике хопи глаголы не имеют временных форм, но нет и времени-вещи. Трех-временная, привычная нам форма глагола, приучает нас думать о времени, как о точке, движущейся из прошлого в будущее; избавиться от этого овеществляющего представления очень трудно, почти невозможно.
***
Заповедь не произносить имени Б-жьего всуе среди прочего предписывает не овеществлять, не опредмечивать в языке и на письме то, что опредмечиванию не подлежит. Иврит вплотную подводит к этой мысли, ведь в иврите существительное «דבר» (давар) означает одновременно и вещь, и слово. Архаическое мышление исходило из того, что сквозь слово просвечивает нематериальная сущность вещи. Однако, слово, к тому же, овеществляет и то, что предметом не является.
***
Эйнштейн с недоумением слушал рассуждения Бергсона о времени. А ведь Бергсон пытался укротить взбунтовавшееся, объективированное языком мышление. Но сам Эйнштейн не смог справиться с собственным мышлением, полагая, что электрон-частица непременно где-нибудь да должен же «на самом деле» находиться. Я говорю студентам: «электрон — элементарная частица», прекрасно зная, что электрон не есть частица, в том смысле, в каком мы говорим о частице песка. Электрон — не вещь, и не прописан по точному адресу; а электромагнитное поле имеет мало общего с ржаным полем. Но требуется немалое интеллектуальное усилие, чтобы преодолеть объективирующее насилие языка. И преодолев его, приходится излагать свои мысли на все том же человеческом, слишком человеческом языке, на котором врать куда легче, чем говорить правду.
Язык, развиваясь, нагружает простые слова смыслами, размывая их значение, и овеществляет то, что предметом не является. Да и само существительное «развитие» поначалу означало в русском языке развивание веревки на составляющие ее нити, а сейчас, к чему только не пригнано. Веревка, развиваясь на волокна, однако, перестает быть сама собой.
Литература
-
Zipf, G. K. (1965). The Psycho-Biology of Language, An Introduction to Dynamic Philology. MIT Press, Cambridge, MA.
Zipf, G. K. (1965). Human Behavior and the Principle of Least Effort, (1949) Hafner, New York.
Zhang, H. (2009) Discovering power laws in computer programs, Information Processing & Management, 45 (4), 477-483.
Shulzinger, E. & Bormashenko, Ed. (2017). On the universal quantitative pattern of the distribution of initial characters in general dictionaries: the exponential distribution is valid for various languages.
Quantitative Linguistics, 24 (4), 273-28
Pustet, R. (2004). Zipf and his heirs, Language Sciences, 26, 1—25.
Baek, S. K., Bernhardsson, S. & Minnhagen, P. (2011). Zipf’s law unzipped, New Journal of Physics, 13, 043004.
Gerlach, V. & Altmann, E. G. (2013) Stochastic model for Vocabulary growth in natural languages, Phys. Rev. X 3, 021006.
Турчин, В. Ф. Феномен Науки, ЭТС, Москва, 2000.
Оригинал: http://7i.7iskusstv.com/2017-nomer11-bormashenko/