Я расскажу об удивительном научном наблюдении, настолько странном, противоречащем интуиции и здравому смыслу, что хочется объявить его в лучшем случае курьезом, а в худшем, досужим вымыслом околонаучных ротозеев, любящих порассуждать о неопознанных летающих половниках и целительных свойствах живой воды, заряженной Аланом Чумаком. А между тем, это наблюдение приводит к очень глубоким и далеко идущим результатам, как научным, так и гносеологическим. Речь пойдет о Законе Бенфорда.
История эта давняя. Саймон Ньюком, работая с таблицами логарифмов (нынешнее студенты, слава Б-гу, незнакомы с этим литературным памятником; его похоронил карманный калькулятор), заметил в 1881 году, что страницы таблиц, содержащие логарифмы чисел, начинающихся с единицы, куда более засалены и истрепаны, нежели иные страницы таблиц. И далее по нисходящей. А страницы, на которых разместились логарифмы, стартующие с «девятки» и вообще чистеньки, как новенькие. Другой прошел бы мимо этого странного наблюдения, не задержав дыхания; другой, но не Саймон Ньюком. Саймон Ньюком, был личностью, более чем замечательной. Автодидакт, он оставил заметный след в астрономии, экономике, статистике, измерил скорость света с непостижимой для его времени точностью, писал фантастические романы.
И мимо своего странного закона истрепанности таблиц логарифмов Саймон Ньюком без внимания не прошел. Тысячу раз прав Александр Воронель, когда говорит, что ремесло ученого требует наблюдательности и изобретательности. Так вот, я полагаю, что наблюдательность даже и важнее. Ньюком формулирует следующее утверждение: в списке случайных статистических данных, вероятность того, что первой цифрой окажется единица составляет приблизительно 30 %, а не ожидаемые 11 % (ноль не в счет, без нуля цифр в десятичной системе – девять, так что, если вероятности попадания цифр на первую позицию равны – то они составляют примерно 11%) [1].
От этого заявления на версту тянет безумием. Ну, чем единица лучше двойки или семерки? А ничем. Посему следует ожидать равной вероятности появления цифр десятичной системы на первой позиции.
Как и многие другие хорошие вещи, наблюдение Ньюкома было забыто на полста лет, и переоткрыто в 1938 г. американским физиком и статистиком Фрэнком Бенфордом, исследовавшим со старомодной научной скрупулезностью полоумный набор статистических данных, включавших высоты американских небоскребов, площади озер, физические константы и биржевые сводки. Бенфорд показал, что наблюдение Ньюкома выполняется с неожиданной точностью: единица упорно лезет на первое место, вытесняя другие цифры десятичной нотации[2]. С тех пор, этот закон именуется законом Бенфорда, что вообще говоря, несправедливо. В военные годы было не до Бенфорда, потом все гонялись за бомбами и спутниками, но вот совсем уж недавно, интерес к закону Бенфорда, неожиданно возродился.
А дело было так: один дошлый аудитор проверял бесконечные налоговые отчеты громадной американской компании, и учуял в них нюхом бухгалтерской ищейки неладное, фальсификации. Аудитор славно учился в Университете, и, зная о существовании закона Бенфорда, проверил представленные ему таблицы данных, и установил, что первые цифры в колонках распределены равномерно. С этого момента аудитор не сомневался – отчет фальсифицирован. Жулики, по невежеству своему, разумно предположили, что распределение первых цифр должно быть равномерным.
Скандал был большой. Фирма требовала привлечь аудитора к ответственности, ведь закон Бенфорда – эмпирическое наблюдение, не более того, никем не обоснованное и недоказанное. Аудиторская фирма резонно отвечала, фальсификации никак не связаны со справедливостью закона Бенфорда, он лишь помог их выявить.
С тех пор закон Бенфорда был успешно применен для выявления подделок на выборах в Иране, в отчетах Греции Евросоюзу, изрядно усложнив жизнь жуликам и прохиндеям. А, между тем, строго математически закон Бенфорда остается недоказанным, хотя многие большие математики серьезно брались за дело[3]. Экспериментаторы тоже засучили рукава и обнаружили, что закон Бенфорда выполняется в статистических данных о популяционной динамике народонаселения, данных о закупках через eBay, мощности пульсаров, генетической информации [4-10].
Мы с супругой недавно не поленились показать, что закон работает в инфракрасных спектрах полимеров [11]. Заметим, что, разумеется, закон Бенфорда работает не всегда. В телефонном справочнике вы его не обнаружите.
Как же обосновать это странное наблюдение? Где его корни? Разные гипотезы выдвигались математиками и физиками. Но вот недавно мой коллега профессор Геннадий Вайман показал прелюбопытную вещь – закон Бенфорда отражает свойства десятичной позиционной системы счисления (в позиционной системе значение цифры напрямую зависит от ее положения в числе)[12]. Я не буду забивать мозги читателей тонкостями и деталями доказательства. Для меня важнее философский урок, следующий из работы Ваймана.
Допустим, я записываю на листик текущие биржевые сводки. Предположим, эти данные совершенно хаотичны, неупорядочены. Но записывая их, я, не задумываясь, прибегаю к заученной с детства десятичной системе счисления. И записанные мною данные, уже не вполне хаотичны. В них будет выполняться закон Бенфорда, навязанный позиционной системой; единица с вероятностью в 30 % , расталкивая остальные цифры, полезет на первое место. Из хаоса данных рождается порядок. Упорядочение возникает от самого факта применения позиционной нотации. Записанные в ней биржевые котировки уже не вполне хаотичны, в записи наличествует порядок, продиктованный системой счисления (она может быть и не десятичной).
Квантовая механика уже приучила нас к тому, что сам факт измерения меняет поведение физической системы. Закон Бенфорда учит, вдобавок, вот чему: лишь только записав результаты измерений в позиционной системе исчисления, мы уже их упорядочиваем. Перед нами не курьез, а небанальное наблюдение, осмысление которого ведет довольно далеко.
Напрашивается вопрос: а почему из всех систем исчисления выжили только позиционные, вроде бы, изобретенные вавилонянами; ведь были в истории и иные системы – непозиционные, например, хорошо нам известная – римская? Быть может, потому что позиционные системы обеспечивают минимальное усилие необходимое для осмысления численных данных, они, попросту, наиболее удобны. Но это, разумеется, – чистая спекуляция.
Источники
[1] S. Newcomb, Note on the frequency of use of different digits in natural numbers, Am. J. Math. 4 (1881) 39-40.
[2] F. Benford, The law of anomalous numbers, Proc. Am. Phil. Soc. 78 (1938) 551-572.
[3] A. Berger, T.P. Hill, Benford’s law strikes back: no simple explanation in sight for mathematical gem, The Math. Intelligencer 33 (2011) 85-91.
[4] J-C. Pain, Benford’s law and complex atomic spectra, Phys. Rev. E 77 (2008) 012102.
[5] T.A. Mir, The law of the leading digits and the world religions, Physica A 391 (2012) 792-798.
[6] M. Sambridge, Benford’s law in the natural sciences, Geo. Phys. Res. Lett. A 37 (2010) L22301.
[7] J.L. Friar, T. Goldman, J. Pérez-Mercader, Genome sizes and the Benford distribution, Plosone 7 (2012) e36624.
[8] J.L. Hernandez Caceres, First digit distribution in some biological data sets. Possible explanations for departures from Benford’s Law, El. J. Biomed. 1(2008) 27–35.
[9] L. Shao, B.Q. Ma, Empirical mantissa distributions of pulsars, Astrop. Phys. 33 (2010) 255–262.
[10] D. E. Giles, Benford's law and naturally occurring prices in certain ebaY auctions, Applied Economics Lett. 14 (2007) 157-161.
[11] Ed. Bormashenko, Ye. Bormashenko, et al., Benford's Law, its applicability and breakdown in the IR spectra of polymers, Physica A, 444 (2016) 524-529.
[12] G. Whyman, E. Shulzinger, E. Bormashenko, Intuitive considerations clarifying the origin and applicability of the Benford law, 2015, ArXiv: 1510.07220.
Напечатано: в журнале "Семь искусств" № 12(69) декабрь 2015
Адрес оригинальной публикации: http://7iskusstv.com/2015/Nomer12/Bormashenko1.php