Нормальный закон распределения ошибок происходит из опыта человеческого рода как одного из наиболее широких обобщений естественной философии. Он служит руководящим принципом при исследованиях в естественных и гуманитарных науках, а также в медицине, сельском хозяйстве и инженерии. Это незаменимый инструмент для анализа и интерпретации базовых данных, получаемых в результате наблюдений и экспериментов.

Уильям Дж. Юден

История анализа и статистики

Изучение статистических тенденций началось в конце XVIII века, когда многие математики и экономисты пытались вывести формулу для определения вероятности возникновения случайных колебаний или ошибок в данных. Одно из направлений этих исследований, сосредоточенное на изучении различных политических систем в существующих государствах, получило название статистика. Этот термин ввел немецкий ученый Готфрид Ахен-валль. В итоге слово «статистика» прочно вошло в количественные исследования политических и экономических данных, связанных со смертностью на количество жителей, что было очень важно для компаний, занимавшихся страховыми выплатами. Параллельно с этими прикладными разработками продолжалось исследование вероятности, в основном связанное с оценкой шансов в азартных играх.

Нормальное распределение вероятностей

У истоков этого научного направления стояли знаменитые математики, в частности Пьер де Ферма, Блез Паскаль и Якоб Бернулли. Эти математические разработки дали формулу того, что позже было названо нормальным распределением вероятностей. Формула впервые была получена французским математиком-гугенотом Абрахамом де Муавром, который в 1685 году был вынужден искать в Лондоне убежище от религиозных преследователей. В 1733 году он опубликовал статью, в которой рассуждал о вероятности возникновения ошибки любого заданного размера при известных допущениях. Позже статья вошла во второе издание книги Муавра «Учение о шансах», где была описана аппроксимация биномиального распределения вероятностей при большом количестве возможных результатов. Как ни жаль, современники практически не заметили эту работу, а в ней самой не было ни схем, ни иллюстраций. В XVIII веке сразу несколько математиков независимо открыли эту важнейшую формулу, подходя к проблеме с разных сторон, но никто из них все еще не предпринял одного простого шага – не нарисовал иллюстрацию. Кто же сделал это первым?

Вероятности в старховых компаниях

В обычных трудах по истории статистики ответ на этот вопрос найти непросто, и требуется ненадолго стать детективом, чтобы узнать, кто это был. По-видимому, первое изображение нормального распределения вероятностей находится в книге Огастеса де Моргана «Заметки о вероятностях и об их применимости к исследованию рисков для жизни и работе страховых компаний» (1838). Де Морган был великим ученым, внесшим вклад во многие области математики, статистики и логики.

binom
Нормальная кривая как граница биномиального распределения. Рисунок Адольфа Кетле. 1846

Он стал первым профессором математики в Университетском колледже Лондона и мог бы сделать карьеру в Кембриджском университете, но этому помешали его религиозные убеждения. Несмотря на то что де Морган был англиканцем, он отказался сдавать в Кембридже экзамен по богословию и из-за этого не смог получить степень магистра. Кроме того, из принципиальных соображений он дважды отказывался от кафедры в Лондоне, а также не пожелал стать членом Королевского научного общества и почетным доктором Эдинбургского университета. Определенно Де Морган был непростым человеком! В его книге есть главы, посвященные закономерностям появления случайных ошибок. Кроме того, он привел несколько иллюстративных схем, графики на которых имели характерную форму колокола.

Такую кривую де Морган назвал стандартным законом возможности возникновения ошибок

Использование статистики для изучения социальных тенденций наиболее активно пропагандировал бельгийский ученый Адольф Кетле (1796-1874), немало сделавший для целого ряда научных направлений. Он разработал принципы количественных и сравнительных исследований в области статистических тенденций. Этому он посвятил 50 лет, начиная с 1824 года. Кетле был новатором в использовании графиков и диаграмм и способствовал развитию способов наглядного представления данных в целом ряде наук. Он назвал кривую нормального распределения вероятностей кривой возможности.

teoria oshibki
Первые изображения кривой нормального распределения, приведенные в работе Огастеса де Моргана «Эссе о вероятностях» (1838)

 

Распределения с малой дисперсией характеризуются более высокими пиковыми значениями вблизи от центрального значения, чем те, дисперсия у которых больше. Чем больше дисперсия, тем более плоскую форму имеет график, и тем более равномерно распределяется вероятность между потенциальными возможностями. Распределение непрерывно продолжается до бесконечности как в положительном, так и в отрицательном направлении, но на практике в конце концов удается найти наибольшее и наименьшее значения, вероятности которых слишком малы, чтобы учитывать их на практике. Вот почему кажется, что некоторые кривые Моргана и Кетле заканчиваются при больших положительных и отрицательных значениях по горизонтальной оси.

Концепция среднего человека Кетле

У Адольфа Кетле был целый ряд последователей, в том числе и английский ученый Фрэнсис Гальтон, двоюродный брат Чарльза Дарвина (о Гальтоне мы говорили в главе «Унесенные ветром. Метеорологические карты» во второй части). Именно он ввел термин «нормальное распределение» для обозначения такого распределения вероятностей. Все они настаивали на том, что статистические показатели универсальны, и пользовались статистикой для изучения общества в целом и различных его слоев. Кетле первым сформулировал концепцию среднего человека (о котором так любят вспоминать в своих банальных рассуждениях политики). Причина, по которой эта характеристическая кривая вероятности тех или иных событий так часто используется в гуманитарных и естественнонаучных исследованиях, проста. Это неизбежный статистический итог при суммировании результатов большого числа различных, но независимых, случайных процессов. По мере того как количество суммируемых процессов возрастает, результат все более приближается к нормальному распределению. Многие явления в наблюдаемом нами мире выглядят так, как будто зависят от поразительно большого сплетения различных факторов, причем способы их взаимосвязей проследить невозможно. Но поскольку отдельные процессы являются независимыми и могут суммироваться, в результате возникает нормальное распределение с определенным средним значением и определенной дисперсией, которые выводятся на основании характеристик конкретного процесса, вызвавшего ту или иную ситуацию.

Социальная физика или социальная механика

Кетле принадлежит идея создания науки о социуме, которую сам он называл социальной физикой или социальной механикой (по аналогии с предложенным Лапласом термином «небесная механика»). Это название отражало стойкое убеждение Кетле в том, что социальное поведение предсказуемо и детерминировано; другие называли эту науку моральной статистикой. Взгляды Кетле на значимость социального усреднения были несколько экстремистскими. Обнаружив возможность определения среднего человека для той или иной национальности, Кетле предполагал, что отдельный человек может отражать черты всего своего народа и даже человечества в целом. Такие выводы основывались на процессе определения отклонения от среднего значения: «Если принять среднего человека за уменьшенную копию всего народа, его можно будет считать образцом типа этого народа. Если его можно принять за аналог массы людей, он сможет представлять собой тип человека как биологического вида».

Наиболее значительная работа Кетле была написана в 1842 году и называлась «Трактат о человеке». В ней ученый наконец построил статистическую модель среднего человека. Это также позволило ему спрогнозировать среднее ежегодное количество самоубийств, убийств, браков и преступлений, которые могут произойти в различных обществах. Любопытно, что он не отводил значительной роли случайности при исследовании этих статистически прогнозируемых явлений, но придерживался довольно фаталистических взглядов на человечество, считая, что люди ничего не могут поделать с непреодолимыми законами статистики. Именно поэтому Кетле считал свои исследования социальной физикой, в которой действуют законы человеческого поведения, такие же непреложные, как законы физики газов и движения тел.

В течение последующих 100 лет данный метод был ловушкой для многих ученых, интересовавшихся евгеникой, начиная с Фрэнсиса Гальтона (который дал название этой науке). Приверженцы евгеники ставили своей целью доказательство превосходства одного класса, пола, расы над другими. Нормальное распределение зачастую играло ключевую роль в таких спорах.

График нормального распределения теперь называли колоколообразной кривой

Это название, отражающее характерную форму кривой, ввел в 1872 году Эспри Жуффре. Предположение, что некоторые человеческие черты имеют нормальное распределение, служило аргументом в пользу того, что можно определить средний набор свойств популяции и таким образом характеризовать данную популяцию как находящуюся объективно выше или ниже среднего значения. Интересно отметить, что даже во времена Кетле нашлись люди, решительно выступавшие против развития статистики в социальной сфере и против активной поддержки статистики, которую осуществляли влиятельные персоны. Примечательно, что среди этих оппонентов была и Флоренс Найтингейл, стоявшая не только у истоков военной санитарной службы, но у истоков статистической науки, восторженная ученица Кетле, которая внесла значительный вклад в разработку новых статистических методов. Кроме того, в числе оппонентов статистики был великий писатель Чарльз Диккенс.

Противники статистики

Диккенс непреклонно выступал против статистики. По его мнению, сводя все к средним значениям, мы не замечаем потребностей отдельного человека. Статистика дает правительству аргументы в пользу того, что в среднем люди живут вполне хорошо и уровень жизни даже улучшается, что количество несчастных случаев на производстве в конкретной промышленной отрасли в среднем невелико. А это повод отказаться от принятия новых законов, которые облегчили бы существование беднейших слоев населения либо улучшили чрезмерно опасные условия труда. В 1864 году Диккенс писал: «Статистики являются злейшим и самым страшным злом нашего времени». В 1854 году был опубликован его роман «Тяжелые времена», в котором писатель жестко критиковал чудовищное экономическое неравенство. Один из запоминающихся персонажей романа – скупой мистер Томас Грэдграйнд, бывший торговец, а затем школьный учитель. Его не интересует ничто, кроме цифр и фактов. Даже своих учеников он знает по номеру, а не по имени. У него всегда с собой линейка и весы, чтобы «взвесить и измерить любой образчик человеческой природы и безошибочно определить, чему он равняется». Сын Грэд-грайнда Том, уличенный в воровстве, оправдывается, ссылаясь на открытия Кетле. Том говорит, что закон средних величин означает, что в обществе обязательно должны быть нечестные люди – так устроен мир. Дочь Трэдграйнда Луиза выходит замуж за нелюбимого человека, и отец соглашается, потому что доверяет положительной статистике, учитывающей удачные браки, но забывающей, как важна здесь сердечная склонность. Таким образом, не умея соотнести цифры и факты с любовью и чувствами, Грэдграйнд ломает жизнь своей дочери. Из-за болезненной зависимости от средних значений и статистических законов Грэдграйнд обречен закончить свои дни в нищете. Как тут не вспомнить про экономиста, утонувшего в озере, средняя глубина которого была шесть дюймов.

«Колоколообразная кривая» и в наши дни остается в центре споров о социальном и расовом неравенстве в отношении интеллектуального развития и экономических достижений. В этой работе предпринимается попытка охарактеризовать сложные свойства, например разум, как одиночные (неизменные) показатели, поддающиеся оценке на общей шкале. Неудивительно, что эта книга вызвала больше критических отзывов и споров, чем любое другое современное исследование. С момента выхода книги Хернстейна и Мюррея «колоколообразная кривая» – это не просто график распределения, придуманный де Морганом и Кетле. Для многих публицистов это нечто большее и даже зловещее. Этот рисунок – прекрасный пример того, как наглядны простые схемы и в то же время как они могут быть опасны. Говорят, Эйнштейн однажды заметил: «Вещи должны быть настолько просты, насколько это возможно, но не проще».

Добавить комментарий