Домой Трещины Учебное пособие: Математическая статистика. Введение в математическую статистику Методы математической статистики в вк

Учебное пособие: Математическая статистика. Введение в математическую статистику Методы математической статистики в вк

«Некоторые люди думают, что они всегда правы. Такие люди не могли бы ни быть хорошими учёными, ни иметь какой – либо интерес к статистике… Случай был с неба спущен на землю, где он стал частью мира науки». (Дайменд С.)

«Случай - только мера нашего невежества. Случайными явлениями, если дать им определение, будут те, законов которых мы не знаем». (А. Пуанкаре «Наука и гипотеза»)

«Слава случаю. Разве не случай
С непреложным всегда наравне…
Случай часто событием правит,
Порождает и радость, и боль.
И задачу пред нами жизнь ставит:
Как постигнуть случайности роль»
(из книги Б.А. Кордемского «Математика изучает случайности»)

Сам мир закономерен – так мы часто считаем и изучаем законы физики, химии и т.д., и всё же ничто не происходит без вмешательства случайности, возникающей под воздействием непостоянных, побочных причинных связей, изменяющих ход явления или опыта при его повторении. Создаётся «эффект случайности» с присущей закономерностью «скрытой предопределённости», т.е. у случайности появляется необходимость закономерного исхода.

Математики случайные события рассматривают лишь в дилемме « быть или не быть» - наступит или не наступит.

Определение. Раздел прикладной математики, в котором исследуются количественные характеристики массовых случайных событий или явлений, называется математической статистикой.

Определение. Соединение элементов теории вероятностей и математической статистики называют стохастикой.

Определение. Стохастика - это тот раздел математики, который возник и развивается в тесной связи с практической деятельностью человека. Сегодня элементы стохастики входят в математику для всех, становятся новым, важным аспектом математического и общего образования.

Определение. Математическая статистика – наука о математических методах систематизации, обработки и использовании статистических данных для научных и практических выводов.

Поговорим об этом подробнее.

Общепринятой сейчас является точка зрения на математическую статистику как на науку об общих способах обработки результатов эксперимента. Решая эти проблемы, каким должен обладать эксперимент, чтобы сделанные на его основании суждения были правильными. Математическая статистика отчасти становится наукой о планировании эксперимента.

Значение слова «статистика» за последние два столетия претерпело значительные изменения, - пишут известные современные учёные Ходжес и Леман, - слово «статистика» имеет один корень со словом «государство» (state) и первоначально означало искусство и науку управления: первые преподаватели статистики университетов Германии 18-го века сегодня назывались бы специалистами по общественным наукам. Поскольку решения правительства до некоторой степени основываются на данных о населении, промышленности и т.д. статистики, естественно, стали интересоваться и такими данными, и постепенно слово «статистика» стало означать сбор данных о населении, о государстве, а затем вообще сбор и обработку данных. Нет смысла извлекать данные, если из этого не извлекается какая-то польза, и статистики, естественно, начинают заниматься интерпретацией данных.

Современный статистик изучает методы, при помощи которых можно сделать выводы о популяции на основе данных, которые обычно получают из выборки «популяции».

Определение. Статистик – человек, который занимается наукой о математических методах систематизации, обработке и использования статистических данных для научных и практических выводов.

Математическая статистика возникла в 17 веке и развивалась параллельно с теорией вероятностей. Дальнейшее развитие математической статистики (вторая половина 19 начало 20-ых веков) обязано в первую очередь, П.Л. Чебышеву, А.А. Маркову, А.М. Ляпунову, К. Гауссу, А. Кетле, Ф.Гальтону, К Пирсону, и др. В 20 –ом наиболее существенный вклад в математическую статистику был сделан А.Н. Колмогоровым, В.И. Романовским, Е.Е. Слуцким, Н.В. Смирновым, Б.В. Гнеденко, а также английскими Стъюдентом, Р. Фишером, Э. Пурсоном и американскими (Ю. Нейман, А Вальд) учёными.

Задачи математической статистики и значение ошибки в мире науки

Установление закономерностей, которым подчинены массовые случайные явления, основаны на изучении методами теории вероятностей статистических данных результатов наблюдений.

Первая задача математической статистики – указать способы сбора и группировки статистических сведений, полученных в результате наблюдений или в результате специально поставленных экспериментов.

Вторая задача математической статистики – разработать методы анализа статистических данных в зависимости от целей исследования.

Современная математическая статистика разрабатывает способы определения числа необходимых испытаний до начала исследования (планирования эксперимента), в ходе исследования (последовательный анализ). Её можно определить как науку о принятии решений в условии неопределённости.

Кратко, можно сказать, задача математической статистики состоит в создании методов сбора и обработки статистических данных.

При изучении массового случайного явления предполагается, что все испытания производятся при одинаковых условиях, т.е. группа основных факторов, поддающихся учёту (измерению) и оказывающих существенное влияние на результат испытания, сохраняет по возможности одинаковые значения.

Случайные факторы искажают результат, который получился бы при наличии только основных факторов, делают его случайным. Отклонение результата каждого испытания от истинного называется ошибкой наблюдения, которая представляет собой случайную величину. Необходимо различать систематические ошибки и случайные.

Научный эксперимент немыслим без ошибки как океан, без соли. Любой поток фактов, пополняющий наше знание, приносит какую-то ошибку. Согласно известной поговорке в жизни у большинства людей ни в чём нельзя быть уверенным, кроме смерти и налогов, а учёный добавляет: “И ошибок опыта”.

Статистик- это “ищейка”, которая охотится за ошибкой. Статистика инструмент для обнаружения ошибки.

Слово “ошибка” не означает простой “просчёт”. Последствия просчёта – это небольшой и сравнительно неинтересный источник ошибки эксперимента.

Действительно, наши инструменты ломаются; наши глаза и уши могут обмануть нас; наши измерения никогда не бывают совершенно точными, иногда даже наши арифметические подсчёты бывают ошибочными. Ошибка эксперимента есть нечто более существенное, чем неточная рулетка или обман зрения. И так как важнейшее дело статистики помочь учёным проанализировать ошибку эксперимента, то мы должны попытаться понять, что же такое ошибка в действительности.

Над какой бы проблемой учёный не работал, она, безусловно, окажется более сложной, чем ему бы хотелось. Предположим, он измеряет выпадение радиоактивных осадков в разных широтах. Результаты будут зависеть от высоты над уровнем моря тех мест, где собраны образцы, от количества местных осадков и от высотных циклонов на более широких пространствах.

Экспериментальная ошибка - это неотъемлемая часть всякого подлинно научного опыта.

Один и тот же результат может быть ошибкой и информацией в зависимости от проблемы и точки зрения. Если биолог желает исследовать, как изменение в питании влияют на рост, то наличие родственной конституции являются источником ошибки; если же он изучает зависимость между наследственностью и ростом, источником ошибки будут различия в питании. Если физик хочет исследовать зависимость между электропроводностью и температурой, различия в плотности, служащего проводником материала, являются источником ошибки; если же он изучает зависимость между этой плотностью и электропроводностью, температурные изменения будут источником ошибки.

Это употребление слова ошибка может показаться сомнительным, и, возможно, предпочтительным было бы сказать, что полученные эффекты искажены “непредполагаемыми” или “нежелательными” воздействиями. Мы планируем эксперимент для изучения известных влияний, но случайные факторы, которые мы не в состоянии предвидеть или проанализировать, искажают результаты, добавляя к ним свои собственные эффекты.

Различия между запланированными эффектами и эффектами, обусловленными случайными причинами, подобно различию между движениями судна в море, плывущего по определённому курсу, и судна, дрейфующего бесцельно по воле изменчивых ветров и течений. Движение второго судна можно назвать движением случайным. Не исключено, что это судно может прийти в какой - либо порт, но более вероятно, что оно, ни в какое определённое место не придёт.

Статистики употребляют слово “случайный” для обозначения явления, исход которого в предстоящий момент времени совершенно невозможно предсказать.

Ошибка, обусловленная предусмотренными в опыте эффектами, бывает иногда скорее систематической, нежели случайной.

Систематическая ошибка вводит в заблуждение больше, чем случайная. Помехи, идущие от другой радиостанции, могут создать систематический музыкальный аккомпанемент, который вы иногда можете предсказать, если вы знаете мелодию. Но этот “аккомпанемент” может быть причиной того, что мы можем составить неправильное суждение о словах или о музыке программы, которую мы пытаемся услышать.

Однако обнаружение систематической ошибки часто наводит нас на след нового открытия. Знания, каким образом появляются случайные ошибки, помогают нам обнаружить систематические ошибки и, следовательно, исключить их.

Тот же характер рассуждений обычен и в наших житейских делах. Как часто мы замечаем: “Это не случайность!”. Всякий раз, когда мы можем это сказать – мы находимся на пути к открытию.

Например, А.Л. Чижевский, анализируя исторические процессы: увеличение смертности, эпидемии, начала войн, великие перемещения народов, резкие изменения климата и т.д. открыл зависимость между этими, не связанными между собой процессами и периодами солнечной активности, которые имеют циклы: 11 лет, 33 года.

Определение. Под систематической ошибкой понимается ошибка, повторяющаяся и одинаковая для всех испытаний. Она обычно связана с неправильным ведением эксперимента.

Определение. Под случайными ошибками понимаются ошибки, возникающие под влиянием случайных факторов и меняющихся случайным образом от опыта к опыту.

Обычно распределение случайных ошибок симметрично относительно нуля, откуда вытекает важный вывод: при отсутствии систематических ошибок истинный результат испытаний есть математическое ожидание случайной величины, конкретное значение которой фиксируется в каждом испытании.

Объектами изучения в математической статистике могут быть качественные или количественные признаки изучаемого явления или процесса.

В случае качественного признака подсчитывается число появлений этого признака в рассматриваемой серии опытов; это число и представляет собой изучаемую (дискретную) случайную величину. Примерами качественных признаков могут служить дефекты на готовой детали, демографические данные и т.д. Если признак является количественным, то в опыте производится прямое или косвенное измерения путём сравнения с некоторым эталоном - единицей измерения – с помощью различных измерительных приборов. Например, если имеется партия деталей, то качественным признаком может служить стандартность детали, а количественным – контролируемый размер детали.

Основные определения

Значительная часть математической статистики связана с необходимостью описать большую совокупность объектов.

Определение. Всю совокупность объектов, подлежащих изучению, называют генеральной совокупностью.

Генеральной совокупностью могут быть всё население страны, месячная продукция завода, популяция рыб, живущих в данном водоёме и т.д.

Но генеральная совокупность - это не просто множество. Если интересующая нас совокупность объектов слишком многочисленна, или объекты труднодоступны, или имеются другие причины, не позволяющие изучить все объекты, прибегают к изучению какой-то части объектов.

Определение. Та часть объектов, которая попала на проверку, исследование и т.п., называется выборочной совокупностью или просто выборкой.

Определение. Число элементов в генеральной совокупности и выборке называется их объёмами .

Как добиться, чтобы выборка наилучшим образом представляло целое, т.е. была бы репрезентативной?

Если целое, т.е. если генеральная совокупность нам мало известна или совсем неизвестна, не удаётся предложить ничего лучшего, чем чисто случайный выбор. Большая осведомлённость позволяет действовать лучше, но всё равно на некоторой стадии наступает незнание и, как результат – случайный выбор.

Но как осуществить чисто случайный выбор? Как правило, отбор идёт по легко наблюдаемым признакам, ради изучения которого ведётся исследование.

Нарушение же принципов случайного выбора приводило к серьезным ошибкам. Стал знаменитым своей неудачей опрос, проведённый американским журналом “Литературное обозрение” относительно исхода президентских выборов в 1936 году. Кандидатами на этих выборах были Ф.Д. Рузвельт и А.М. Ландон.

Кто победил?

В качестве генеральной совокупности редакция использовала телефонные книги. Отобрав случайно 4 миллиона адресов, она разослала открытки с вопросами об отношении к кандидатам в президенты по всей стране. Затратив большую сумму на рассылки и обработку открыток, журнал объявил, что на предстоящих выборах в президенты с большим перевесом победит Ландон. Результат выборов оказался противоположенным этому прогнозу.

Здесь были совершенны сразу две ошибки. Во-первых, телефонные книги не дают репрезентативную выборку из населения США – в основном зажиточные главы семейств. Во-вторых, прислали ответы не все люди, а в значительной части представители делового мира, которые и поддерживали Ландона.

В то же время социологи Дж. Гэллан и Э. Уорнер правильно предсказали победу Ф.Д. Рузвельта, основываясь только на четырёх тысячах анкетах. Причиной этого успеха было не только правильное составление выборки. Они учли, что общество распадается на социальные группы, которые более однородны по отношению к кандидатам в президенты. Поэтому выборка из слоя может быть относительно малочисленной с тем же результатом точности. Победил в итоге Рузвельт, который был сторонником реформ для менее богатых слоёв населения.

Имея результаты обследования по слоям, можно характеризовать общество в целом.

Что представляют собой выборки?

Это ряды чисел.

Более подробно остановимся на основных понятиях, характеризующих ряд выборки.

Из генеральной совокупности извлечена выборка объёмом n> n 1 , где n 1 – столько раз наблюдалось появление x 1 , n 2 - x 2 и т.д.

Наблюдаемые значения х i называют вариантами, а последовательность вариантов, записанных в возрастающем порядке - вариационным рядом. Числа наблюдений n i называют частотами и n i /n - относительными частотами (или частостями).

Определение. Различные значения случайной величины называются вариантами.

Определение. Вариационным рядом называется ряд, расположенный в порядке возрастания (или убывания) вариантов с соответствующими им частотами (частостями).

При изучении вариационных рядов наряду с понятиями частоты используется понятие накопленной частоты. Накопленные частоты (частости) для каждого интервала находятся последовательным суммированием частот всех предшествующих интервалов.

Определение. Накопление частот или частостей называют кумуляцией . Кумулировать можно частоты вариант и интервалов.

Характеристики ряда могут быть количественные и качественные.

Количественные (вариационные) характеристики – это характеристики, которые можно выразить числами. Их подразделяются на дискретные и непрерывные.

Качественные (атрибутивные) характеристики – это характеристики, которые не выражаются числами.

Непрерывные переменные – это переменные, которые выражаются действительными числами.

Дискретные переменные – это переменные, которые выражаются только целыми числами.

Выборки характеризуются центральными тенденциями : средним значением, модой и медианой. Средним значением выборки называют среднее арифметическое всех её значений. Мода выборки – те её значения, которые встречаются чаще всего. Медиана выборки – это число, “разделяющее” пополам упорядоченную совокупность всех значений выборки.

Вариационный ряд может быть дискретным или непрерывным.

Задача

Дана выборка: 1,3; 1,8; 1,2; 3,0; 2,1; 5; 2,4; 1,2; 3,2;1,2; 4; 2,4.

Это ряд вариантов. Расположив эти варианты в возрастающем порядке, мы получим вариационный ряд: 1,2; 1,2; 1,2; 1,3; 1,8; 2,1; 2,4; 2,4; 3,0; 3,2; 4; 5.

Среднее значение этого ряда равно 2,4.

Медиана ряда 2,25.

Мода ряда –1,2.

Дадим определения этим понятиям.

Определение. Медианой вариационного ряда называется то значение случайной величины, которое приходится на средину вариационного ряда (Ме).

Медианой упорядоченного ряда чисел с нечетным числом членов называется число, записанное посередине, а медианой упорядоченного ряда чисел с четным числом членов называется среднее арифметическое двух чисел, записанных посередине. Медианой произвольного ряда чисел называется медиана соответствующего упорядоченного ряда.

Определение. Модой вариационного ряда называют вариант (значение случайной величины), которому соответствует наибольшая частота (Мо), т.е. которая встречается чаще других.

Определение. Среднеарифметическим значением вариационного ряда называется результат деления суммы значений статистической переменной на число этих значений, то есть на число слагаемых.

Правило нахождения среднеарифметического значения выборки:

  1. каждую варианту умножить на её частоту (кратность);
  2. сложить все полученные произведения;
  3. поделить найденную сумму на сумму всех частот.

Определение. Размахом ряда называется разность между R=x max -x min , т.е. наибольшим и наименьшим значениями этих вариантов.

Проверим, правильно ли мы нашли среднее значение этого ряда, медиану и моду, опираясь на определения.

Сосчитали число членов, их 12 - чётное число членов, значит надо найти среднее арифметическое двух чисел записанных посередине, то есть 6 и 7-ой варианты. (2,1+2,4)\2=2.25 – медиана.

Мода. Модой является 1.2, т.к. только это число встречается 3 раза, а остальные встречаются меньше, чем 3 раза.

Среднеарифметическое значение находим так:

(1,2*3+1,3+1,8+2,1+2,4*2+3,0+3,2 +4+5)\12=2,4

Составим таблицу

Такие таблицы называют частотными. В них числа второй строки – частоты; они показывают, как часто встречаются в выборке те или другие её значения.

Определение. Относительной частотой значений выборки называют отношение её частоты к числу всех значений выборки.

Относительные частоты иначе называют частостями. Частоты и частости называют весами. Найдём размах ряда: R=5-1,2=3,8; Размах ряда равен 3,8.

Информация к размышлению

Среднее арифметическое – это условная величина. Реально она не существует. Реально существует общая сумма. Поэтому среднее арифметическое не есть характеристика одного наблюдения; она характеризует ряд в целом.

Среднее значение можно трактовать как центр рассеивания значений наблюдаемого признака, т.е. значения, около которого колеблются все наблюдаемые значения, причём алгебраическая сумма отклонений от среднего, всегда равна нулю, т.е. сумма отклонений от среднего в большую или меньшую сторону равны между собой.

Среднее арифметическое является абстрактной (обобщающей) величиной. Даже при задании ряда только из натуральных чисел, среднее значение может выражаться дробным числом. Пример: средний балл контрольной работы 3,81.

Среднее значение находится не только для однородных величин. Средняя урожайность зерновых по всей стране (кукуруза-50-60 ц. с га. и гречиха-по5-6 ц. с га, рожь, пшеница и т.д.), среднее потребление продуктов питания, средняя величина национального дохода на душу населения, средний показатель обеспеченности жильём, средний взвешенный показатель стоимости жилья, средняя трудоёмкость возведения здания и т.д. – это характеристики государства как единой народнохозяйственной системы, это так называемые системные средние.

В статистике широкое применение находят такие характеристики, как мода и медиана . Их называют структурными средними, т.к. значения этих характеристик определяются общей структурой ряда данных.

Иногда ряд может иметь две моды, иногда ряд может не иметь моды.

Мода является наиболее приемлемым показателем при выявлении расфасовки некоторого товара, которой отдают предпочтение покупатели; цены на товар данного вида, распространённый на рынке; как размер обуви, одежды, пользующийся наибольшим спросом; вид спорта, которым предпочитают заниматься большинство населения страны, города, посёлка школы и т.д.

В строительстве существует 8 вариантов плит по ширине, и более часто применяются 3 вида:1 м. 1,2 м. и 1,5 м. По длине 33 варианта плит, но чаще других применяются плиты длиной 4,8 м.; 5,7 м. и 6,0 м., мода на плиты чаще всего встречается среди этих 3-х размеров. Аналогично можно рассуждать и с марками окон.

Моду ряда данных находят тогда, когда хотят выявить некоторый типичный показатель.

Мода может быть выражена числом и словами, с точки зрения статистики мода – это экстремум частоты.

Медиана позволяет учитывать информацию о ряде данных, которую даёт среднее арифметическое и наоборот.

1. Математическая статистика. Введение

Математическая статистика - это такая дисциплина, которая применяется во всех областях научного знания.

Статистические методы предназначены для понимания "численной природы" действительности (Nisbett, et al., 1987).

Определение понятия

Математическая статистика - это раздел математики, посвященный методам анализа данных, преимущественно вероятностной природы. Она занимается систематизацией, обработкой и использованием статистических данных для теоретических и практ ических выводов.

Статистическими данными называются сведения о числе объектов в какой-либо более или менее обширной совокупности, обладающих теми или иными признаками. Здесь важно понять, что статистика имеет дело именно с количеством объектов, а не с их описательными признаками.

Цель статистического анализа - исследование свойств случайной величины. Для этого приходится несколько раз измерять значения изучаемой случайной величины. Полученная группа значений рассматривается как выборка из гипотетической генеральной совокупности .

Производится статистическая обработка выборки, и после этого принимается решение. Важно заметить, что вследствие начального условия неопределённости притятое решение всегда носит характер "нечёткого высказывания". Иными словами, в статистической обработке приходится иметь дело с вероятностями, а не с точными утверждениями.

Главное в статистическом методе - это подсчёт числа объектов, входящих в различные группы. Объекты собираются в группу по какому-то определённому общему признаку, а затем рассмотривается распределение этих объектов в группе по количественному выражению данного признака. В статистике часто применяется выборочный метод анализа, т.е. анализируется не вся группа объектов, а небольшая выборка - несколько объектов, взятых из большой группы. Широко используется теория вероятностей при статистической оценке наблюдений и при формировании выводов.

Основным предметом математической статистики является вычисление статистик (да простит нас читатель за тавтологию), являющихся критериями для оценки достоверности априорных предположений, гипотез или выводов по существу эмпирических данных.

Другое определение - “Статистики – это предписания, по которым из выборки рассчитывается некоторое число – значение статистики для данной выборки” [Закс, 1976]. Выборочные среднее и дисперсия, отношение дисперсий двух выборок или любые другие функции от выборки могут рассматриваться как статистики .

Вычисление "статистик" - это представление "одним числом" сложного стохастического (вероятностного) процесса.

Распределение Стьюдента

Статистики также являются случайными переменными. Распределения статистик (тест-распределения) лежат в основе критериев, которые построены на этой статистике. Например, В. Госсет, работая на пивоварне Гиннеса и публикуясь под псевдонимом “Стьюдент”, в 1908 г. доказал очень полезные свойства распределения отношения разности между выборочным средним и средним значением генеральной совокупности () к стандартной ошибке среднего значения генеральной совокупности , или t –статистики (распределение Стьюдента ):

. (5.7)

Распределение Стьюдента по форме при некоторых условиях приближается к нормальному .

Другими двумя важными распределениями выборочных статистик является c 2 -распределение и F -распределение , широко используемые в ряде разделов статистики для проверки статистических гипотез.

Итак, предмет математической статистики составляет формальная количественная сторона исследуемых объектов, безразличная к специфической природе самих изучаемых объектов.

По этой причине в приводимых здесь примерах речь идёт о группах данных, о числах, а не о конкретных измеряемых вещах. И поэтому по образцам расчётов, данных здесь, вы можете рассчитывать свои данные, полученные на самых разных объектах.

Главное - подобрать подходящий для ваших данных метод статистической обработки .

В зависимости от конкретных результатов наблюдений математическая статистика делится на несколько разделов.

Разделы математической статистики

        Статистика чисел.

        Многомерный статистический анализ.

        Анализ функций (процессов) и временных рядов.

        Статистика объектов нечисловой природы.

В современной науке считается, что любая область исследований не может быть настоящей наукой до тех пор, пока в неё не проникнет математика. В этом смысле математическая статистика является полномочным представителем математики в любой другой науке и обеспечивает научный подход к исследованиям. Можно сказать, что научный подход начинается там, где в исследовании появляется математическая статистика. Вот почему математическая статистика так важна для любого современного исследователя.

Хотите быть настоящим современным исследователем - изучайте и применяйте в своей работе математическую статистику!

Статистика с необходимостью появляется там, где происходит переход от единичного наблюдения к множественному. Если у вас имеется множество наблюдений, замеров и данных - то без математической статистики вам не обойтись.

Математическую статистику подразделяют на теоретическую и прикладную.

Теоретическая статистика доказывает научность и правильность самой статистики.

Теоретическая математи ческая статистика - наука, изучающая методы раскрытия закономерностей, свойственных большим совокупностям однородных объектов, на основании их выборочного обследования.

Этим разделом статистики занимаются математики, и они любят с помощь своих теоретических математических доказательств убеждать нас в том, что статистика сама по себе научна и ей можно доверять. Беда в том, что эти доказательства способны понять только другие математики, а обычным людям, которым нужно пользоваться математической статистикой эти доказательства всё равно не доступны, да и совершенно не нужны!

Вывод: Если вы не математик, то не тратьте зря свои силы на понимание теоретических выкладок по поводу математической статистики. Изучайте собственно статистические методы, а не их математические обоснования.

Прикладная статистика учит пользователей работать с любыми данными и получать обобщённые результаты. Неважно, какие именно это данные, важно, какое количество этих данных находится в вашем распоряжении. Кроме того, прикладная статистика подскажет нам, насколько можно верить в то, что полученные результаты отражают действительное положение дел.

Для разных дисциплин в прикладной статистике используют различные наборы конкретных методов. Поэтому различают следующие разделы прикладной статистики: биологическая, психологическая, экономическая и другие. Они отличаются друг от друга комплектацией примеров и приемов, а также излюбленными методами вычислений.

Можно привести следующий пример различий между применением прикладной статистики для разных дисциплин. Так, статистическое изучение режима турбулентных водных потоков производится на основе теории стационарных случайных процессов. Однако применение той же теории к анализу экономических временных рядов может привести к грубым ошибкам ввиду того, что допущение того, что распределение вероятностей сохраняется неизменным в этом случае, как правило, совершенно неприемлемо. Следовательно, для этих разных дисциплин потребуются разные статистические методы.

Итак, математическую статистику должен применять в своих исследованиях любой современный учёный. Даже тот учёный, который работает в направлениях, которые весьма далеки от математики. И он должен уметь применять прикладную статискику к своим данным, даже не зная её.

© Сазонов В.Ф., 2009.


Все книги можно скачать бесплатно и без регистрации.

NEW. Игорь Гайдышев. Анализ и обработка данных. Специальный справочник. 2001 ГОД. 742 СТР. DjVu. 11.0 Mб.
Информация, которую вы найдете в справочнике:
- статистики эмпирического ряда;
- проверка гипотез;
- дисперсионный анализ;
- теория распределений;
- корреляционный анализ;
- методы снижения размерности;
- факторный анализ;
- распознавание образов;
- методы теории информации;
- планирование эксперимента;
- методы теории множеств;
- аппроксимация зависимостей

скачать

NEW. Электронный учебник tat Soft. chm. 5.2 Mб.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Т. Андерсон. Введение в многомерный статистический анализ. 1963 год. 501 стр. djvu. 6.0 Мб.
Эта монография была первоначально задумана как учебник по годовому курсу статистики многомерных величин. Надеюсь, что данная работа послужит и введением во многие разделы этой области для всех, кто занимается математической статистикой. Книгу эту можно использовать также и как справочник.
В течение нескольких лет эта книга в виде конспекта использовалась при чтении годового курса в Колумбийском университете; первые шесть глав составили материал первого семестра, причем особое внимание уделялось теории корреляции. Предполагается, что читатель знаком с обычной теорией статистики одномерных величин, в частности с методами, основанными на одномерном нормальном распределении. Также предполагается знание матричной алгебры, однако этот материал включен в приложение к книге.
Надеюсь, что основные и наиболее важные разделы многомерного статистического анализа рассмотрены в настоящей работе, хотя отбор материала является до некоторой степени делом вкуса. Некоторые наиболее важные результаты лишь очень кратко затронуты в последней главе.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Айвазян В.А. Прикладная статистика. В 3-х томах. Справочное издание. 1983-1989 годы. djvu. 1.1 Мб.
Том 1. Основы моделирования и первичная обработка данных.
Книга посвящена методам предварительного статистического анализа данных и построения модели реального явления, характеризуемого этими данными. Приводятся сведения по теории вероятностей и математической статистике, освещаются вопросы программной реализации излагаемых методов. 472 стр. 8.9 Мб.
Том 2. Исследование зависимостей.
В книге рассматриваются методы корреляционного, регрессионного и дисперсионного анализа. Приводятся их алгоритмы и обзор программного обеспечения. 488 стр. 11.6 Мб.
Том 3. Классификация и снижение размерности.
Рассматриваются задачи классификации объектов, снижения размерности. Большое внимание уделяется разведочному статистическому анализу. 608 стр. 6.6 Мб.

. . . . . . . . . . . . . . . . . . .Скачать 1 . . . . . . . . . . Скачать 2 . . . . . . . . . . Скачать 3

В.С. Балинова. Статистика в вопросах и ответах. Учебное пособие. 2005 год. 344 стр. djvu. 2.9 Mб.
В учебном пособии в соответствии с государственным образовательным стандартом высшего профессионального образования подробно рассмотрены основные вопросы курса Статистика: предмет статистики и ее история, методы расчета абсолютных и относительных величин, сводки и группировки, средние величины, выборочное наблюдение, индексы и др.
В пособии также отражены изменения в методологии построения статистических показателей из-за перехода государственной статистики Российской Федерации на международные стандарты. Материал, изложенный в виде вопросов и ответов, включаемых в билеты, позволяет быстро и легко подготовиться к экзамену или зачету, сделать доклад или написать реферат.
Для студентов и преподавателей вузов, научных и практических работников, а также всех интересующихся статистикой.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Боровков. Математическая статистика. Оценка параметров. Проверка гипотез. 1984 год. Djvu. 240 стр. 12.2 Мб.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Скачать

Гусаров В.М. Статистика. Учебное пособие. 2003 год. 463 стр. djvu. 3.8 Мб.
В учебном пособии «Статистика» рассмотрены основные методы статистического исследования (статистическое наблюдение, сводка, группировка, расчет обобщающих показателей, выборочный метод, анализ рядов динамики, индексный метод анализа, основы корреляционного и регрессионного анализа). Показана необходимость их комплексного применения в анализе элементов рыночной экономики. Особое внимание уделено обоснованию вероятностного характера статистического вывода. Теория статистической методологии подкреплена иллюстрацией применения статистических методов в исследованиях конкретных социально-экономических процессов.
В учебном пособии «Статистика» нашло отражение расширение задач отечественной статистики в связи с выполнением «Государственной программы перехода Российской Федерации на принятую в международной практике систему учета и статистики в соответствии с требованиями развития рыночной экономики». Статистическая методология изложена в доступной форме, понятной читателю, не имеющему специальной подготовки.
В учебном пособии «Статистика» четыре раздела.
В первом разделе «Теория статистики» освещен предмет статистики, определены ее задачи, рассмотрены вопросы статистической методологии, показано применение важнейших методов статистического исследования социально-экономических явлений.
Во втором разделе «Макроэкономическая статистика» рассмотрены система показателей и методика их расчета, в совокупности» обеспечивающих количественную характеристику результатов функционирования экономики страны и регионов в разрезе отраслей, секторов и форм собственности; уровень жизни населения; система национальных счетов как макростатисти-ческая модель экономики.
Третий раздел «Статистика предприятия» посвящен анализу функционирования предприятия, условий применения и потребления основного и оборотного капитала и рабочей силы, характеристике натурально-вещественных и финансовых результатов производства.
Четвертый раздел «Статистика финансов» посвящен количественному и качественному анализу финансово-денежных отношений, возникающих в процессе производства. Рассмотрены вопросы статистики цен, кредита, денежного обращения, страхового рынка, рынка ценных бумаг, финансов предприятий, финансовых расчетов.

скачать

Дронов С.В. Многомерный статистический анализ. Учеб. пособие. 2003 год. 246 стр. pdf. 706 Кб.
Учебное пособие создано на основе опыта преподавания автором курсов многомерного статистического анализа и эконометрики. Содержит материалы по дискриминантному, факторному, регрессионному анализу, анализу соответствий и теории временных рядов. Изложены подходы к задачам многомерного шкалирования и некоторым другим задачам многомерной статистики. В начале пособия даются необходимык сведения из математике.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

И.И. Елисеева и др. Теория статистики с основами теории вероятностей. Учеб. пособие для вуэов. 2001 год. 446 стр. djvu. 7.1 Мб.
Изложены основы теории вероятностей, математической статистики и общие правила сбора, обработки и анализа статистических данных. Особое внимание уделено правилам принятия решений в условиях неопределенности. Анализ данных рассматривается также как составная часть принятия решений. Рассмотрены статистические методы изучения связей между переменными, проблемы построения и анализа временных рядов, прогнозирование на их основе. Показано значение статистики для решения основных прикладных задач: статистического контроля качества, разработки маркетинговой стратегии, финансового анализа и т п.
Для студентов и преподавателей экономических вузов и факультетов, аспирантов и стажеров.

. . . . . . . . . . . . . . . . . . . . . . . .скачать

И.И. Елисеева, М.М. Юзбашев. Общая теория статистики. Учебник. 2004 год. 657 стр. PDF. !4,8 МБ.
В учебнике «Общая теория статистики» рассмотрены основные процедуры сбора, обработки и анализа массовых данных; возможности их реализации на персональных компьютерах. Особое внимание уделено обоснованию вероятностного характера статистического вывода, выборочному методу, проверке статистических гипотез. Этот учебник дает представление об основных статистических методах, их возможностях и границах применения. Для желающих более глубоко изучить соответствующий раздел статистики в конце каждой главы приведен список рекомендуемой литературы.
Авторы стремились показать, что статистика не является скучной и трудной наукой, как иногда думают, а ее изучение может доставить удовольствие. Этим обусловлена подача материала - неформальная, но информативная. Изложение теории проиллюстрировано примерами из разнообразных областей, которые должны убедить читателя во «всесильности» статистики, возможности ее применения при решении различных задач.
Учебник «Общая теория статистики» соответствует программе подготовки бакалавров. Вместе с тем он будет полезен и занимающимся в магистратуре и даже в аспирантуре. В данное, 5-е издание, внесены уточнения и дополнения во все главы. Глава 2 существенно переработана и дополнена с учетом изменений в работе государственной статистики. Выборочный метод излагается теперь отдельно от методов проверки статистических гипотез, дополненных прежде всего изложением непараметрического тестирования.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Г.И. Ивченко, И.Ю. Медведев. Введение в математическую статистику. Учeбник. 2010 год. 600 стр. djvu. 8.7 Мб.
Настоящая книrа представляет собой своеобразный расширеттый учебник по математической статистике. Данный учебник не оrpаничен рамками учебноrо стандарта или вузовской проrpаммы. Он предназначен всем, кто интересуется математикой вообще и, в частности, хочет узнать, что такое современная мaтeмaтическая статистика, какие задачи и какими методами она решает, какие результаты в ней уже накоплены, какие проблемы в ней сеrодня актуальны, наконец, каковы ее истоки, какой путь она прошла и какие ученые были ее творцами. По замыслу авторов, книrа простым и ДОСТУПНbIМ ЯЗbIКОМ рассказывает о математической стaтистике и одновременно обучает ей. Вся теория объясняется и иллюстрируется на интересных и тщательно подобранных примерах. Книrа может служить и задачником, так как содержит большой список упражнений для самостоятельноrо решения, а также справочным пособием по математической статистнке, а в некоторых аспектах и по теории вероятностей.
Книrа будет интересна преподавателям, аспирантам и студентам естественных и технических вузов, в которых изучается математическая статистика, научным работникам, использующим в своей деятельности методы математической статистики, а также самому широкому Kpyry любителей математики.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

В.Г. Ионин редактор. Статистика. Курс лекций. 2000 год. 310 стр. djvu. 1.8 Мб.
Учебное пособие охватывает основные разделы курса "Статистика", являющегося базовым для студентов НГАЭиУ всех специальностей и форм обучения. Курс включает два раздела: теорию статистики (развитие статистики, методы сбора и обработки данных, анализа сатистических взаимосвязей) и вопросы применения статистики в конкретных исследованиях социально-экономических процессов (оценка уровня экономического развития, основных условий и факторов социаьных и экономических процессов, факторов и результатов деятельности в сфере производства, уровня жизни).
Издание предназначено для студенто и всех интересующихся проблемами непосредственного анализа конкретных процессов в области производства, учёта и финансов.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Калинина В.Н., Панкин В.Ф. Математическая статистика. 4-е изд. Уч. пособие. 2002 год. 340 стр. djvu. 3.5 Mб.
В учебнике (3-е изд. - 2001 г.) содержатся наиболее важные разделы математической статистики: оценивание числовых характеристик и закона распределения случайной величины, проверка гипотез, дисперсионный и корреляционно-регрессионный анализ, а также необходимые для понимания этих разделов сведения по теории вероятностей. Приведены примеры и упражнения, их разбор и решения, графические иллюстрации. В учебник включены вопросы статистического моделирования случайных величин и систем массового обслуживания на ЭВМ, широко используемого специалистами, которые работают в области программирования и использования ЭВМ.
Для студентов средних специальных учебных заведений.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Кремлев А. Г. Статистика. Учеб. пособие. 2001 год. 140 стр. pdf. 5.8 Мб.
Изложены теоретические основы математической статистики: анализ вариационных рядов, оценивание числовых характеристик и закона распределения, анализ корреляционной зависимости, линейные и нелинейные модели регрессии, проверка гипотез. Рассматриваются и объясняются в примерах практические методы расчета статистических характеристик. Каждый раздел содержит систематизированную подборку задач и необходимые для их решения статистические таблицы.
Студентам юридических и других гуманитарных вузов и факультетов, а также всем интересующимся методами статистического анализа данных.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Кобзарь А. И. Прикладная математическая статистика. Для инженеров и научных работников. 2008 год. 816 стр. djvu. 8.1 Мб.
В книге рассматриваются способы анализа наблюдений методами математической статистики. Последовательно на языке, доступном специалисту - не математику, излагаются современные методы анализа распределений вероятностей, оценки параметров распределений, проверки статистических гипотез, оценки связей между случайными величинами, планирования статистического эксперимента. Основное внимание уделено пояснению примеров применения методов современной математической статистики. Книга предназначена для инженеров, исследователей, экономистов, медиков, аспирантов и студентов, желающих быстро, экономично и на высоком профессиональном уровне использовать весь арсенал современной математической статистики для решения своих прикладных задач.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Крянев, Лукин. Математические методы обработки неопределенных данных. 215 стр. djv. 2.4 Мб.
В первых главах монографии изложены основные понятия параметрической и непараметрической статистики, включая понятия оценки, а также требования, предъявляемые к свойствам оценок с точки зрения их вычисления при обработке данных на компьютере. В 7-13 главах монографии изложены методы и алгоритмы восстановления регрессионных зависимостей, включая методы прогнозирования и решения задач планирования оптимальных экспериментов.
Предполагается, что читатель предварительно освоил курс теории вероятностей и математической статистики. В монографии представлены некоторые новые методы робастного оценивания и учета априорной информации, включая алгоритмы их численной реализации. Основная цель монографии - ознакомить читателя с наиболее эффективными и апробированными классическими и новыми статистическими методами оценки и восстановления, научить использовать эти методы при решении конкретных задач обработки неопределенных данных. Монография предназначена научным работникам, аспирантам, студентам старших курсов различных специальностей.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Скачать

Лялин В. С., Зверева И. Г., Никифорова Н. Г. : Статистика. Теория и практика в Excel. 2010 год. 448 стр. djvu. 10.5 Мб.
Рассмотрены вопросы обшей теории статистики и практики современных статистических исследований в соответствии с требованиями государственного образовательного стандарта высшего профессионального образования. Приведены основные концепции, понятия и показатели теоретической статистики. Описана на конкретных примерах методика использования табличного процессора Excel для статистической обработки информации.
Для студентов, аспирантов, преподавателей и практических работников, заинтересованных в изучении и использовании современных методов анализа статистических данных. Может быть использовано как справочное издание для анализа исходного статистического массива в Excel.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Лапач С.Н., Чубенко А.В., Бабич П.Н. Статистические методы в медико-биологических исследованиях с использованием Excel. 2001 год. 408 стр. djvu. 18.1 Мб.
Монография призвана обеспечить читателей инструментарием для решения задач, требующих использования статистических методов, помочь им правильно и эффективно их применять. В ней содержится описание методов проверки гипотез о средних и дисперсиях, наличия связи между факторами (корреляционный, дисперсионный анализ, анализ таблиц сопряженности), методов классификации (кластерный и дискриминантный анализ) и получения зависимостей (регрессионный анализ, анализ временных рядов). Приведены теоретические сведения, базовые понятия, необходимые для усвоения предмета, и материал, достаточный для решения задач с использованием Excel. Описание каждого метода сопровождается примером. Поскольку в Excel многие из рассматриваемых методов отсутствуют, разработаны и описаны программы для расширения его возможностей, которые также содержатся на прилагаемой к книге дискете. Рассматриваются типичные ошибки, возникающие при применении статистических методов, а также способы, позволяющие их избежать. Во втором издании рассмотрены дополнительные возможности статистического анализа данных, реализованные в Microsoft Excel 2000, включая графические методы. Расширено описание базовых понятий теории вероятностей с точки зрения их практического применения. Добавлены новые программы (дискриминантного и кластерного анализа, построения рейтингов, расчета коэффициентов корреляции Спирмена и Кендалла). Освещены основные проблемы применения статистических методов в клинических испытаниях.
Издание содержит русско-английский и англо-русский словари терминов математической статистики.
Для исследователей, специалистов медико-биологического профиля, маркетологов, а также студентов и аспирантов.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Р.С. Рао. Линейные статистические методы и их применения. 1968 год. 548 стр. djvu. 22.3 Мб.
Книга содержит восемь глав. В главе 1 изложены необходимые сведения из линейной алгебры, в главе 2 - из теории вероятностей. Статистическая часть начинается с главы 3, где описываются некоторые стандартные распределения математической статистики, вводится нормальный закон и изучаются распределения статистик, играющих фундаментальную роль в методе наименьших квадратов. Глава 4 посвящена статистическим выводам, базирующимся на линейных моделях для математических ожиданий. Особое внимание уделяется вычислительной стороне метода наименьших квадратов. Рассматриваются также различные задачи доверительного оценивания линейных параметрических функций. В главе 5 рассматриваются общие (не только линейные) методы оценивания параметров. Здесь доказана теорема Рао - Блекуэла - Колмогорова и рассмотрены связанные с ней вопросы. Подробно излагается теория информационного количества Фишера. Рассмотрены общие методы оценивания при различных предположениях о паре (параметр, наблюдаемая переменная), а также асимптотическая теория оценивания. Подробно изучены оценки максимального правдоподобия. Основная часть главы 4 отведена применению критерия хи-квадрат к различным задачам. В главе 7 излагаются критерий Неймана-Пирсона, построение локально наиболее мощных критериев, конструкция подобных тестов для семейств с нетривиальными достаточными статистиками, различные меры асимптотической эффективности критериев, общий метод построения доверительных множеств, схема последовательного анализа. В главе 8 рассматриваются: распределение Уишарта, критерии различных гипотез о параметрах многомерного нормального закона, дискриминантный анализ. Изложение иллюстрируется примерами преимущественно биометрического характера. В конце каждой главы приведено большое количество задач и упражнений, а также обширная библиография.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Рудакова Р.П., Букин Л.Л., Гаврилов В.И. Статистика. 2-е изд. 2007 год. 288 стр. pdf. 5.9 Мб.
В пособии рассматриваются вопросы, посвященные применению статистических методов в статике и динамике, а также их комплексное применение в различных сочетаниях при изучении макроэкономических показателей, рассматривается методология и построение показателей социально-экономической статистики с учетом международных стандартов.
Отдельное внимание уделяется прикладным статистическим методам.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Рудакова Р.П., Букин Л.Л., Гаврилов В.И. Практикум по статистике. 2007 год. 288 стр. pdf. 4.6 Мб.
Данный практикум предназначен для студентов экономических специальностей, а также аспирантов, преподавателей и практических работников, занимающихся вопросами планирования и анализа производственно-хозяйственной деятельности предприятий.
В практикуме по каждой теме в сжатой форме приводятся методические указания о методах расчета и анализа показателей. Представлены решения типовых задач и набор задач для самостоятельной работы студентов.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Спирина, Башина редакторы. Оющая теория статистики. Стстистичкская методология при изучении коммерческой деятельности. Учебник. 1996 год. 296 стр. djvu. 5.0 Мб.
В отличие от прежних изданий в этом учебнике вопросы статистической методологии рассматриваются применительно к решению управленческих задач в коммерческой деятельности на рынке товаров и услуг. Изучение общей теории статистики во многом способствует формированию деловых качеств коммерсанта, экономиста, менеджера
Для студентов торговых вузов и экономических факультетов, коммерсантов, менеджеров, экономистов, слушателей школ бизнеса.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Л.П. Харченко и мн. др. Статистика. Курс лекций. 2000 год. 312 стр. djvu. 1.8 Mб.
1. ТЕОРИЯ СТАТИСТИКИ.
Предмет и метод статистики. Статистическое наблюдение. Сводка и группировка данных статистического наблюдения. Статистические величины. Изучение динамики общественных явлений. Индексы. Статистическое изучение взаимосвязей.
2. СТАТИСТИКА В ПРИКЛАДНЫХ ИССЛЕДОВАНИЯХ.
Статистическая оценка экономического развития страны. Статистический анализ условий социально-экономического развития общества. Статистические показатели продукции, трудовых ресурсов и эффективности производства. Статистическая оценка уровня жизни населения.

Каждое исследование в области случайных явлений своими корнями всегда уходит в эксперимент, в опытные данные. Числовые данные, которые собирают при изучении какого-либо признака некоторого объекта, называются статистическими . Статистические данные являются первоначальным материалом исследования. Для того, чтобы они представляли научную или практическую ценность, их надо обработать методами математической статистики.

Математическая статистика - это научная дисциплина, предметом изучения которой является разработка методов регистрации, описания и анализа статистических экспериментальных данных, полученных в результате наблюдений массовых случайных явлений.

Основными задачами математической статистики являются:

    определение закона распределения случайной величины или системы случайных величин;

    проверка правдоподобия гипотез;

    определение неизвестных параметров распределения.

Все методы математической статистики основаны на теории вероятностей. Однако в силу специфичности решаемых задач математическая статистика выделяется из теории вероятностей в самостоятельную область. Если в теории вероятностей считается заданной модель явления и производится расчет возможного реального течения этого явления (рис.1), то в математической статистике подбирается подходящая теоретико-вероятностная модель, исходя из статистических данных (рис.2).

Рис.1. Общая задача теории вероятностей

Рис.2. Общая задача математической статистики

Как научная дисциплина математическая статистика развивалась вместе с теорией вероятностей. Математический аппарат этой науки построен во второй половине XIX века.

2. Генеральная совокупность и выборка.

Для изучения статистических методов вводятся понятия генеральной и выборочной совокупностей. В общем случае под генеральной совокупностью понимается случайная величина X с функцией распределения
. Выборочной совокупностью или выборкой объемаn для данной случайной величины X называется набор
независимых наблюдений этой величины, гденосит название выборочного значения или реализации случайной величиныX. Таким образом, можно рассматривать как числа (если эксперимент проведен и выборка состоялась) и как случайные величины (до проведения эксперимента), поскольку они меняются от выборки к выборке.

Пример 1 . Для определения зависимости толщины ствола дерева от его высоты было отобрано 200 деревьев. В данном случае объем выборки n=200.

Пример 2. В результате распиловки древесностружечных плит на круглопильном станке было получено 15 значений удельной работы резания. В этом случае n=15.

Д
ля того чтобы по данным выборки уверенно судить об интересующем нас признаке генеральной совокупности, объекты выборки должны правильно ее представлять, то есть выборка должна бытьрепрезентативной (представительной). Репрезентативность выборки обычно достигается случайностью отбора объектов: каждому объекту генеральной совокупности обеспечивается равная со всеми остальными вероятность попадания в выборку.

Рис.3. Демонстация репрезентативности выборки

В рамках образовательной программы вуза вряд ли встретишь отдельную дисциплину с названием «математическая статистика», однако элементы математической статистики часто изучаются в совокупности с теорией вероятностей , но только после изучения основного курса теории вероятностей.

Математическая статистика: общие сведения

Математическая статистика – это раздел математики, который разрабатывает методы регистрации, описания и анализа данных каких-либо наблюдений и экспериментов, целью которых является построение вероятностных моделей массовых случайных явлений.

Математическая статистика как наука возникла в XVII в. и развивалась параллельным курсом с теорией вероятностей. Большой вклад в развитие науки внесли в XIX-XX вв. Чебышев П.Л., Гаусс К., Колмогоров А.Н. и др.

Общая задача математической статистики заключается в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

Основными разделами математической статистики являются:

  • выборочный метод (ознакомление с понятием выборки, способами сбора и обработки данных и т.д.);
  • статистическая оценка параметров выборки (оценки, доверительные интервалы и т.д.);
  • расчет сводных характеристик выборки (расчет вариант, моментов и т.д.);
  • теория корреляции (уравнения регрессии и т.д.);
  • статистическая проверка гипотез;
  • однофакторный дисперсионный анализ.

К наиболее распространенным задачам математической статистики, которые изучаются в вузе и часто встречаются на практике, относятся:

  • задачи определения оценок параметров выборки;
  • задачи на проверку статистических гипотез;
  • задачи определения вида закона распределения по статистическим данным.

Задачи определения оценок параметров выборки

Изучение математической статистики начинается с определения таких понятий как «выборка», «частота», «относительная частота», «эмпирическая функция», «полигон», «кумулята», «гистограмма» и т.д. Далее идет изучение понятий оценок (смещенная и несмещенная): выборочная средняя, дисперсия, исправленная дисперсия и т.д.

Задача

Измерение роста детей младшей группы детского сада представлено выборкой:
92, 96, 95, 96, 94, 97, 98, 94, 95, 96.
Найдем некоторые характеристики этой выборки.

Решение

Размер выборки (число измерений; N ): 10.
Наименьшее значение выборки: 92. Наибольшее значение выборки: 98.
Размах выборки: 98 – 92 = 6.
Запишем ранжированный ряд (варианты в порядке возрастания):
92, 94, 94, 95, 95, 96, 96, 96, 97, 98.
Сгруппируем ряд и запишем в таблицу (каждой варианте поставим в соответствие число ее появлений):

x i 92 94 95 96 97 98 N
n i 1 2 2 3 1 1 10

Вычислим относительные частоты и накопленные частоты, результат запишем в таблицу:

x i 92 94 95 96 97 98 Итого
n i 1 2 2 3 1 1 10
0,1 0,2 0,2 0,3 0,1 0,1 1
Накопленные частоты 1 3 5 8 1 10

Построим полигон частот выборки (отметим на графике варианты по оси ОХ, частоты по оси OY, соединим точки линией).

Выборочную среднюю и дисперсию вычислим по формулам (соответственно):


Можно находить и другие характеристики выборки, но для общего представления вполне достаточно найденных характеристик.

Задачи на проверку статистических гипотез

Задачи, относящиеся к данному типу, сложнее задач предыдущего типа и их решение зачастую более объемно и трудоемко. Прежде чем приступать к решению задач, сначала изучаются понятия статистической гипотезы, нулевой и конкурирующей гипотезы и т.д.

Рассмотрим простейшую задачу данного типа.

Задача

Даны две независимые выборки объема 11 и 14, извлеченные из нормальных совокупностей X, Y. Известны также исправленные дисперсии, равные соответственно 0,75 и 0,4. Необходимо проверить нулевую гипотезу о равенстве генеральных дисперсий при уровне значимости γ =0,05. Конкурирующую гипотезу выбрать по желанию.

Решение

Нулевая гипотеза для нашей задачи записывается следующим образом:

В качестве конкурирующей гипотезы рассмотрим следующую:

Вычислим отношение большей исправленной дисперсии к меньшей и получим наблюдаемое значение критерия:

Так как конкурирующая гипотеза, которую мы выбрали, имеет вид , то критическая область является правосторонней.
По таблице для уровня значимости 0,05 и числам степеней свободы равным 10 (11 – 1 = 10) и 13 (14 – 1 = 13) соответственно найдем критическую точку:

Так как наблюдаемое значение критерия меньше критического значения (1,875<2,67), то нет оснований отвергнуть гипотезу о равенстве генеральных дисперсий. Таким образом, исправленные дисперсии различаются между собой незначимо.

Рассмотренная задача непроста на первый взгляд, но вполне стандартна и решается по шаблону. Друг от друга такие задачи отличаются, как правило, значениями критериев и критической областью.

Более трудоемкими (так как содержат много вычислений, часть из которых сводится в таблицы) являются задачи на проверку гипотезы о типе распределения генеральной совокупности. При решении таких задач используются различные критерии, например, критерий Пирсона.

Задачи определения вида закона распределения по статистическим данным

Данный тип задач относится к разделу, изучающему элементы теории корреляции. Если рассматривать зависимости Y от Х, то тогда можно было бы вспомнить метод наименьших квадратов для определения вида зависимости. Однако в математической статистике все гораздо сложнее и в теории корреляции рассматриваются двумерные величины, значения которых, как правило, задаются в виде таблиц.

x 1 x 1 x n n y
y 1 n 11 n 21 n n1
y 1 n 12 n 22 n n2
y m n 1m n 2m n nm
n x N

Приведем формулировку одной из задач данного раздела.

Задача

Определить выборочное уравнение прямой линии регрессии Y на Х. Данные приведены в корреляционной таблице.

Y X n y
10 20 30 40
5 1 3 4
6 2 1 3
7 3 2 5
8 1 1
n x 1 5 4 3 N =13

Заключение

В заключении отметим, что уровень сложности задач по математической статистике достаточно сильно разнится при переходе от одного типа к другому. Задачи первого типа достаточно просты и не требуют особого понимания теории, можно просто выписать формулы и решить практически любую задачу. Задачи второго и третьего типа немного сложнее и для их успешного решения необходим определенный «багаж знаний» по данной дисциплине.

Приведем список всего из двух книг, но именно эти книги для автора статьи уже давно стали настольными.

  1. Гмурман В.Е. Теория вероятностей и математическая статистика: учебное пособие. – 12-е изд., перераб. – М.: ИД Юрайт, 2010. – 479 с.
  2. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. – М.: Высшая школа, 2005. – 404 с.

Решение математической статистики на заказ

Желаем удачи в освоении математической статистики. Будут проблемы — обращайтесь . Будем рады помочь!

Новое на сайте

>

Самое популярное