Какое из чисел являющееся статистической характеристикой ряда. Статистические характеристики. IV. Актуализация опорных знаний учащихся

Ключевые слова конспекта: статистические характеристики, статистические исследования, выборка, варианта, объем выборки, среднее арифметическое, вариационный ряд, размах ряда, мода выборки, медиана ряда.

Статистические исследования

Для изучения, обработки и анализа количественных данных различных массовых социально-экономических процессов и явлений проводят статистические (от латинского слова status - «состояние, положение вещей») исследования . Уже в древних государствах вели учёт населения, способного платить налоги. С развитием общества потребовались научные методы обработки и анализа самых разнообразных сведений. Так, в XIX в. появилась биологическая статистика, названная биометрикой и изучающая численные характеристики отдельных биологических особей и их популяций. Можно назвать ещё более десятка различных статистик: экономическая, финансовая, налоговая, демографическая, медицинская, метеорологическая и т. д.

Каждое статистическое исследование состоит из сбора и обработки информации . На основе полученных данных составляются различные прогнозы, оценивается их достоверность и т.д. Важной задачей, без которой статистические данные теряют всякий смысл, является обработка полученных данных.

Рассмотрим пример . Учащимся двух седьмых классов был предложен тест по математике, состоящий из 10 заданий. При проверке работ отмечали количество заданий, верно выполненных учащимися. Получили два ряда чисел:

7 «А» класс: 8; 7; 2; 5; 10; 9; 8; 7; 7; 10; 9; 6; 5; 8; 8; 10; 9; 9; 10; 7; 9; 10; 7; 9; 6;
7 «Б» класс: 8; 7; 8; 6; 9; 9; 7; 8; 7; 9; 9; 6; 5; 8; 7; 10; 9; 10; 10; 7; 8; 9; 7; 9; 9.

Ряд данных, полученных в результате статистического исследования, называют выборкой , а каждое число этого ряда - вариантой выборки. Количество чисел в ряду называют объёмом выборки . В нашем примере объёмом выборки является количество учащихся каждого класса, участвовавших в тестировании. В каждом случае объём выборки равен 25.

Имея приведённые выше два ряда данных, трудно сравнить результаты выполнения теста учащимися двух классов. А если рассматривать результаты, которые показали все семиклассники города или целого региона, то информация будет столь громоздкой, что окажется бесполезной. Потому для статистической обработки данных рассматривают различные статистические характеристики .

Среднее арифметическое. Вариационный ряд

Одной из характеристик, широко применяемых в статистических исследованиях, является среднее арифметическое .

Определение . Средним арифметическим ряда данных называется частное суммы всех вариант ряда и количества вариант.

Поскольку количество вариант - это объём выборки, то среднее арифметическое выборки есть частное суммы всех вариант и объёма выборки.

Рассмотрим пример . Найдём средний балл, который получили учащиеся 7 «А» класса при выполнении теста:

Такой подсчёт среднего арифметического выборки не очень удобен. Можно поступать иначе. Перепишем выборку для 7 «А» класса, расположив её варианты так, чтобы каждая следующая была не меньше предыдущей. Получим:
2; 5; 5; 6; 6; 7; 7; 7; 7; 7; 8; 8; 8; 8; 9; 9; 9; 9; 9; 9; 10; 10; 10; 10; 10.

Такую запись выборки называют упорядоченным рядом данных (или вариационным рядом ). Теперь легко видеть, что 2 балла получил один ученик, 5 баллов - два ученика, 6 баллов - два ученика, 7 баллов - пять учеников и т.д. Количество появлений одной и той же варианты в выборке называют частотой этой варианты. Так, например, частота варианты 7 равна 5, частота варианты 10 равна 5. Составим таблицу частот вариант для учащихся 7 «А» класса. В первой строке запишем все возможные количества баллов, которые могли получить учащиеся при выполнении теста, т.е. числа от 0 до 10. Во второй строке запишем соответствующие частоты, т.е. число учащихся, получивших указанное количество баллов.

Проверим, не ошиблись ли мы при подсчёте частот: сумма частот должна быть равна объёму выборки. Действительно, 0 + 0 + 1+ 0 + 0 + 2 + 2 + 5 + 4 + 6 + 5 = 25 (естественно, нули можно не писать). Теперь можно вычислить среднее арифметическое выборки проще:

Заметим, что среднее арифметическое упорядоченного ряда данных и среднее арифметическое выборки - одно и то же число. Составим таблицу частот выборки для 7 «Б» класса.

Заметим, что обычно в таблицу частот не включают варианты, частоты которых равны нулю. В этом случае таблица частот для 7 «Б» класса будет такой:

Найдём объём выборки: 1 + 2 + 6 + 5 + 8 + 3 = 25. Теперь найдём среднее арифметическое:

Зная средние баллы учащихся 7 «А» и 7 «Б» классов, можно сделать вывод, что учащиеся 7 «Б» в целом выполнили тест лучше, поскольку 8,04 > 7,8 .

Составленные таблицы частот позволяют сделать и другие полезные выводы по итогам проведённого тестирования. Например, для первой выборки (результаты учащихся 7 «А» класса) наименьший полученный балл равен 2, наибольший - 10. Результаты всех учащихся класса располагаются между этими числами. Для второй выборки наименьшая варианта равна 5, наибольшая - 10. Это может означать, что 7 «Б» класс по своей математической подготовке является более однородным, чем 7 «А».

Размах ряда. Мода выборки

Ещё одним показателем, который используется при анализе статистических данных, является размах ряда .

Определение. Разность наибольшей и наименьшей вариант выборки называют размахом ряда .

В рассмотренном ранее примере размах первой выборки (или упорядоченного ряда данных) равен 10 — 2 = 8, а второй 10-5 = 5. Размах выборки находят в том случае, когда существенной для исследования является величина разброса данных в ряду. К примеру, в метеорологии важна не только среднесуточная температура, но и численная характеристика колебания температуры воздуха в течение суток, т. е. размах выборки.

Заметим, что на практике при анализе данных, полученных в результате исследования, бывает удобно использовать ещё одну статистическую характеристику - так называемую моду выборки .

Определение. Варианта выборки, имеющая наибольшую частоту, называется модой выборки .

В рассмотренном примере с изучением результатов тестирования, проведённого в двух седьмых классах, модой и первого, и второго ряда является число 9, которое и в первой, и во второй выборке встречается чаще других.

Моду ряда находят тогда, когда нужно выявить типичный для данной выборки показатель. Если, например, изучаются данные о размерах мужских рубашек, проданных в магазине в определённый день, то удобно бывает воспользоваться таким показателем, как мода, который характеризует размер, пользующийся наибольшим спросом.

Если в выборке два числа встречаются с одинаковой частотой, превосходящей частоты, с которыми встречаются другие числа, то обе эти варианты являются модой для данного ряда. Так, в ряду 2; 3; 3; 3; 5; 5; 6; 6; 6; 7; 8; 8 две моды - это числа 3 и 6. Может случиться, что в выборке будет более двух мод или не будет моды совсем. Например, ряд 2; 2; 3; 3; 4; 4; 5; 5 не имеет моды.

Медиана ряда

Ещё одной характеристикой, используемой в статистике, является медиана ряда .

Рассмотрим пример . Сотрудники лаборатории приобрели акции одного предприятия. Количество акций, приобретённых сотрудниками, оказалось таким: 2; 3; 5; 6; 8; 9; 51. Нужно оценить среднее количество приобретённых акций.

Данный ряд не имеет моды. Найдём среднее арифметическое ряда:

Найденное число не отражает реальной ситуации с распределением акций между сотрудниками лаборатории, поскольку оно больше шести из семи вариант ряда. Для оценки средней величины поступим иначе. Составим из полученных данных упорядоченный ряд и найдём варианту, записанную в середине ряда.
2; 3; 5; 6 ; 8; 9; 51.
Эту варианту называют медианой . Она равна 6. Естественно, найденное значение лишь приближённо характеризует средний показатель ряда, однако эта характеристика ближе к действительности.

Если ряд имеет чётное число вариант, то в качестве медианы рассматривают среднее арифметическое двух средних элементов. Например, медианой ряда 3; 3; 4; 5; 5: 6 : 6; 7; 7; 40 является среднее арифметическое чисел 5 и 6, т.е. (5 + 6)/2 = 5,5.

Определение . Если в упорядоченном ряду данных нечётное число вариант, то средняя по счёту варианта называется медианой ряда . Если в упорядоченном ряду чётное число вариант, то среднее арифметическое двух средних по счёту вариант называется медианой ряда .

Медианой произвольной выборки является медиана соответствующего упорядоченного ряда. Заметим, что если упорядоченный ряд данных содержит 2n — 1 вариант (n - натуральное число), то медианой является n -я варианта, а если упорядоченный ряд данных содержит 2n чисел, то медианой является среднее арифметическое n -го и n + 1 -го чисел.

Рассмотрим пример . Во время соревнований по стрельбе спортсмен набрал следующее количество очков: 9; 9; 8; 10; 8; 7; 9; 10; 8; 7. Найдём: а) объём выборки; б) среднее арифметическое выборки; в) размах; г) моду ряда; д) медиану выборки.

Для решения задачи запишем упорядоченный ряд данных:
7; 7; 8; 8; 8; 9; 9; 9; 10; 10.

А) Спортсмен сделал 10 выстрелов, значит, объём выборки равен 10.

Б) Найдём среднее арифметическое выборки

В) Размах ряда равен 10 — 7 = 3.

Г) У данного ряда две моды: 8 и 9.

Д) Найдём медиану выборки. Данный ряд содержит чётное число вариант. Найдём среднее арифметическое двух чисел, записанных в середине ряда: (8 + 9)/2 = 8,5. Медианой выборки является число 8,5.

Это конспект по математике на тему «Статистические характеристики» . Выберите дальнейшие действия:

  • Перейти к следующему конспекту:

ДЕПАРТАМЕНТ ОБРАЗОВАНИЯ ГОРОДА МОСКВЫ

ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ПРОФЕССИОНАЛЬНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

КОЛЛЕДЖ СВЯЗИ № 54 имени П.М. ВОСТРУХИНА

Статистические характеристики.

Учебное пособие к занятию часть 1.

Разработчик:

Преподаватель математики

Т.Н. Рудзина


– это математические понятия , с помощью которых описываются отличительные особенности и свойства совокупности данных , полученных с помощью наблюдений или каким-то другим способом. Значение характеристик состоит еще и в том, что они «подсказывают» , с каких позиций целесообразно анализировать имеющуюся совокупность данных .

К статистическим характеристикам относятся:

среднее арифметическое , размах , мода , медиана .

Рассмотрим пример:

При изучении учебной нагрузки учащихся выделили группу из 12 семиклассников. Их попросили отметить в определенный день время (в минутах), затраченное им на выполнения домашнего задания по алгебре. Получили такие данные:

23, 18, 25 20, 25, 25, 32, 37, 34, 26 34, 25 .

Имея этот ряд данных, можно определит ь, сколько минут в среднем затратили учащиеся на выполнение домашнего задания по алгебре.

Для этого указанные числа надо сложить и сумму разделить на 12:


Число 27 , полученное в результате, называют средним арифметическим рассматриваемого ряда чисел.

Определение :

Средним арифметическим ряда чисел называется частное от деления суммы этих чисел на число слагаемых.

Обычно среднее арифметическое находят тогда, когда хотят определить среднее значение для некоторого ряда данных: среднюю урожайность пшеницы с 1 га в районе, средний суточный удой молока от одной коровы на ферме, среднюю зарплату одного рабочего бригады за смену и т.д. Заметим, что среднее арифметическое находят только для однородных величин. Не имеет смысла, например, использовать в качестве обобщающего показателя среднюю урожайность зерновых и бахчевых культур. Причем и для однородных величин вычисление среднего арифметического бывает иногда лишено смысла, например нахождение средней температуры больных в госпитале, среднего размера обуви…


В рассмотренном примере мы нашли, что в среднем учащиеся затратили на выполнение домашнего задания по алгебре по 27 мин. Однако анализ приведенного ряда данных показывает, что время, затраченное некоторыми учащимися, существенно отличается от 27 мин., т.е. от среднего арифметического. Наибольший расход равен 37 мин., а наименьший – 18 мин. Разность между наибольшим и наименьшим расходом времени составляет 19 мин. В этом случае говорят, что размах ряда равен 19.

Определение :

Размахом ряда чисел называется разность между наибольшим и наименьшим из этих чисел.

Размах находят тогда, когда хотят определить, как велик разброс данных в ряду.


При анализе сведений о времени, затраченном семиклассниками на выполнение домашнего задания по алгебре, нас могут интересовать не только среднее арифметическое и размах полученного ряда данных, но и другие показатели. Интересно, например, знать, какой расход времени является типичным для выделенной группы учащихся, т.е. какое число встречается в ряду данных чаще всего. Нетрудно заметить, что таким числом является число 25. Говорят, что число 25 – мода рассматриваемого ряда.

Определение :

Модой ряда чисел называется число, наиболее часто встречающееся в данном ряду .

Ряд чисел может иметь более одной моды или не иметь моду совсем.

Например, в ряду чисел 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 две моды – это числа 47 и 52 , так как каждое из этих чисел встречается два раза, а остальные числа встречаются в ряду менее двух раз, а в ряду чисел 69, 68, 66, 70, 67, 71, 74, 63, 73, 72 – моды нет.


Рассмотрим еще одну статистическую характеристику.

Начнем с примера. В таблице показан расход электроэнергии в январе жильцами девяти квартир

Составим из данных, приведенных в таблице, упорядоченный ряд:

64, 72, 72, 75, 78 , 82, 85, 91, 93.

В полученном упорядоченном ряду девять чисел. Не трудно заметить, что в середине ряда расположено число 78: слева от него записано четыре числа и справа тоже четыре числа. Говорят, что число 78 является срединным числом, или, иначе, медианой , рассматриваемого упорядоченного ряда чисел (от латинского слова mediana , которое означает «среднее»). Это число считают также медианой исходного ряда данных.


Приведем теперь другой пример. Пусть при сборе данных о расходе электроэнергии к указанным девяти квартирам добавили еще десятую. Получили такую таблицу:

Так же как в первом случае, представим полученные данные в виде упорядоченного ряда чисел:

64, 72, 72, 75, 78 , 82 , 85, 88, 91, 93

В этом числовом ряду четное число членов и имеются два числа, расположенные в середине ряда: 78 и 82 .

Число 80 , не являясь членом ряда, разбивает этот ряд на две одинаковые по численности группы: слева от него находятся пять членов ряда и справа тоже пять членов ряда:


64, 72, 72, 75, 78, 82, 85, 88, 91, 93

Говорят, что в этом случае медианой рассматриваемого упорядоченного ряда, а также исходного ряда данных, записанного в таблице, является число 80 .

Определение :

Медианой упорядоченного ряда чисел с нечетным числом членов называется число, записанное посередине, а медианой упорядоченного ряда чисел с нечетным числом членов называется среднее арифметическое двух чисел, записанных посередине.

Медианой произвольного ряда чисел называется медиана соответствующего упорядоченного ряда.


Если в упорядоченном числовом ряду содержится 2 n -1 членов, то медианой ряда является n -й член, так как n – 1 членов стоит до n -го члена и n – 1 членов – после n -го члена.

Если в упорядоченном ряду содержится 2 n членов, то медианой является среднее арифметическое членов, стоящих на n -м и n + 1 -м местах.

В каждом из рассмотренных выше примеров, определив медиану , мы можем указать номер квартиры, для которой расход электроэнергии жильцами превосходит срединное значение, т.е. медиану .

Рассмотрим еще один пример.

Известно, что 34 сотрудника отдела приобрели акции некоторого акционерного общества. Данные о числе акций, приобретенных сотрудниками, представлены в виде следующего упорядоченного ряда:

2, 2, 2, 2, 2, 3, 3, ……, 3, 4, 4, ……., 4, 100

Найдем медиану этого ряда. Так как всего в ряду 34 числа, то медиана равна среднему арифметическому 17– го и 18- го членов, т.е. равна (3 + 4) : 2 = 3,5

Вычисляя среднее арифметическое этого ряда, найдем, что оно приближенно равно 6,2, т.е. в среднем сотрудники отдела приобрели примерно по 6 акций. Мы видим, что в данном случае медиана лучше отражает реальную ситуацию, так как все сотрудники, кроме одного, приобрели не более 4 акций.

Такие показатели, как среднее арифметическое , мода и медиан а, по-разному характеризуют данные, полученные в результате наблюдений. Поэтому на практике при анализе данных в зависимости от конкретной ситуации используют либо все три показателя, либо некоторые из них.

Если, например, анализируются сведения о годовых доходах нескольких туристических фирм города, то удобно использовать все три показателя. Среднее арифметическое покажет средний годовой доход фирм, мода будет характеризовать типичный показатель годового дохода, медиана позволит определить туристические фирмы, годовой доход которых ниже среднего показателя.

Если изучают данные о размерах мужской обуви, проданной в определенный день в универмаге, то удобно воспользоваться таким показателем как мода , который характеризует размер, пользующийся наибольшим спросом. Находить в этом случае среднее арифметическое или медиану не имеет смысла .

При анализе результатов, показанных участниками заплыва на дистанцию 100 и, наиболее приемлемой характеристикой является медиана . Знание медианы позволит выделить для участия в соревнованиях группу спортсменов, показавших результаты выше среднего.

Статистические характеристики : среднее арифметическое , мод а, медиана называются средними результатами измерений .

Тип урока : урок изучения нового материала.

Цель урока: Создание условий для усвоения темы на уровне осмысления и первичного запоминания; для формирования математической компетенции личности учащегося

Образовательные: сформировать представление о статистике как науке; ознакомить учащихся с понятиями основных статистических характеристик; сформировать умения находить среднее арифметическое, размах, моду, медиану ряда, анализировать данные.
Развивающие: способствовать владению понятиями и их толкованием; развитию надпредметных навыков анализа, сравнения, систематизации и обобщения; способствовать формированию ключевых компетенций (познавательной, информационной, коммуникативной) на различных этапах урока, способствовать формированию у учащихся единой научной картины мира путем выявления межпредметных связей статистики и различных наук.
Воспитательные: воспитывать интерес к изучаемому предмету, информационную культуру; готовность к выполнению общепринятых норм и правил, высокой работоспособности и организованности.

Используемые технологии : Технология МДО.
Необходимое оборудование , материалы : мультимедийный проектор, компьютер, интерактивная доска.

План урока

Организационный момент. Класс разделен на 4 группы.

Включить видеоролик из фильма Служебный роман.

Файл "WMV" (.wmv)

Как вы думаете, о каком понятии мы сегодня будем говорить?

…….. верно, о статистике

Что такое статистика? (Слайд 2)

…….. вот такое определение нам выдаёт словарь (Слайд 3)

Влияет ли статистика на жизнь людей, на общество? Выскажете свои предположения по желанию.

Статистика как наука включает разные разделы: политическая, экономическая, прикладная, правовая, медицинская и др.

Нас будет интересовать математическая статистика. В чём особенность мат статистики?

…….. конечно с помощью математики (Слайд 4)

Математическая статистика обладает рядом характеристик. (на доске перевернуть слово «статистические характеристики»).

Перед вами понятия. (на доске таблички со словами:биссектриса, лунула, мюли, среднее арифметическое, медиана, мода, размах, диаметр, середина, максимум, оптимум, инварианта, константа, высота) Предположите, какие из них можно отнести к статистическим, как вы думаете?

(Предложенные слова поставить после слова статистические характеристики)

Сейчас вы обратитесь к текстам, которые помогут вам подтвердить или опровергнуть ваши предположения: являются ли выбранные понятия статистическими характеристиками и насколько велико влияние статистики на жизнь общества. Каждый ученик получил таблицу (Приложение 1), которую должен заполнить в течении урока.. Давайте вспомним правила работы в группе: спокойно, самостоятельно, по-деловому, с распределением обязанностей. Группа должна заполнить таблицу (Приложение 2)

Работа в группах. Тексты для групп. Приложение 3. (10 мин)

Защита (слайд с определением + слайд с задачей)

Обязательно заполняем листы-памятки. (У каждой группы спрашиваем, кто, что для себя отметил по данной характеристике в листке-памятке) (Приложение 1,2)

Среднее арифметическое

Наведём порядок в статистических характеристиках

(оставить только 4 характеристики)

1 группа выходят к доске и рассказывают о статистической характеристике - среднее арифметическое, решение предложенных задач, выводы. (Слайд 5,6).

2 группа выходят к доске и рассказывают о статистической характеристике- мода, решение предложенных задач, выводы. (слайд 7,8)

3 группа выходят к доске и рассказывают о статистической характеристике- размах, решение предложенных задач, выводы. (слайд 9,10)

4 группа выходят к доске и рассказывают о статистической характеристике- медиана, решение предложенных задач, выводы. (слайд 11,12)

Все группы пришли к выводу, что есть взаимосвязь между жизнью общества и статистикой, влияние велико, даже тогда, когда мы этого и не предполагаем.

Давайте обратимся к слайдам и посмотрим как в нашей обыденной жизни статистические характеристики могут себя проявлять.(Слайды с шутками 13-19, 20)

Сейчас мы вам предлагаем поработать статистами. (Раздаются 4 задачи практического содержания) (7 минут)

Итак, с какой статистической характеристикой вы работали в первой задаче, что у вас получилось

…….. мода - цвет глаз и волос (провести быстрый опрос каждой группы)

…….. размах - ширина ладони (провести быстрый опрос каждой группы)

с какой статистической характеристикой вы работали в третьей задаче, что у вас получилось

…….. медиана - размер обуви (провести быстрый опрос каждой группы)

с какой статистической характеристикой вы работали во второй задаче, что у вас получилось

…….. среднее арифметическое - рост (провести быстрый опрос каждой группы)

Судя, по результатам среднестатистический юноша в нашем классе выглядит так (Слайд 21)

А девушка так (Слайд 22)

На такой оптимистичной ноте мы завершаем наше занятие.

(Ответы к заданиям Приложение 5)

Приложение 1.

Приложение 2.

Приложение 3.

Группа 1. Статистика изучает численность отдельных групп населения страны и ее регионов, производство и потребление разнообразных видов продукции, перевозку грузов и пассажиров различными видами транспорта, природные ресурсы и т.п. Результаты статистических исследований широко используются для практических и научных выводов.

Средним арифметическим ряда чисел называется статистическая характеристика, которая позволяет найти частное от деления суммы этих чисел на число слагаемых. Обычно, среднее арифметическое находят тогда, когда хотят определить среднее значение для некоторого ряда данных: среднюю урожайность пшеницы с 1га в районе, средний суточный удой молока от одной коровы на ферме, среднюю выработку одного рабочего и т.п. Заметим, что среднее арифметическое находят только для однородных величин.

Например, при изучении учебной нагрузки учащихся выделили группу из 12 семиклассников. Их попросили отметить в определенный день время (в минутах), затраченное на выполнение домашнего задания по алгебре. Получили такие данные: 23, 18, 25, 20, 25, 25, 32, 37, 34, 26, 34, 25.

Имея этот ряд данных, можно определить, сколько минут в среднем затратили учащиеся на выполнение домашнего задания по алгебре. Для этого указанные числа надо сложить и полученную сумму разделить на количество, т.е. в данном случае 12:

Ср. арифм. ===27

Таким образом, мы нашли, что на выполнение домашнего задания по алгебре учащиеся затратили в среднем по 27 минут.

Найдите среднее арифметическое в следующих задачах:

Задача 1. Из предложенных в таблице загрязняющих атмосферу веществ, отходящих от стационарных источников в ХМАО-Югре, выберите сначала выбросы наиболее распространенных веществ, а потом определите среднее количество этих выбросов за три года, представленных в таблице в тыс.тонн.

твердые вещества

газообразные и жидкие вещества

диоксид серы

оксиды азота

оксид углерода

Задача 2. Определите среднюю температуру воздуха по городу Урай на 14 февраля 2017 года, если известно, что на сайтах: Яндекс -9 o C , Gismeteo -11 o C , rp5 -16 o C , - 11 oC, meteonovosti -15 o C , meteonova -10 o C , synoptic -11 o C .

Роль статистики в нашей жизни настолько значительна, что люди часто не задумываясь и не осознавая, постоянно используют элементы статистической методологии не только в трудовых процессах, но и в повседневном быту. Работая и отдыхая, делая покупки, знакомясь с другими детьми, принимая какие-то решения, человек пользуется определенной системой, имеющихся у него сведений, сложившихся вкусов и привычек, фактов, систематизирует, сопоставляет эти факты, анализирует их, делает вывод и принимает определенные решения, предпринимает конкретные действия. Таким образом, в каждом человеке заложены элементы статистического мышления, представляющего собой способности и к анализу и синтезу информации об окружающем мире.

Группа 2.

Значение слова «статистика

Результаты статистических исследований широко используются для практических и научных выводов.

При обработке данных статистика использует некоторые характеристики, одной из которых является мода. Мода применяется, например, при определении размера одежды, обуви, пользующейся наибольшим спросом у покупателей.

Мода ряда - значение во множестве наблюдений, которое встречается наиболее часто. Мода = типичность. В ряду 3,4,3,5,5,4,5,3,5 мода = 5. Как наиболее часто встречающееся число.

Иногда в совокупности встречается более, чем одна мода. Например: 6, 2, 6, 6, 8, 9, 9, 9, 10; мода = 6 и 9. В этом случае можно сказать, что совокупность мультимодальна. Из структурных средних величин только мода обладает таким уникальным свойством.

В ряду чисел 69,68,72,74,89,87,84 моды нет.

Мода как средняя величина употребляется чаще для данных, имеющих нечисловую природу. Среди перечисленных цветов автомобилей — белый, черный, синий металлик, белый, синий металлик, белый — мода будет равна белому цвету. При экспертной оценке с её помощью определяют наиболее популярные типы продукта, что учитывается при прогнозе продаж или планировании их производства

Решите следующие задачи:

Задача 1. В реках Ханты-Мансийского Автономного округа обитает много рыб.В реке Большой Юган обитают рыбы щука, окунь, плотва, карась, язь, налим. В реке Аган обитает рыба: щука, окунь, плотва, стерлядь, карась, язь, налим, нельма. В реке Вах обитает рыба: щука, окунь, плотва. В реке Тромъган обитает рыба: щука, окунь, плотва, карась, язь, налим. Совокупность рыб ХМАО-Югры, мультимодальна (щука, окунь и плотва встречаются во всех реках на территории округа. Определите наиболее типичную рыбу в представленных реках.

Залача 2. В таблице показан расход электроэнергии в январе жильцами 9 квартир

Определите моду данного ряда

Группа 3. Значение слова «статистика » за последние два столетия претерпело значительные изменении. Слово «статистика» имеет один корень со словом «государство» (state) и первоначально означало искусство и науку управления: первые преподаватели статистики университетов Германии 18-го века сегодня назывались бы специалистами по общественным наукам. Поскольку решения правительства до некоторой степени основываются на данных о населении, промышленности и т.д. статистики, естественно, стали интересоваться и такими данными, и постепенно слово «статистика» стало означать сбор данных о населении, о государстве, а затем вообще сбор и обработку данных. Нет смысла извлекать данные, если из этого не извлекается какая-то польза. Поэтому одна из основных задач статистики состоит в надлежащей обработке информации.

Сегодня статистика и анализ данных пронизывают практически любую современную область знаний: экономика, реклама, маркетинг, бизнес, медицина, образование и т.д. Она определяет динамику развития, спада или роста общественных явлений. Это наука, которая решает определенные задачи благодаря наличию и развитию статистических методов, в том числе благодаря развивающимся информационным технологиям.

При обработке данных статистика использует некоторые характеристики, одной из которых является медиана.

Медианой называется значение величины, расположенное в центре упорядоченного ряда.

Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц. При этом у одной половины значение признака не больше медианы, у другой - не меньше.

Медиану находят по следующему алгоритму:

Выстраивают числа по возрастанию,

Если ряд содержит нечетное количество элементов, то медиана-число, стоящее в середине;

Если ряд содержит четное количество элементов, медиана лежит между двумя средними элементами ряда и равна среднему арифметическому, вычисленному по этим двум элементам.

Пример . Найти медиану ряда 16,13,15,10,19,22,25,12,18,14,19,14,16,10.

Решение. Выстроим ряд по возрастанию: 10,10,12,13,14,14,15,16,16,18,19,19,22,25, он содержит четное число элементов n=14, следовательно медиана лежит между двумя средними элементами выборки - между 7-элементом и 8-элементом: 10,10,12,13,14,14,15,16,16,18,19,19,22,25 и равна среднему арифметическому этих элементов: Me=(15+16)/2=15,5

Приведем примеры реального использования медианы в статистике. Так при анализе результатов, показываемых участниками забега, медиана позволяет выделить группу спортсменов, показавших результат выше серединного и выставлять их в следующий этап соревнований.

Математическим свойством медианы является то, что сумма абсолютных (по модулю) отклонений от медианного значения дает минимально возможное значение. Данный факт находит свое применение, например, при решении транспортных задач, когда нужно рассчитать место строительства объекта около дороги таким образом, чтобы суммарная длина рейсов до него из разных мест была минимальной (остановки, заправки, склады и т.д. и т.п.).

Решите следующие задачи:

Задача 1. Текущие затраты на охрану окружающей среды в ХМАО составили в млн. рублей:

Найдите медиану данного ряда.

Группа 4. Статистика - наука, которая занимается получением, обработкой и анализом количественных данных разнообразных массовых явлениях, происходящих в природе и обществе.

Одной из основных задач статистики состоит в надлежащей обработке информации. Конечно у статистики есть много и других: получение и хранение информации, выработка различных прогнозов, оценка их достоверности и т.д.

Одним из статистических показателей различия или разброса данных является «Размах». Размахом ряда называется разность между наибольшим и наименьшим из этих чисел. Разберем задачу: При изучении учебной нагрузки учащихся выделили группу из 12 человек. Их попросили отметить в определенный день время (в минутах), затраченное на выполнение домашнего задания по алгебре. Получили такие данные: 23, 18, 25, 20, 25, 25, 32, 37, 34, 26, 34, 25.

Наибольший расход времени - 37 минут, а наименьший - 18 минут. Найдем размах ряда:

37-18=19 минут.

Решите следующие задачи:

Задача 1. Река Обь-это артерия Западной Сибири и несет свои воды по такой стране, как Россия. Длина водотока - 3650 км. Река Обь среди рек России вторая, уступает только Лене. Вместе со своим притоком Иртышом, Обь находится на первом месте по протяженности в России (5410 км.) и на втором - в Азии Глубина Оби - от 2-6 м в начале, у г. Бийска, доходит до 25 м у г. Новосибирска (возле ГЭС), уменьшается до 8 м возле устья Томи и вновь увеличивается до 15 м в верховьях Обской губы, куда впадает река. Найдите размах глубины реки Обь.

Задача 2. В период с 17 по 19 декабря отклонение среднесуточной температуры от нормы в ХМАО достигало 16-26 градусов. А 21 декабря администрация Белоярского района ХМАО сообщила о похолодании до - 62 ° C, в Ханты-Мансийске - 40°, в Сургуте - 43°, в Урае - 38°, в Югорске - 42°, в Кондинске - 33°. Найдите размах температуры данных населенных пунктов.

Статистика изучает численность отдельных групп населения страны и ее регионов, производство и потребление разнообразных видов продукции, перевозку грузов и пассажиров различными видами транспорта, природные ресурсы и т.п. Результаты статистических исследований широко используются для практических и научных выводов.

Роль статистики в нашей жизни настолько значительна, что люди часто не задумываясь и не осознавая, постоянно используют элементы статистической методологии не только в трудовых процессах, но и в повседневном быту. Работая и отдыхая, делая покупки, знакомясь с другими детьми, принимая какие-то решения, человек пользуется определенной системой, имеющихся у него сведений, сложившихся вкусов и привычек, фактов, систематизирует, сопоставляет эти факты, анализирует их, делает вывод и принимает определенные решения, предпринимает конкретные действия. Таким образом, в каждом человеке заложены элементы статистического мышления, представляющего собой способности и к анализу и синтезу информации об окружающем мире. Результаты статистических исследований широко используются для практических и научных выводов.

Приложение 4.

Задача 1. Опросите 10 человек из класса. Определите наиболее распространенный среди них

цвет волос и глаз. С какой статистической характеристики вы работали?

Задача 2. Опросите 10 человек из класса. Измерьте ширину их ладоней. Найдите разность

наибольшего и наименьшего значений. Какая статистическая характеристика используется

в этой задаче?

Задача 3. Опросите 9 человек из класса. Выясните их размер обуви. Выстройте числа в

порядке возрастания. Определите медиану ряда.

Задача 4. Опросите 10 человек из класса. Выясните их рост. Найдите средний рост

респондентов. С каким видом статистической характеристики вы работали?

Приложение 5.

Ответы к заданиям.

Среднее арифметическое

Щука, окунь, плотва

Отчет по лабораторным работам

по предмету «Методы и средства статистической обработки данных»

Выполнила: Галимова А.Р., гр. 4195

Проверил: Мокшин В.В.

Казань, 2013

1. Индивидуальное задание. 3

2. Планирование экспериментов. 4

2.1. Стратегическое планирование. 4

2.1.1. D - оптимальные планы.. 5

3. Основные статистические характеристики ИСД. 8

4. Оценка нормальности ИСД. 9

5. Временное прогнозирование. 13

6. Корреляционный анализ. 15

7. Кластерный анализ. 16

8. Факторный анализ. 22

9. Регрессионный анализ. 27

10. Дисперсионный анализ. 35

11. Оптимизация значений факторов и результативных показателей эффективности. 35

Выводы.. 36

Приложение. 37

Индивидуальное задание

BUF1 – на 3 места;

BUF2 − неограниченное количество мест;

GOT − экспоненциальный закон, среднее 20000 единиц времени;

VOSSТ −спец. эрл.закон, среднее в одной фазе 25 ед. вр., кол. фаз 3;

GT− равномерный закон, 225±25 единиц времени;

РК1 – экспоненциальный закон, среднее Х1=100 ед. времени;

РК2− нормальный закон, среднее Х2=90, ст. откл. 8 ед. вр.;

KAN1-KANМ– равномерный закон, 75±15 единиц времени;

Х3=М – количество каналов.

Выбор KANала для передачи по наименьшему количеству задач, по которым передана информация. Режим недоступности накладывается и снимается по KANалам независимо друг от друга.

Завершить моделирование после вывода из системы 300 задач (решённых плюс отказы).

Оптимизируемые факторы: Х1 – среднее время решения на ПК1, Х2 – среднее время решения на ПК2, Х3 – количество каналов. Х1 и Х2 менять на ±20% от указанных средних значений; Х3 от 2 до 6.

Построим модель в системе Arena

Рис.1 – Имитационная модель, построенная в системе моделирования Arena

Планирование экспериментов

Цель планирования – получить результаты с заданной достоверностью при наименьших затратах. Различают стратегическое и тактическое планирование.

Стратегическое планирование

Для стратегического планирования будем использовать концепцию «черного ящика», суть которого – абстрагирование от физической сущности процессов, происходящих в моделируемой системе и выдаче заключений о ее функционировании только на основании входных и выходных переменных. Входные, независимые переменные называются факторами. Выходные – откликами, их величина зависит от значений факторов и параметров ОИ.

Факторы в нашем случае – это показатели (параметры), которые мы будем оптимизировать; отклики – это результативные показатели эффективности функционирования моделируемой системы. Структурная схема чёрного ящика представлена на Рисунке 1.

Рис.1 Структурная схема концепции чёрного ящика

Планы второго порядка позволяют сформировать функцию отклика в виде полного квадратичного полинома, который содержит большее число членов, чем неполный квадратичный полином, сформированный по планам первого порядка, и поэтому требует большего числа выполняемых опытов. Полный квадратичный полином при m=3 имеет вид:

D - оптимальные планы

В D -оптимальных планах значения факторов не выходят за установленные границы диапазонов их изменения. Кроме того, они обладают еще одним существенным достоинством, обеспечивая минимальную ошибку во всем принятом диапазоне изменения факторов. На практике наиболее часто применяются планы Коно и планы Кифера.

Рис. 2 Геометрическая интерпретация трехфакторного плана Кифера на кубе

Стратегический план определяет количество вариантов системы, которые требуется промоделировать, и значения факторов в каждом варианте. Для 3-х оптимизируемых факторов предлагается D-оптимальный план по алгоритму Кифера, который состоит из 26 вариантов и представлен в Таблице 1.

Таблица 1 – План Кифера для 3-х факторного эксперимента

x 1 x 2 x 3 x 1 x 2 x 1 x 3 x 2 x 3 x 1 x 2 x 3 x 4 x 5 x 6
-1 -1 -1 -1 -1
-1 -1 -1
-1 -1 -1 -1
-1 -1
-1
-1 -1
-1 -1 -1 -1
-1 -1
-1 -1 -1 -1
-1 -1
-1
-1 -1
-1
-1 -1
-1 -1 -1 -1
-1 -1
-1 -1 -1 -1
-1 -1
-1 -1 -1 -1

Здесь: ; ;

Вычисляем значения X 1 , X 2 , X 3 по индивидуальному заданию. По условию индивидуального задания оптимизируемые факторы: Х1 – среднее время решения на ПК1, Х2 – среднее время решения на ПК2, Х3 – количество каналов. Х1 и Х2 менять на ±20% от указанных средних значений; Х3 от 2 до 6.

На PK1 условие экспоненциального закона, среднее 100 ед.времени, следовательно значение 0 - 100, 1-120, -1 -80 (так как меняем на ±20% от указанного среднего значения.

РК2 подчиняется по условию задания нормальному закону и среднее значение 90 ед. времени и модификатором ±20 ед.времени, следовательно 0-90, 1 – 108, -1-72. Все данные заносим Таблицу 2.

Таблица 1 - Данные для факторов X 1 , X 2 , X 3

-1
х1
х2
х3

Y 1 –Коэффициент использования ПК1 (0÷1)*100%;

Y 2 - Коэффициент использования ПК2 (0÷1)*100%;

Y 3 –Среднее общее время выполнения задач.

D-оптимальный план по алгоритму Кифера для индивидуального задания и Отклики Y 1 ,Y 2 ,Y 3 по факторам индивидуального задания, представлены в Таблице 3.

Таблица 2 - D-оптимальный план по алгоритму Кифера (для индивид.зад.)

x 1 x 2 x 3 x 1 x 2 x 1 x 3 x 2 x 3 x 1 x 2 x 3 x 4 x 5 x 6

Таблица 4 - Отклики Y 1 , Y 2 ,Y 3

Y 1 Y 2 Y 3
32,24 30,41 309,16
36,41 28,81 322,98
43,54 26,95 322,92
32,23 38,00 326,79
36,42 36,00 339,98
43,54 33,75 338,75
32,22 45,6 344,71
36,44 43,18 357,16
43,54 40,56 354,91
32,24 30,41 309,16
36,41 28,82 310,97
43,54 26,95 322,91
32,23 38,00 326,79
36,42 36,01 327,97
32,22 45,59 344,70
36,44 43,19 345,15
43,54 40,56 354,91
32,24 30,41 309,16
36,41 28,77 314,34
43,54 26,95 322,91
32,23 38,00 326,79
36,42 35,96 331,34
43,54 33,75 338,75
32,22 45,59 344,70
36,44 43,14 348,51
43,54 40,56 354,91

Основные статистические характеристики ИСД.

Основными статистическими характеристиками являются:

1. Valid N - объем выборки;

2. Mean- среднее арифметическое. Среднее значение случайной величины представляет собой наиболее типичное, наиболее вероятное ее значение, своеобразный центр, вокруг которого разбросаны все значения признака.

3. Median– медиана. Медианой является такое значение случайной величины,которое разделяет все случаи выборки на две равные почисленности части.

4. StandardDeviation- стандартное отклонение. Стандартное отклонение (или среднее квадратическое отклонение) является мерой изменчивости (вариации) признака. Оно показывает на какую величину в среднем отклоняются случаи от среднего значения признака.

5. Variance– дисперсия. Дисперсия является мерой изменчивости, вариации признака и представляет собой средний квадрат отклонений случаев от среднего значения признака. В отличии от других показателей вариации дисперсия может быть разложена на составные части, что позволяет тем самым оценить влияние различных факторов на вариацию признака.

6. Standard error of mean –стандартнаяошибкасреднего. Стандартная ошибка среднего - это величина, на которую отличается среднее значение выборки от среднего значения генеральной совокупности при условии, что распределение близко к нормальному.

7. 95% confidencelimitsofmean- 95%-ый доверительный интервал для среднего. Интервал, в который с вероятностью 0,95 попадает среднее значение признака генеральной совокупности.

8. Minimum, maximum- минимальное и максимальное значения.

9. Skewness–асимметрия. Асимметрия характеризует степень смещения вариационного ряда относительно среднего значения по величине и направлению.

10. Standard error of Skewness–стандартнаяошибкаасимметрии.

11. Kurtosis– эксцесс. Эксцесс характеризует степень концентрации случаев вокруг среднего значения и является своеобразной мерой крутости кривой.

12. Standard error of Kurtosis –стандартнаяошибкаэксцесса.

Таблица 5 - Результаты описательной статистики


Оценка нормальности ИСД.

Нормальный закон является наиболее употребительным. Он применяется для представления самых различных случайных процессов, таких, как продолжительность жизни людей, изменения экономических и технических показателей.

Выскажем гипотезу, что исходные статистические данные подчинены нормальному закону, и в качестве параметров нормального закона примем оценки математического ожидания и среднего квадратического отклонения, вычисленные по формулам.

Функция плотности нормального закона имеет вид:

; .

Если коэффициент доверия P к предположению о нормальности эмпирического распределения, который можно найти по статистическим таблицам, не меньше 0,20, то предположение о нормальности не отвергается. Если Р к <0,20, то предположение о нормальности рекомендуется отвергнуть.

Соответствие эмпирического и гипотетического распределений можно визуально проследить по графикам. При использовании критерия согласия Колмогорова предпочтительнее использовать функции распределения. Такие графики строятся и выдаются в специальных программных процедурах ППП Statistica 6.0 и Excel 2007 , на которые производится ориентация вычислений по излагаемому математическому аппарату. Представим распределение переменных на гистограммах (рис.3.-рис.8.).

На гистограммах наложена плотность нормального распределения, для проверки близости распределения к нормальному виду при помощи критерия Колмогорова-Смирнова.


Похожая информация.


Лабораторная работа №9

Статистический анализ данных

Цель работы: научиться обрабатывать статистические данные в электронных таблицах с помощью встроенных функций; изучить возможности Пакета анализа в MS Excel 2010 и его некоторые инструменты: Генерация случайных чисел, Гистограмма, Описательная статистика.

Теоретическая часть

Очень часто для обработки данных, полученных в результате обследования большого числа объектов или явлений (статистических данных ), используются методы математической статистики.

Современная математическая статистика подразделяется на две обширные области: описательную и аналитическую статистику . Описательная статистика охватывает методы описания статистических данных, представления их в форме таблиц, распределений и пр.

Аналитическая статистика называется также теорией статистических выводов. Ее предметом является обработка данных, полученных в ходе эксперимента, и формулировка выводов, имеющих прикладное значение для самых различных областей человеческой деятельности

Полученный в результате обследования набор чисел называетсястатистической совокупностью.

Выборочной совокупностью (или выборкой ) называется совокупность случайно отобранных объектов. Генеральной совокупностью называется совокупность объектов, из которой производится выборка. Объемом совокупности (генеральной или выборочной) называется число объектов этой совокупности.

Для статистической обработки результаты исследования объектов представляют в виде чисел x 1 , x 2 , …, x k . Если значение x 1 наблюдалось n 1 раз, значение x 2 наблюдалось n 2 раз, и т.д., то наблюдаемые значения x i называются вариантами , а числа их повторений n i называются частотами . Процедура подсчета частот называется группировкой данных.

Объем выборки n равен сумме всех частот n i :

Относительной частотой значения x i называется отношение частоты этого значения n i к объему выборки n :

Статистическим распределением частот (или просто распределением частот ) называется перечень вариант и соответствующих им частот, записанных в виде таблицы:



Распределением относительных частот называется перечень вариант и соответствующих им относительных частот.


Основные статистические характеристики.

Современные электронные таблицы имеют огромный набор средств для анализа статистических данных. Наиболее часто используемые статистические функции встраиваются в основное ядро программы, то есть эти функции доступны с момента запуска программы. Другие более специализированные функции входят в дополнительные подпрограммы. В частности, в Excel, такая подпрограмма называется Пакетом анализа. Команды и функции пакета анализа называют Инструментами анализа. Мы ограничимся изучением нескольких основных встроенных статистических функций и наиболее полезных инструментов анализа из пакета анализа в электронной таблице Excel.

Среднее значение.

Функция СРЗНАЧ вычисляет выборочное (или генеральное) среднее, то есть среднее арифметическое значение признака выборочной (или генеральной) совокупности. Аргументом функции СРЗНАЧ является набор чисел, как правило, задаваемый в виде интервала ячеек, например, =СРЗНАЧ (А3:А201).