Обяснение, приложения и примери
на Управлява sturges е критерий, използван за определяне на броя на класовете или интервалите, които са необходими за графично представяне на набор от статистически данни. Това правило е обявено през 1926 г. от германския математик Хърбърт Стюргес.
Sturges предложи един прост метод, базиран на броя на пробите x, които позволяват намирането на броя на класовете и тяхната амплитуда на обхвата. Правилото Sturges се използва широко в областта на статистиката, по-специално за изграждане на честотни хистограми.
индекс
- 1 Обяснение
- 2 Приложения
- 3 Пример
- 4 Препратки
обяснение
Правилото Sturges е емпиричен метод, широко използван в описателната статистика, за да се определи броят на класовете, които трябва да съществуват в честотната хистограма, за да се класифицира набор от данни, които представляват извадка или популация..
По принцип това правило определя ширината на графичните контейнери, честотните хистограми.
За да установи своето правило, Херберт Стургес разглежда идеалната честотна диаграма, която се състои от К интервали, където i-тият интервал съдържа определен брой проби (i = 0, ... k-1), представени като:
Този брой проби се дава от броя на начините, по които може да се извлече подмножество от набор; т.е. чрез биномиалния коефициент, изразен както следва:
За да се опрости изразът, той прилага свойствата на логаритмите в двете части на уравнението:
По този начин Sturges установява, че оптималният брой интервали k се дава от израза:
Тя може да се изрази и като:
В този израз:
- k е броят на класовете.
- N е общият брой наблюдения на извадката.
- Log е общият логаритъм на база 10.
Например, за да направите честотна хистограма, която изразява случайна извадка от височината на 142 деца, броят на интервалите или класовете, които разпределението ще има, е:
к = 1 + 3,322 * дънер10 (N)
к = 1 + 3,322* log (142)
к = 1 + 3,322* 2.1523
k = 8.14 ≈ 8
Така разпределението ще бъде в 8 интервала.
Броят на интервалите винаги трябва да бъде представен с цели числа. В случаите, когато стойността е десетична, трябва да се направи приближение до най-близкото цяло число.
приложения
Правилото на Sturges се прилага главно в статистиката, тъй като позволява да се направи разпределение на честотите чрез изчисляване на броя на класовете (k), както и дължината на всяка от тях, известна също като амплитуда..
Амплитудата е разликата между горната и долната граница на класа, разделена на броя на класовете, и се изразява:
Има много емпирични правила, които позволяват да се направи честотно разпределение. Правилото Sturges обаче обикновено се използва, тъй като е приблизително с броя на класовете, които обикновено варират от 5 до 15.
По този начин, помислете за стойност, която адекватно представя проба или население; това означава, че сближаването не представлява екстремни групировки, нито работи с прекомерен брой класове, които не позволяват обобщаване на извадката.
пример
Необходимо е да се извърши честотна хистограма според дадените данни, съответстваща на възрастта, получена при изследване на мъже, които правят упражнения в местна фитнес зала..
За да определите интервалите, трябва да знаете какъв е размерът на пробата или броя на наблюденията; в този случай имате 30.
Тогава важи правилото Sturges:
к = 1 + 3,322 * дънер10 (N)
к = 1 + 3,322* log (30)
к = 1 + 3,322* 1.4771
k = 5,90 - 6 интервала.
От броя на интервалите може да се изчисли амплитудата, която те ще имат; т.е. ширината на всеки бар, представен в честотната хистограма:
Долната граница се счита за най-ниската стойност на данните, а горната граница е най-високата стойност. Разликата между горната и долната граница се нарича обхват или път на променливата (R).
От таблицата имаме, че горната граница е 46 и долната граница 13; по този начин амплитудата на всеки клас ще бъде:
Интервалите ще се състоят от горна и долна граница. За да определите тези интервали, започнете да броите от долната граница, като добавите към нея амплитудата, определена по правило (6), както следва:
Тогава абсолютната честота се изчислява, за да се определи броят на мъжете, съответстващи на всеки интервал; в този случай това е:
- Интервал 1: 13 - 18 = 9
- Интервал 2: 19 - 24 = 9
- Интервал 3: 25 - 30 = 5
- Интервал 4: 31 - 36 = 2
- Интервал 5: 37 - 42 = 2
- Интервал 6: 43 - 48 = 3
Когато се добавя абсолютната честота на всеки клас, тя трябва да е равна на общия брой на извадката; в този случай, 30.
Впоследствие се изчислява относителната честота на всеки интервал, като абсолютната честота на този интервал се разделя на общия брой наблюдения:
- Интервал 1: fi = 9 = 30 = 0.30
- Интервал 2: fi = 9 = 30 = 0.30
- Интервал 3: fi = 5 = 30 = 0.1666
- Интервал 4: fi = 2 = 30 = 0.0666
- Интервал 5: fi = 2 = 30 = 0.0666
- Интервал 4: fi = 3 = 30 = 0.10
След това можете да направите таблица, която отразява данните, както и диаграмата от относителната честота по отношение на получените интервали, както се вижда от следните изображения:
По този начин правилото Sturges позволява да се определи броят на класовете или интервалите, в които една извадка може да бъде разделена, за да се обобщи извадка от данни чрез изготвянето на таблици и графики..
препратки
- Alfonso Urquía, М. V. (2013). Моделиране и симулиране на дискретни събития. UNED,.
- Altman Naomi, M. K. (2015). "Проста линейна регресия." Природни методи .
- Antúnez, R. J. (2014). Статистика в образованието. Цифров UNID.
- Fox, J. (1997). Приложен регресионен анализ, линейни модели и свързани методи. Публикации на SAGE.
- Humberto Llinás Solano, C.R. (2005). Дескриптивна статистика и вероятностни разпределения. Университет на Севера.
- Пантелеева, О. В. (2005). Основи на вероятностите и статистика.
- O. Kuehl, M. O. (2001). Проектиране на експерименти: статистически принципи на дизайна и анализ на изследванията. Thomson Editors.