Статистики по переменной V - "Душевой доход", выданные командой FREQUENCIES
Таблица 3.2. Статистики по переменной V14 - "Душевой доход", выданные командой FREQUENCIES
N |
Valid |
673 |
Missing |
48 | |
Mean |
229.11 | |
Std. Error of Mean |
5.83 | |
Median |
200 | |
Mode |
200 | |
Std. Deviation |
151.342 | |
Variance |
22904.531 | |
Skewness |
3.035 | |
Std. Error of Skewness |
0.094 | |
Kurtosis |
15.080 | |
Std. Error of Kurtosis |
0.188 | |
Range |
1479 | |
Minimum |
21 | |
Maximum |
1500 | |
Sum |
154190 | |
Percentiles |
10 |
100 |
25 |
140 | |
50 |
200 | |
75 |
280 | |
90 |
400 |
Чем больше четвертый момент, тем больше пикообразность распределения; нулевое значение KURTOSIS означает, что пикообразность распределения совпадает с пикообразностью нормального распределения. Существенность отклонений статистик от теоретических можно проверить, используя стандартные ошибки этих статистик (в основе лежит факт, что отношение статистики к ее стандартной ошибке имеет распределение, близкое к нормальному).
Перечисленные статистики играют в анализе данных особую роль - они позволяют провести первый этап статистических исследований выборки, проверить нормальность ее распределения. Ниже приведен пример описательных статистик, полученных для переменной "Среднемесячный душевой доход в семье", построенной по ответам на 14-й вопрос анкеты "Курильские острова" командой
FREQUENCIES VARIABLES=V14 /NTILES=4 /PERCENTILES= 10 90
/STATISTICS=STDDEV VARIANCE RANGE MINIMUM MAXIMUM SEMEAN MEAN MEDIAN MODE SUM SKEWNESS SESKEW KURTOSIS SEKURT .
которая вычисляет, также, n-тили и процентили.
Анализируя полученные данные (таблица 3.2), видим, что доход в семьях меняется в диапазоне от 21 рубля до 1500 рублей (разброс равен 1479). При этом средний доход составил около 230 рублей. Приближенными границами пятипроцентного доверительного интервала для истинного среднего будут значения: 229.11± 1.96*5.83, где 1.96 - критическое значение нормального распределения для p=0.05/2=0.025. Скошенность skewness=3.035 Пикообразность kurtosis=15.080 и пикообразность kurtosis=15.080 значительно больше нуля (их стандартные ошибки, 0.094 и 0.188, свидетельствуют о статистической значимости такого отличия).
Результатом задания процентилей и n-тилей являются выданные в таблице процентили (у 10% выборки доход меньше 100 руб., у 90% - меньше 400; имеются также 25%, 50%, 75% процентили).