Моделирование и обработка статистических данных
При использовании в научных и инженерных исследованиях метода статистического моделирования (метод Монте-Карло) необходимо генерировать случайные (точнее, псевдослучайные) числа, распределенные по определенному закону.
Функции MathCAD для вычисления плотности распределения. В табл. 10.1.1 приведены функции (имена начинаются с буквы d), позволяющие вычислить значения функции плотности наиболее используемых распределений (
значение, для которого вычисляется плотность распределения).Таблица 10.1.1
Распределение | Функция MathCAD | ||
Нормальное распределение |
| ||
Распределение Пуассона
( целое неотрицательное число, ) | |||
Равномерное распределение
, если
0, если | |||
Биноминальное распределение , |
Окончание табл. 10.1.1
Распределение | Функция MathCAD | ||
распределение
0, если ; , если( число степеней свободы) | |||
Распределение Стьюдента
( число степеней свободы) |
Функции MathCAD для вычисления квантилей распределения. Число
называется квантилем уровня распределения с плотностью , если оно является решением следующего нелинейного уравнения: .В табл. 10.1.1 в правой колонке второй строкой приведены функции MathCAD (имена начинаются с буквы
) вычисления квантилей соответствующих вычислений.Функции MathCAD генерирования случайных векторов.
Вектор, проекции которого являются случайными числами, распределенными по определенному закону, называется случайным вектором.
В табл. 10.1.1 в правой колонке третьей строкой приведены имена функций (начинаются с буквы
), вычисляющих случайный вектор с соответствующим распределением его проекций. Параметр размерность случайного вектора.Функция
генерирует одно случайное число, равномерно распределенное в интервале [0, 1].Пример 10.1.1.
На рис. 10.1.1 приведен фрагмент документа MathCAD, в котором генерируются два случайных вектора:
– проекции имеют нормальное распределение (математическое ожидание равно –20, дисперсия 100); – проекции имеют распределение (с числом степеней свободы 10). Размерность векторов равна 100. ¦Функции MathCAD вычисления выборочных значений числовых характеристик. К числовым характеристикам случайной величины относятся: математическое ожидание (или среднее), дисперсия, среднеквадратическое отклонение и т.д. Часто возникает необходимость оценить эти характеристики по выборке значений случайной величины объема . Такие оценки называют выборочными значениями числовых характеристик.
Рис. 10.1.1. Моделирование и обработка статистических данных
В табл. 10.1.2 приведены имена функций, вычисляющих выборочное значение часто используемых числовых характеристик. Здесь векторы размерности , составленные из значений случайной величины и .
Таблица 10.1.2
Числовые характеристики |
Функция MathCAD |
Математическое ожидание случайной величины |
|
Дисперсия случайной величины |
|
Среднеквадратическое отклонение случайной величины |
|
Медиана случайной величины |
|
Мода случайной величины |
|
Корреляционный момент двух случайных величин |
|
Пример 10.1.2.
На рис. 10.1.1 приведен фрагмент документа MathCAD, в котором вычисляются выборочные значения некоторых характеристик по выборкам, полученным в примере 10.1.1. ¦
функции MathCAD вычисления частот значений случайной величины (построение гистограмм). Введём некоторые определения.
Предположим, что дана выборка случайной величины Х ( – объём выборки). Введём L+1 точку , при этом:
. (10.1.1)
Тогда число значений , попавших в интервал обозначим через и назовём частотой.
Очевидно, что
. (10.1.2)
Величину
(10.1.3)
назовём относительной частотой, для которой выполняется условие
. (10.1.4)
В качестве оценки плотности распределения вероятности непрерывной случайной величины Х используют гистограмму относительных частот, т.е. систему прямоугольников, k-й из которых основанием имеет а высота определяется по формуле
(10.1.5)
и имеет место приближенное тождество
(10.1.6)
где некоторое число из интервала . Поэтому при больших объёмах выборки и удачном выборе длин интервалов гистограмма является ступенчатой аппроксимацией плотности распределения .
Возникает вопрос: как сформировать интервалы ? Количество интервалов L рекомендуется вычислять по формуле где – целая часть числа . Обычно интервалы берут равной длины , и тогда узлы определяются выражением:
(10.1.7)
где
.
Значения wk, вычисляются по частотам . Поэтому для определения по выборке в MathCAD включены две функции: hist(int,X), histogram(int,X).
Параметры функции hist(int,X):
int
– массив длины (L+1), составленный из значений Если параметр int
задать целым числом, равным числу интервалов L, то при выполнении функции формируется рабочий массив узлов по формулам (10.1.7), (10.1.8);
X – массив длиной N, составленный из значений выборки .
Результатом
работы функции является одномерный массив
Параметры функции histogram(int,X):
int – массив длины (L+1), составленный из значений Если int
задать целым числом, равным числу интервалов L, то при выполнении функции формируется рабочий массив узлов по формулам (10.1.7), (10.1.8);
Х – массив длиной N, составленный из значений выборки .
Результатом
работы функций является матрица размером, первый столбец содержит значения (середины отрезков а второй столбец – значения.
На наш взгляд, более предпочтительной является функция histogram, так как значения более удобны для дальнейшего графического отображения вычисленных величин
Пример 10.1.3. Построить гистограммы относительных частот по выборкам случайных величин определенных в примере 10.1.1. Объём выборки N = 1000.
На рис. 10.1.2 показано построение гистограммы для случайной величины а на рис. 10.1.3 – для случайной величины с использованием функции histogram при L = 11. Середины отрезков «откладываются» по оси абсцисс, а для отображения гистограммы задаётся параметр solidbar (команда Формат контекстного меню, закладка Метки). Точками на рисунках показаны значения соответствующих плотностей распределений, вычисленных при .
Рис. 10.1.2. Гистограмма выборки с нормальным распределением
Рис. 10.1.3. Гистограмма выборки с распределением