Программирование и решение задач в пакете MathCAD

       

Моделирование и обработка статистических данных


При использовании в научных и инженерных исследованиях метода статистического моделирования (метод Монте-Карло) необходимо генерировать случайные (точнее, псевдослучайные) числа, распределенные по определенному закону.

Функции MathCAD для вычисления плотности распределения. В табл. 10.1.1 приведены функции (имена начинаются с буквы d), позволяющие вычислить значения функции плотности наиболее используемых распределений (

Моделирование и обработка статистических данных
значение, для которого вычисляется плотность распределения).

Таблица 10.1.1

Распределение

Функция MathCAD

Нормальное распределение

Моделирование и обработка статистических данных

Моделирование и обработка статистических данных

Моделирование и обработка статистических данных

Моделирование и обработка статистических данных

Распределение Пуассона

Моделирование и обработка статистических данных

(

Моделирование и обработка статистических данных
целое неотрицательное число,
Моделирование и обработка статистических данных
)

Моделирование и обработка статистических данных

Моделирование и обработка статистических данных

Моделирование и обработка статистических данных

Равномерное распределение

Моделирование и обработка статистических данных
, если
Моделирование и обработка статистических данных

0, если

Моделирование и обработка статистических данных

Моделирование и обработка статистических данных

Моделирование и обработка статистических данных

Моделирование и обработка статистических данных

Биноминальное распределение

Моделирование и обработка статистических данных
,
Моделирование и обработка статистических данных

Моделирование и обработка статистических данных

Моделирование и обработка статистических данных

Моделирование и обработка статистических данных

Окончание табл. 10.1.1

Распределение

Функция MathCAD

Моделирование и обработка статистических данных
распределение

0, если

Моделирование и обработка статистических данных
;

Моделирование и обработка статистических данных
, если
Моделирование и обработка статистических данных

(

Моделирование и обработка статистических данных
число степеней свободы)

Моделирование и обработка статистических данных

Моделирование и обработка статистических данных

Моделирование и обработка статистических данных

Распределение Стьюдента

Моделирование и обработка статистических данных

(

Моделирование и обработка статистических данных
число степеней свободы)

Моделирование и обработка статистических данных

Моделирование и обработка статистических данных

Моделирование и обработка статистических данных

Функции MathCAD для вычисления квантилей распределения. Число

Моделирование и обработка статистических данных
 называется квантилем уровня
Моделирование и обработка статистических данных
 распределения с плотностью
Моделирование и обработка статистических данных
, если оно является решением следующего нелинейного уравнения:

Моделирование и обработка статистических данных
.

В табл. 10.1.1 в правой колонке второй строкой приведены функции MathCAD (имена начинаются с буквы

Моделирование и обработка статистических данных
) вычисления квантилей соответствующих вычислений.

Функции MathCAD генерирования случайных векторов.

Вектор, проекции которого являются случайными числами, распределенными по определенному закону, называется случайным вектором.

В табл. 10.1.1 в правой колонке третьей строкой приведены имена функций (начинаются с буквы

Моделирование и обработка статистических данных
), вычисляющих случайный вектор с соответствующим распределением его проекций. Параметр
Моделирование и обработка статистических данных
размерность случайного вектора.

Функция

Моделирование и обработка статистических данных
 генерирует одно случайное число, равномерно распределенное в интервале [0, 1].

Пример 10.1.1.

На рис. 10.1.1 приведен фрагмент документа MathCAD, в котором генерируются два случайных вектора:

Моделирование и обработка статистических данных
 – проекции имеют нормальное распределение (математическое ожидание равно –20, дисперсия 100);
Моделирование и обработка статистических данных
 – проекции имеют
Моделирование и обработка статистических данных
распределение (с числом степеней свободы 10). Размерность векторов равна 100. ¦


Функции MathCAD вычисления выборочных значений числовых характеристик. К числовым характеристикам случайной величины относятся: математическое ожидание (или среднее), дисперсия, среднеквадратическое отклонение и т.д. Часто возникает необходимость оценить эти характеристики по выборке значений случайной величины объема
Моделирование и обработка статистических данных
. Такие оценки называют выборочными значениями числовых характеристик.
Моделирование и обработка статистических данных

Рис. 10.1.1. Моделирование и обработка статистических данных
В табл. 10.1.2 приведены имена функций, вычисляющих выборочное значение часто используемых числовых характеристик. Здесь
Моделирование и обработка статистических данных
векторы размерности
Моделирование и обработка статистических данных
, составленные из значений случайной величины
Моделирование и обработка статистических данных
 и
Моделирование и обработка статистических данных
.
Таблица 10.1.2

Числовые характеристики
Функция MathCAD
Математическое ожидание случайной величины
Моделирование и обработка статистических данных

Моделирование и обработка статистических данных

Дисперсия случайной величины
Моделирование и обработка статистических данных

Моделирование и обработка статистических данных

Среднеквадратическое отклонение
случайной величины
Моделирование и обработка статистических данных

Моделирование и обработка статистических данных

Медиана случайной величины
Моделирование и обработка статистических данных

 
Моделирование и обработка статистических данных

Мода случайной величины
Моделирование и обработка статистических данных

Моделирование и обработка статистических данных

Корреляционный момент двух
случайных величин
Моделирование и обработка статистических данных

Моделирование и обработка статистических данных


 
Пример 10.1.2.
На рис. 10.1.1 приведен фрагмент документа MathCAD, в котором вычисляются выборочные значения некоторых характеристик по выборкам, полученным в примере 10.1.1. ¦
функции MathCAD вычисления частот значений случайной величины (построение гистограмм). Введём некоторые определения.
Предположим, что дана выборка
Моделирование и обработка статистических данных
 случайной величины Х (
Моделирование и обработка статистических данных
– объём выборки). Введём L+1 точку
Моделирование и обработка статистических данных
, при этом:
Моделирование и обработка статистических данных
.                              (10.1.1)
Тогда число значений
Моделирование и обработка статистических данных
, попавших в интервал
Моделирование и обработка статистических данных
 
Моделирование и обработка статистических данных
 обозначим через
Моделирование и обработка статистических данных
и назовём частотой.
Очевидно, что
Моделирование и обработка статистических данных
.                                                                      (10.1.2)
Величину
Моделирование и обработка статистических данных
                                                             (10.1.3)
назовём относительной частотой, для которой выполняется условие
Моделирование и обработка статистических данных
.                                                           (10.1.4)
В качестве оценки плотности распределения вероятности непрерывной случайной величины Х используют гистограмму относительных частот, т.е. систему прямоугольников, k-й из которых основанием имеет
Моделирование и обработка статистических данных
а высота
Моделирование и обработка статистических данных
определяется по формуле


Моделирование и обработка статистических данных
                                               (10.1.5)
и имеет место приближенное тождество
Моделирование и обработка статистических данных
                                                                    (10.1.6)
где
Моделирование и обработка статистических данных
 некоторое число из интервала
Моделирование и обработка статистических данных
. Поэтому при больших объёмах выборки и удачном выборе длин интервалов
Моделирование и обработка статистических данных
 гистограмма является ступенчатой аппроксимацией плотности распределения
Моделирование и обработка статистических данных
.
Возникает вопрос: как сформировать интервалы
Моделирование и обработка статистических данных
? Количество интервалов L рекомендуется вычислять по формуле
Моделирование и обработка статистических данных
 где
Моделирование и обработка статистических данных
 – целая часть числа
Моделирование и обработка статистических данных
. Обычно интервалы берут равной длины
Моделирование и обработка статистических данных
, и тогда узлы
Моделирование и обработка статистических данных
 определяются выражением:
Моделирование и обработка статистических данных
                       (10.1.7)
где
Моделирование и обработка статистических данных
.
Значения wk,
Моделирование и обработка статистических данных
 вычисляются по частотам
Моделирование и обработка статистических данных
. Поэтому для определения
Моделирование и обработка статистических данных
по выборке
Моделирование и обработка статистических данных
в MathCAD включены две функции: hist(int,X), histogram(int,X).
Параметры функции hist(int,X):
Моделирование и обработка статистических данных
 int
– массив длины (L+1), составленный из значений
Моделирование и обработка статистических данных
Если параметр int
задать целым числом, равным числу интервалов L, то при выполнении функции формируется рабочий массив узлов
Моделирование и обработка статистических данных
 по формулам (10.1.7), (10.1.8);
Моделирование и обработка статистических данных
 X – массив длиной N, составленный из значений выборки
Моделирование и обработка статистических данных
.
Результатом
работы функции является одномерный массив
Моделирование и обработка статистических данных

Параметры функции histogram(int,X):
Моделирование и обработка статистических данных
 int – массив длины (L+1), составленный из значений
Моделирование и обработка статистических данных
 Если int
задать целым числом, равным числу интервалов L, то при выполнении функции формируется рабочий массив узлов
Моделирование и обработка статистических данных
 по формулам (10.1.7), (10.1.8);
Моделирование и обработка статистических данных
 Х – массив длиной N, составленный из значений выборки
Моделирование и обработка статистических данных
.
Результатом
работы функций является матрица размером
Моделирование и обработка статистических данных
, первый столбец содержит значения
Моделирование и обработка статистических данных
(середины отрезков
Моделирование и обработка статистических данных
 а второй столбец – значения
Моделирование и обработка статистических данных
.
На наш взгляд, более предпочтительной является функция histogram, так как значения
Моделирование и обработка статистических данных
 более удобны для дальнейшего графического отображения вычисленных величин
Моделирование и обработка статистических данных

Пример 10.1.3. Построить гистограммы относительных частот по выборкам случайных величин
Моделирование и обработка статистических данных
 определенных в примере 10.1.1. Объём выборки N = 1000.
На рис. 10.1.2 показано построение гистограммы для случайной величины
Моделирование и обработка статистических данных
 а на рис. 10.1.3 – для случайной величины
Моделирование и обработка статистических данных
 с использованием функции histogram при L = 11. Середины отрезков
Моделирование и обработка статистических данных
 «откладываются» по оси абсцисс, а для отображения гистограммы задаётся параметр solidbar (команда Формат контекстного меню, закладка Метки). Точками на рисунках показаны значения соответствующих плотностей распределений, вычисленных при
Моделирование и обработка статистических данных
.
Моделирование и обработка статистических данных

 
Рис. 10.1.2. Гистограмма выборки с нормальным распределением
Моделирование и обработка статистических данных

Рис. 10.1.3. Гистограмма выборки с
Моделирование и обработка статистических данных
 распределением

Содержание раздела