Биогафии

Оценка мат ожидания. Математическое ожидание и его оценка. Математическое ожидание, определение, математическое ожидание дискретной и непрерывной случайных величин, выборочное, условное матожидание, расчет, свойства, задачи, оценка матожидания, дисперсия,

ТЕМА: Точечные оценки математического ожидания. Точечные оценки дисперсии. Точечная оценка вероятности события. Точечная оценка параметров равномерного распределения.

п.1. Точечные оценки математического ожидания.

Предположим, что функция распределения случайной величины ξ зависит от неизвестного параметра θ : P (ξ θ;).

Если x 1 , x 2 …., x n - выборка из генеральной совокупности случайной величиныξ, то оценкой параметра θ называется произвольная функция от выборочных значений

Значение оценки меняется от выборки к выборке и, значит, есть случайная величина. В большинстве экспериментов значение этой случайной величины близки к значению оцениваемого параметра, если для любого значения n математическое ожидание величины равно истинному значению параметра, то оценки , удовлетворяющие условию называются несмещенными . Несмещенность оценки означает, что эта оценка не несет в себе систематической ошибки.

Оценка называется состоятельной оценкой параметра θ , если для любого ξ>0 справедливо

Таким образом, с ростом объема выборки увеличивается точность результата.

Пусть x 1 , x 2 x n – выборка из генеральной совокупности, соответствующей случайной величине ξ с неизвестным математическим ожиданием и известной дисперсией Dξ=σ 2 . Построим несколько оценок неизвестного параметра. Если, то , т.е. рассматриваемая оценка является несмещенной оценкой. Но, поскольку значение вообще не зависит от объема выборки n, то оценка не является состоятельной.

Эффективной оценкой математического ожидания нормально распределенной случайной величины является оценка

Впредь для оценки неивестного математического ожидания случайной величины будем использовать выборочное среднее, т. е.

Существуют стандартные (регулярные) методы получения оценок неизвестных параметров распределения. Наиболее известные из них: метод моментов , метод максимального правдоподобия и метод наименьших квадратов.

п.2 Точечные оценки дисперсии.

Для дисперсии σ 2 случайной величины ξ можно предложить следующую оценку:

где - выборочное среднее.

Доказано, что эта оценка состоятельная, но смещенная.

В качестве состоятельной несмещенной оценки дисперсии исполь­зуют величину

Именно несмещенностью оценки s 2 объясняется ее более частое использование в качестве оценки величины D ξ.

Заметим, что Mathcad предлагает в качестве оценки дисперсии величину , а не s 2: функция var (x ) вычисляет величину

где mean (x ) -выборочное среднее .

ЗАДАНИЕ 6.5

Μξ и дисперсии D ξ случайной величины ξ по приведенным в задании выборочным значениям .

Порядок выполнения задания

    Прочитайте с диска файл, содержащий выборочные значения, или введите заданную выборку с клавиатуры.

    Вычислите точечные оценки Μξ и D ξ.

Пример выполнения задания

Найдите состоятельные несмещенные оценки математического ожи­дания Μξ и дисперсии D ξ случайной величины ξ по выборочным значениям, заданным следующей таблицей.

Для выборки, заданной таблицей такого типа (приведено выборочное значение и число, указывающее, сколько раз это значение встречается в выборке), формулы для состоятельных несмещенных оценок математического ожидания и дисперсии имеют вид:

, ,

где k - количество значений в таблице; n i - количество значений x i в выборке; n - объем выборки.

Фрагмент рабочего документа Mathcad с вычислениями точечных оценок приведен ниже.

Из приведенных вычислений видно, что смещенная оценка дает заниженное значение оценки дисперсии.

п.3. Точечная оценка вероятности события

Предположим, что в некотором эксперименте событие А (благоприят­ный исход испытания) происходит с вероятностью p и не происходит с вероятностью q = 1 - р. Задача состоит в получении оценки неизвест­ного параметра распределения p по результатам серии n случайных экспериментов. При заданном числе испытаний n количество бла­гоприятных исходов m в серии испытаний - случайная величина, имеющая распределение Бернулли. Обозначим ее буквой μ.

Если событие А в серии из n независимых испытаний произошло

m раз, то оценку величины p предлагается вычислять по формуле

Выясним свойства предлагаемой оценки. Поскольку случайная ве­личина μ имеет распределение Бернулли, то Μμ= np и M = M = р , т.е. налицо несмещенная оценка.

Для испытаний Бернулли справедлива теорема Бернулли, согласно которой, т.е. оценка p состоятельная.

Доказано, что эта оценка эффективна, так как обладает при прочих равных условиях минимальной дисперсией.

В Mathcad для моделирования выборки значений случайной ве­личины, имеющей распределение Бернулли, предназначена функция rbinom(fc,η,ρ), которая формирует вектор из к случайных чисел, κα­ ι ждое из которых равно числу успехов в серии из η независимых испы­таний с вероятностью успеха ρ в каждом.

ЗАДАНИЕ 6.6

Смоделируйте несколько выборок значений случайной величины, име­ющей распределение Бернулли с заданным значением параметра р . Вычислите для каждой выборки оценку параметра p и сравните с за­данным значением. Представьте результаты вычислений графически.

Порядок выполнения задания

1. Используя функцию rbinom(1, n , p ), опишите и сформируй­те последовательность значений случайной величины, име­ющей распределение Бернулли с заданными p и n для n = 10, 20, ..., Ν, как функцию объема выборки п.

2. Вычислите для каждого значения n точечные оценки веро­ятности р.

Пример выполнения задания

Пример получения точечных оценок выборок объема n = 10, 20,..., 200 значений случайной величины μ, имеющей распределение Бернулли с параметром p = 0.3, приведен ниже.

Указание. Поскольку значением функции является вектор , число успехов в серии n независимых испытаний с вероятностью успеха p в каждом испытании содержится в первой компоненте вектора rbinom(1,n , p ) , т.е. число успехов равно rbinom(1, n , p ). В приведенном выше фрагменте k - я компонента вектора Ρ содержит число успехов в серии 10k независимых испытаний для k = 1,2,..., 200.

п. 4. Точечная оценка параметров равномерного распределения

Обратимся еще к одному поучительному примеру. Пусть - выборка из генеральной совокупности, соответствующей случай­ной величине ξ, имеющей равномерное распределение на отрезке с неизвестным параметром θ . Наша задача - оценить этот неизвестный параметр.

Рассмотрим один из возможных способов построения требуемой оценки. Если ξ - случайная величина, имеющая равномерное распре­деление на отрезке , то Μ ξ = . Поскольку оценка величины известна, Μξ =, то за оценку параметра θ можно взять оценку

Несмещенность оценки очевидна:

Вычислив дисперсию и предел D при n →∞, убедимся в состоятельности оценки :

Для получения другой оценки параметра θ обратимся к другой статистике. Пусть = max). Найдем распределение случайной величины:

Тогда математическое ожидание и дисперсия случайной величины

с распределением равны соответственно:

;

т.е. оценка состоятельная, но смещенная. Однако если вместо = max) рассмотреть = max), то и , и, следовательно, оценка состоятельная и несмещенная.

При этом, поскольку

существенно эффективнее оценки

Например, при п= 97 разброс оценки θ^ в 33 рала меньше разброса оценки

Последний пример еще раз показывает, что выбор статистической оценки неизвестного параметра распределения - важная и нетриви­альная задача.

В Mathcad для моделирования выборки значений случайной величи­ны, имеющей равномерное распределение на отрезке [а, Ь], предназна­чена функция runif(fc,o,b), которая формирует вектор из к случайных чисел, каждое из которых - значение равномерно распределенной на отрезке [а, 6] случайной величины.

Пусть случайная выборка порождена наблюдаемой случайной величиной ξ, математическое ожидание и дисперсия которой неизвестны. В качестве оценок для этих характеристик было предложено использовать выборочное среднее

и выборочную дисперсию

. (3.14)

Рассмотрим некоторые свойства оценок математического ожидания и дисперсии.

1. Вычислим математическое ожидание выборочного среднего:

Следовательно, выборочное среднее является несмещенной оценкой для .

2. Напомним, что результаты наблюдений – независимые случайные величины, каждая из которых имеет такой же закон распределения, как и величина , а значит, , , . Будем предполагать, что дисперсия конечна. Тогда, согласно теореме Чебышева о законе больших чисел, для любого ε > 0 имеет место равенство ,

которое можно записать так: . (3.16) Сравнивая (3.16) с определением свойства состоятельности (3.11), видим, что оценка является состоятельной оценкой математического ожидания .

3. Найдем дисперсию выборочного среднего:

. (3.17)

Таким образом, дисперсия оценки математического ожидания уменьшается обратно пропорционально объему выборки.

Можно доказать, что если случайная величина ξ распределена нормально, то выборочное среднее является эффективной оценкой математического ожидания , то есть дисперсия принимает наименьшее значение по сравнению с любой другой оценкой математического ожидания. Для других законов распределения ξ это может быть и не так.

Выборочная дисперсия является смещенной оценкой дисперсии , так как . (3.18)

Действительно, используя свойства математического ожидания и формулу (3.17), найдем

.

Чтобы получить несмещенную оценку дисперсии, оценку (3.14) нужно исправить, то есть домножить на . Тогда получим несмещенную выборочную дисперсию

. (3.19)

Отметим, что формулы (3.14) и (3.19) отличаются лишь знаменателем, и при больших значениях выборочная и несмещенная дисперсии отличаются мало. Однако при малом объеме выборки следует пользоваться соотношением (3.19).

Для оценки среднего квадратического отклонения случайной величины используют так называемое “исправленное” среднее квадратическое отклонение, которое равно квадратному корню из несмещенной дисперсии: .

Интервальные оценки

В статистике имеются два подхода к оцениванию неизвестных параметров распределений: точечный и интервальный. В соответствии с точечным оцениванием, которое рассмотрено в предыдущем разделе, указывается лишь точка, около которой находится оцениваемый параметр. Желательно, однако, знать, как далеко может отстоять в действительности этот параметр от возможных реализаций оценок в разных сериях наблюдений.

Ответ на этот вопрос – тоже приближенный – дает другой способ оценивания параметров – интервальный. В соответствии с этим способом оценивания находят интервал, который с вероятностью, близкой к единице, накрывает неизвестное числовое значение параметра.

Понятие интервальной оценки

Точечная оценка является случайной величиной и для возможных реализаций выборки принимает значения лишь приближенно равные истинному значению параметра . Чем меньше разность , тем точнее оценка. Таким образом, положительное число , для которого , характеризует точность оценки и называется ошибкой оценки (или предельной ошибкой).

Доверительной вероятностью (или надежностью) называется вероятность β , с которой осуществляется неравенство , т. е.

. (3.20)

Заменив неравенство равносильным ему двойным неравенством , или , получим

Интервал , накрывающий с вероятностью β , , неизвестный параметр , называется доверительным интервалом (или интервальной оценкой), соответствующим доверительной вероятности β .

Случайной величиной является не только оценка , но и ошибка : ее значение зависит от вероятности β и, как правило, от выборки. Поэтому доверительный интервал случаен и выражение (3.21) следует читать так: “Интервал накроет параметр с вероятностью β ”, а не так: “Параметр попадет в интервал с вероятностью β ”.

Смысл доверительного интервала состоит в том, что при многократном повторении выборки объема в относительной доле случаев, равной β , доверительный интервал, соответствующий доверительной вероятности β , накрывает истинное значение оцениваемого параметра. Таким образом, доверительная вероятность β характеризует надежность доверительного оценивания: чем больше β , тем вероятнее, что реализация доверительного интервала содержит неизвестный параметр.

Основные свойства точечных оценок

Для того чтобы оценка имела практическую ценность, она должна обладать следующими свойствами.

1. Оценка параметра называется несмещенной, если ее математическое ожидание равно оцениваемому параметру, т.е.

Если равенство (22.1) не выполняется, то оценка может либо завышать значение (М>), либо занижать его (М <) . Естественно в качестве приближенного неизвестного параметра брать несмещенные оценки для того, чтобы не делать систематической ошибки в сторону завышения или занижения.

2. Оценка параметра называется состоятельной, если она подчиняется закону больших чисел, т.е. сходится по вероятности к оцениваемому параметру при неограниченном возрастании числа опытов (наблюдений) и, следовательно, выполняется следующее равенство:

где > 0 сколько угодно малое число.

Для выполнения (22.2) достаточно, чтобы дисперсия оценки стремилась к нулю при, т.е.

и кроме того, чтобы оценка была несмещенной. От формулы (22.3) легко перейти к (22.2) , если воспользоваться неравенством Чебышева.

Итак, состоятельность оценки означает, что при достаточно большом количестве опытов и со сколько угодно большой достоверностью отклонение оценки от истинного значения параметра меньше любой наперед заданной величины. Этим оправдано увеличение объема выборки.

Так как - случайная величина, значение которой изменяется от выборки к выборке, то меру ее рассеивания около математического ожидания будем характеризовать дисперсией D. Пусть и - две несмещенные оценки параметра, т.е. M = и M = , соответственно D и D и, если D < D , то в качестве оценки принимают.

3. Несмещенная оценка, которая имеет наименьшую дисперсию среди всех возможных несмещенных оценок параметра, вычисленных по выборкам одного и того же объема, называется эффективной оценкой.

На практике при оценке параметров не всегда удается удовлетворить одновременно требованиям 1, 2, 3. Однако выбору оценки всегда должно предшествовать ее критическое рассмотрение со всех точек зрения. При выборке практических методов обработки опытных данных необходимо руководствоваться сформулированными свойствами оценок.

Оценка математического ожидания и дисперсии по выборке

Наиболее важными характеристиками случайной величины являются математическое ожидание и дисперсия. Рассмотрим вопрос о том, какие выборочные характеристики лучше всего оценивают математическое ожидание и дисперсию в смысле несмещенности, эффективности и состоятельности.

Теорема 23.1. Арифметическая средняя, вычисленная по n независимым наблюдениям над случайной величиной, которая имеет математическое ожидание M = , является несмещенной оценкой этого параметра.

Доказательство.

Пусть - n независимых наблюдений над случайной величиной. По условию M = , а т.к. являются случайными величинами и имеют тот же закон распределения, то тогда. По определению средняя арифметическая

Рассмотрим математическое ожидание средней арифметической. Используя свойство математического ожидания, имеем:

т.е. . В силу (22.1) является несмещенной оценкой. ?

Теорема 23.2 . Арифметическая средняя, вычисленная по n независимым наблюдениям над случайной величиной, которая имеет M = и, является состоятельной оценкой этого параметра.

Доказательство.

Пусть - n независимых наблюдений над случайной величиной. Тогда в силу теоремы 23.1 имеем M = .

Для средней арифметической запишем неравенство Чебышева:

Используя свойства дисперсии 4,5 и (23.1), имеем:

т.к. по условию теоремы.

Следовательно,

Итак, дисперсия средней арифметической в n раз меньше дисперсии случайной величины. Тогда

а это значит, что является состоятельной оценкой.

Замечание : 1 . Примем без доказательства весьма важный для практики результат. Если N (a,), то несмещенная оценка математического ожидания a имеет минимальную дисперсию, равную, поэтому является эффективной оценкой параметра а. ?

Перейдем к оценке для дисперсии и проверим ее на состоятельность и несмещенность.

Теорема 23.3 . Если случайная выборка состоит из n независимых наблюдений над случайной величиной с

M = и D = , то выборочная дисперсия

не является несмещенной оценкой D - генеральной дисперсии.

Доказательство.

Пусть - n независимых наблюдений над случайной величиной. По условию и для всех. Преобразуем формулу (23.3) выборочной дисперсии:


Упростим выражение

Принимая во внимание (23.1), откуда

Пусть имеется случайная величина Х с математическим ожиданием m и дисперсией D , при этом оба эти параметра неизвестны. Над величиной Х произведено N независимых экспериментов, в результате которых была получена совокупность N численных результатов x 1 , x 2 , …, x N . В качестве оценки математического ожидания естественно предложить среднее арифметическое наблюдаемых значений

(1)

Здесь в качестве x i рассматриваются конкретные значения (числа), полученные в результате N экспериментов. Если взять другие (независимые от предыдущих) N экспериментов, то, очевидно, мы получим другое значение . Если взять еще N экспериментов, то мы получим еще одно новое значение . Обозначим через X i случайную величину, являющуюся результатом i -го эксперимента, тогда реализациями X i будут числа, полученные в результате этих экспериментов. Очевидно, что случайная величина X i будет иметь такую же плотность распределения вероятности, что и исходная случайная величина Х . Также считаем, что случайные величины X i и X j являются независимыми при i , не равном j (различные независимые друг относительно друга эксперименты). Поэтому формулу (1) перепишем в другом (статистическом) виде:

(2)

Покажем, что оценка является несмещенной:

Таким образом, математическое ожидание выборочного среднего равно истинному математическому ожиданию случайной величины m . Это достаточно предсказуемый и понятный факт. Следовательно, за оценку математического ожидания случайной величины можно принять выборочное среднее (2). Теперь возникает вопрос: что происходит с дисперсией оценки математического ожидания при увеличении числа экспериментов? Аналитические вычисления показывают, что

где - дисперсия оценки математического ожидания (2), а D - истинная дисперсия случайной величины X .

Из вышесказанного следует, что с ростом N (количества экспериментов) дисперсия оценки уменьшается, т.е. чем больше мы суммируем независимые реализации, тем ближе к математическому ожиданию мы получим оценку.


Оценки математического дисперсии

На первый взгляд наиболее естественной оценкой представляется

(3)

где вычисляется по формуле (2). Проверим, является ли оценка несмещенной. Формула (3) может быть записана следующим образом :

Подставим в эту формулу выражение (2):

Найдем математическое ожидание оценки дисперсии:

(4)

Так как дисперсия случайной величины не зависит от того, какое математическое ожидание у случайной величины, примем математическое ожидание равным 0, т.е. m = 0.

(5)
при . (6)

Распределение случайной величины (распределение генеральной совокупности) характеризуется обычно рядом числовых характеристик:

Такие числовые характеристики, как правило, неизвестные, называются параметрами генеральной совокупности . Оценка параметра - соответствующая числовая характеристика, рассчитанная по выборке. Оценки параметров генеральной совокупности делятся на два класса: точечные и интервальные .

Когда оценка определяется одним числом, она называется точечной оценкой . Точечная оценка, как функция от выборки, является случайной величиной и меняется от выборки к выборке при повторном эксперименте.
К точечным оценкам предъявляют требования, которым они должны удовлетворять, чтобы хоть в каком-то смысле быть «доброкачественными». Это несмещённость , эффективность и состоятельность .

Интервальные оценки определяются двумя числами – концами интервала, который накрывает оцениваемый параметр. В отличие от точечных оценок, которые не дают представления о том, как далеко от них может находиться оцениваемый параметр, интервальные оценки позволяют установить точность и надёжность оценок.

В качестве точечных оценок математического ожидания, дисперсии и среднего квадратического отклонения используют выборочные характеристики соответственно выборочное среднее, выборочная дисперсия и выборочное среднее квадратическое отклонение.

Свойство несмещенности оценки .
Желательным требованием к оценке является отсутствие систематической ошибки, т.е. при многократном использовании вместо параметра θ его оценки среднее значение ошибки приближения равно нулю - это свойство несмещенности оценки .

Определение . Оценка называется несмещенной , если ее математическое ожидание равно истинному значению оцениваемого параметра:

Выборочное среднее арифметическое является несмещенной оценкой математического ожидания, а выборочная дисперсия - смещенная оценка генеральной дисперсии D . Несмещенной оценкой генеральной дисперсии является оценка

Свойство состоятельности оценки .
Второе требование к оценке - ее состоятельность - означает улучшение оценки с увеличением объема выборки.

Определение . Оценка называется состоятельной , если она сходится по вероятности к оцениваемому параметру θ при n→∞.


Сходимость по вероятности означает, что при большом объеме выборки вероятность больших отклонений оценки от истинного значения мала.

Свойство эффективной оценки .
Третье требование позволяет выбрать лучшую оценку из нескольких оценок одного и того же параметра.

Определение . Несмещенная оценка является эффективной , если она имеет наименьшую среди всех несмещенных оценок дисперсию.

Это означает, что эффективная оценка обладает минимальным рассеиванием относительно истинного значения параметра. Заметим, что эффективная оценка существует не всегда, но из двух оценок обычно можно выбрать более эффективную, т.е. с меньшей дисперсией. Например, для неизвестного параметра a нормальной генеральной совокупности N(a,σ) в качестве несмещенной оценки можно взять и выборочное среднее арифметическое, и выборочную медиану. Но дисперсия выборочной медианы примерно в 1.6 раза больше, чем дисперсия среднего арифметического. Поэтому более эффективной оценкой является выборочное среднее арифметическое.

Пример №1 . Найдите несмещенную оценку дисперсии измерений некоторой случайной величины одним прибором (без систематических ошибок), результаты измерения которой (в мм): 13,15,17.
Решение. Таблица для расчета показателей.

x |x - x ср | (x - x ср) 2
13 2 4
15 0 0
17 2 4
45 4 8

Простая средняя арифметическая (несмещенная оценка математического ожидания)


Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего - смещенная оценка).


Несмещенная оценка дисперсии - состоятельная оценка дисперсии (исправленная дисперсия).

Пример №2 . Найдите несмещенную оценку математического ожидания измерений некоторой случайной величины одним прибором (без систематических ошибок), результаты измерения которой (в мм): 4,5,8,9,11.
Решение. m = (4+5+8+9+11)/5 = 7.4

Пример №3 . Найдите исправленную дисперсию S 2 для выборки объема n=10, если выборочная диспресия равна D = 180.
Решение. S 2 = n*D/(n-1) = 10*180/(10-1) = 200