1. Пространство элементарных исходов. Случайные события, операции над событиями. Классификация. Алгебра и сигма-алгебра.
-
Опыт (Эксперимент): Любое действие, которое может быть воспроизведено в определенных условиях и приводит к одному из нескольких возможных исходов.
-
Элементарный исход (ω): Каждый из возможных, неразделимых результатов опыта.
-
Пространство элементарных исходов (Ω): Множество всех возможных элементарных исходов опыта.
- Пример 1 (Монета): Ω = {Орёл, Решка}
- Пример 2 (Игральная кость): Ω = {1, 2, 3, 4, 5, 6}
-
Случайное событие (A, B, C, ...): Любое подмножество пространства элементарных исходов (A ⊆ Ω). Событие происходит, если в результате опыта наступает один из элементарных исходов, входящих в это событие.
- Пример (Игральная кость): Событие A = "выпало четное число". A = {2, 4, 6}.
- Достоверное событие: Событие, которое обязательно произойдет в результате опыта. Оно совпадает со всем пространством Ω.
- Пример: Выпадение числа от 1 до 6 при броске кости.
- Невозможное событие: Событие, которое никогда не может произойти. Является пустым множеством (∅).
- Пример: Выпадение числа 7 при броске стандартной кости.
- Случайное событие: Событие, которое может как произойти, так и не произойти. Это любое подмножество Ω, кроме ∅ и самого Ω.
- Сумма (Объединение) событий A + B (или A ∪ B): Событие, состоящее в том, что произошло хотя бы одно из событий A или B.
- Произведение (Пересечение) событий A · B (или A ∩ B): Событие, состоящее в том, что произошли оба события A и B одновременно.
- Разность событий A \ B: Событие, состоящее в том, что A произошло, а B — нет.
- Противоположное событие (Дополнение) Ā: Событие, состоящее в том, что событие A не произошло. Ā = Ω \ A.
- Совместные события: Два события, которые могут произойти одновременно в одном опыте. Их пересечение не пусто (A ∩ B ≠ ∅).
- Пример: A = "выпало четное", B = "выпало число > 3". Их пересечение {4, 6} не пусто.
- Несовместные события: Два события, которые не могут произойти одновременно. Их пересечение пусто (A ∩ B = ∅).
- Пример: A = "выпало четное", B = "выпало нечетное". Они не могут произойти вместе.
Для того чтобы корректно определять вероятность, нам нужно рассматривать не произвольные подмножества Ω, а определенную систему подмножеств, обладающую хорошими свойствами.
- Алгебра событий (F): Непустая система подмножеств F множества Ω, замкнутая относительно операций дополнения и конечного числа объединений (и пересечений).
Алгебра событий — это способ организовать множество событий так, чтобы с ними было удобно работать в теории вероятностей.
1. Ω ∈ F (достоверное событие всегда включается).
2. Если A ∈ F, то Ā ∈ F (замкнутость относительно дополнения).
3. Если A ∈ F и B ∈ F, то A ∪ B ∈ F (замкнутость относительно конечных объединений).
- Сигма-алгебра событий (σ-алгебра, F): Алгебра событий, которая замкнута относительно счетного числа объединений (и пересечений). Это более сильное требование, необходимое для работы с бесконечными, особенно непрерывными, пространствами исходов.
1. Ω ∈ F.
2. Если A ∈ F, то Ā ∈ F.
3. Если A₁, A₂, ... ∈ F (счетное множество событий), то их объединение ∪Aᵢ также принадлежит F.
Ключевая идея: Сигма-алгебра F — это набор "измеримых" событий, для которых мы сможем корректно определить вероятность.
Это математическая модель случайного эксперимента. Представляет собой тройку (Ω, F, P), где:
- Ω — пространство элементарных исходов.
- F — сигма-алгебра событий (набор "хороших" подмножеств Ω).
- P — вероятностная мера (вероятность), т.е. функция P: F → [0, 1], которая каждому событию A из F ставит в соответствие число P(A) и удовлетворяет аксиомам Колмогорова.
- Аксиома неотрицательности: Для любого события A ∈ F, вероятность P(A) ≥ 0.
- Аксиома нормировки: Вероятность достоверного события равна единице: P(Ω) = 1.
- Аксиома счетной аддитивности: Для любой счетной последовательности попарно несовместных событий A₁, A₂, ... (т.е. Aᵢ ∩ Aⱼ = ∅ при i ≠ j), вероятность их объединения равна сумме их вероятностей: P(∪ Aᵢ) = Σ P(Aᵢ).
- P(∅) = 0: Вероятность невозможного события равна нулю.
- P(A) ≤ 1: Вероятность любого события не превосходит 1.
- P(Ā) = 1 - P(A): Вероятность противоположного события.
- P(A ∪ B) = P(A) + P(B) - P(A ∩ B): Формула сложения вероятностей для совместных событий.
- Если A ⊆ B, то P(A) ≤ P(B).
-
Классическое определение вероятности:
- Условия: Пространство исходов Ω конечно, и все исходы равновозможны.
- Формула: P(A) = m / n, где:
- n — общее число элементарных исходов.
- m — число исходов, благоприятствующих событию A.
- Пример: Вероятность выпадения четного числа на кости. n=6 (исходы {1,2,3,4,5,6}), m=3 (исходы {2,4,6}). P(A) = 3/6 = 1/2.
-
Статистическое (частотное) определение вероятности:
- Идея: Вероятность оценивается через относительную частоту появления события в длинной серии опытов.
- Формула: P(A) ≈ W(A) = k / N, где:
- N — общее число проведенных опытов.
- k — число опытов, в которых событие A произошло.
- Закон больших чисел: При N → ∞, относительная частота W(A) сходится по вероятности к истинной вероятности P(A).
-
Геометрическое определение вероятности:
- Условия: Пространство исходов Ω — это некое геометрическое множество (отрезок, область на плоскости, тело в пространстве), имеющее конечную меру (длину, площадь, объем). Все точки этого множества равновозможны.
- Формула: P(A) = μ(A) / μ(Ω), где:
- μ(A) — мера (длина, площадь, объем) подмножества, соответствующего событию A.
- μ(Ω) — мера всего пространства исходов.
- Пример: На отрезок [0, 10] наугад бросается точка. Какова вероятность, что она попадет в интервал [2, 5]? P(A) = Длина([2, 5]) / Длина([0, 10]) = 3 / 10.
- Определение: Условная вероятность события A при условии, что событие B уже произошло (и P(B) > 0), обозначается P(A|B) и вычисляется по формуле: P(A|B) = P(A ∩ B) / P(B)
- Интуиция: Мы сужаем наше пространство исходов до Ω' = B. Вероятность P(A|B) — это доля "площади" пересечения A и B в "новой вселенной" B.
Из формулы условной вероятности напрямую следует: P(A ∩ B) = P(B) · P(A|B) = P(A) · P(B|A)
- Определение: События A и B называются независимыми, если наступление одного из них не изменяет вероятность наступления другого.
- Математический критерий: A и B независимы тогда и только тогда, когда: P(A ∩ B) = P(A) · P(B)
- Для независимых событий P(A|B) = P(A) и P(B|A) = P(B).
- Независимость в совокупности: События A₁, A₂, ..., Aₙ независимы в совокупности, если для любого подмножества индексов {i₁, ..., iₖ} выполняется P(Aᵢ₁ ∩ ... ∩ Aᵢₖ) = P(Aᵢ₁) · ... · P(Aᵢₖ). Попарная независимость не гарантирует независимость в совокупности!
- Определение: Набор событий H₁, H₂, ..., Hₙ образует полную группу, если:
- Они попарно несовместны (Hᵢ ∩ Hⱼ = ∅ при i ≠ j).
- Их объединение совпадает со всем пространством Ω (H₁ ∪ H₂ ∪ ... ∪ Hₙ = Ω).
- Идея: В результате опыта обязательно произойдет ровно одна из гипотез. Они "разбивают" всё пространство исходов на непересекающиеся части.
- Назначение: Позволяет найти вероятность некоторого события A, если известны вероятности гипотез Hᵢ и условные вероятности P(A|Hᵢ).
- Формула: Пусть H₁, H₂, ..., Hₙ — полная группа событий. Тогда для любого события A: P(A) = Σ P(Hᵢ) · P(A|Hᵢ)
- Интуиция: Мы вычисляем "полную" вероятность A, суммируя её "кусочки", взвешенные по вероятностям гипотез, через которые событие A может реализоваться.
- Назначение: Позволяет "переоценить" вероятность гипотезы Hₖ после того, как стало известно, что событие A произошло. То есть найти P(Hₖ|A).
- Формула: P(Hₖ|A) = (P(Hₖ) · P(A|Hₖ)) / P(A) Знаменатель P(A) обычно вычисляется по формуле полной вероятности: P(Hₖ|A) = (P(Hₖ) · P(A|Hₖ)) / (Σ P(Hᵢ) · P(A|Hᵢ))
- Терминология:
- P(Hₖ) — априорная (доопытная) вероятность гипотезы.
- P(Hₖ|A) — апостериорная (послеопытная) вероятность гипотезы, уточненная с учетом данных об A.
Рассматривается серия из n независимых опытов, в каждом из которых может произойти только два исхода:
- "Успех" (событие A) с вероятностью p = P(A).
- "Неудача" (событие Ā) с вероятностью q = 1 - p. Вероятность p (и q) постоянна во всех опытах.
-
Назначение: Вычисляет вероятность того, что в n опытах схемы Бернулли "успех" произойдет ровно k раз.
-
Формула: Pₙ(k) = Cₙᵏ · pᵏ · qⁿ⁻ᵏ где Cₙᵏ = n! / (k! · (n-k)!) — число сочетаний (биномиальный коэффициент).
-
Вывод формулы:
- Рассмотрим один конкретный исход, где k успехов и (n-k) неудач (например, УУ...У НН...Н). Так как опыты независимы, вероятность такого исхода равна pᵏ · qⁿ⁻ᵏ.
- Существует много таких исходов. Число способов выбрать k позиций для успехов из n возможных равно числу сочетаний Cₙᵏ.
- Все эти исходы несовместны, поэтому по аксиоме аддитивности мы складываем их вероятности. Итого: Pₙ(k) = Cₙᵏ · pᵏ · qⁿ⁻ᵏ.
Прямой расчет по формуле Бернулли при больших n становится трудоемким.
-
Формула Пуассона (закон редких событий)
- Условия применения: n → ∞, p → 0, но их произведение λ = np остается постоянной (небольшой) величиной.
- Формула: Pₙ(k) ≈ (λᵏ / k!) · e⁻ˡ
- Интуиция: Моделирует число редких событий за определенный интервал времени или пространства.
-
Локальная формула Муавра-Лапласа
- Условия применения: n → ∞, p не близко к 0 или 1 (обычно проверяют, что npq > 9).
- Назначение: Приближенно вычисляет вероятность того, что событие произойдет ровно k раз.
- Формула: Pₙ(k) ≈ (1 / √(npq)) · φ(x)
где:
- φ(x) = (1 / √(2π)) · e⁻ˣ²/² — функция плотности стандартного нормального распределения.
- x = (k - np) / √(npq) — стандартизованное значение.
- np — мат. ожидание, √(npq) — стандартное отклонение биномиального распределения.
-
Интегральная формула Муавра-Лапласа
- Условия применения: Те же, что и для локальной.
- Назначение: Приближенно вычисляет вероятность того, что число успехов k будет лежать в интервале [k₁, k₂].
- Формула: Pₙ(k₁ ≤ k ≤ k₂) ≈ Φ(x₂) - Φ(x₁)
где:
- Φ(x) = ∫₋∞ˣ φ(t) dt — функция Лапласа, интегральная функция стандартного нормального распределения.
- x₁ = (k₁ - np) / √(npq)
- x₂ = (k₂ - np) / √(npq)
- Случайная величина (СВ)— это функция, которая сопоставляет каждому исходу случайного эксперимента числовое значение. Формально, это функция ξ: Ω → ℝ.
- Дискретная СВ: Случайная величина, множество возможных значений которой конечно или счетно.
Это любое правило, устанавливающее связь между возможными значениями ДСВ и их вероятностями.
-
Ряд распределения:
- Наиболее распространенный способ задания закона распределения ДСВ. Представляет собой таблицу:
xᵢ x₁ x₂ ... xₙ pᵢ p₁ p₂ ... pₙ - Здесь xᵢ — возможные значения СВ, pᵢ = P(ξ = xᵢ) — их вероятности.
- Свойство: Сумма всех вероятностей равна 1: Σ pᵢ = 1.
- Наиболее распространенный способ задания закона распределения ДСВ. Представляет собой таблицу:
-
Функция распределения (CDF - Cumulative Distribution Function):
- Универсальный способ задания закона распределения, подходящий и для дискретных, и для непрерывных СВ.
- Определение: F(x) = P(ξ ≤ x). Для любого числа x функция F(x) показывает вероятность того, что СВ примет значение, меньшее или равное x.
- Для ДСВ: F(x) = Σ_{xᵢ ≤ x} pᵢ.
- Свойства F(x):
- 0 ≤ F(x) ≤ 1.
- F(x) — неубывающая функция.
- F(-∞) = 0, F(+∞) = 1.
- F(x) непрерывна справа.
- График F(x) для ДСВ: Ступенчатая функция, скачки происходят в точках xᵢ, и высота скачка равна pᵢ.
- Распределение Бернулли: Описывает один опыт с двумя исходами (1 - успех, 0 - неудача). P(ξ=1) = p, P(ξ=0) = q.
- Биномиальное распределение B(n, p): Описывает число успехов в n испытаниях Бернулли. P(ξ=k) = Cₙᵏ pᵏ qⁿ⁻ᵏ.
- Распределение Пуассона Π(λ): Описывает число редких событий. P(ξ=k) = (λᵏ / k!) e⁻ˡ.
- Геометрическое распределение: Описывает число опытов до первого успеха. P(ξ=k) = qᵏ⁻¹ p.
- Непрерывная СВ: Случайная величина, возможные значения которой сплошь заполняют некоторый интервал (конечный или бесконечный).
- Ключевая особенность: Вероятность того, что НСВ примет одно конкретное значение, равна нулю: P(ξ = c) = 0. Поэтому для НСВ бессмысленно строить ряд распределения.
-
Функция распределения (CDF):
- Определение: То же, что и для ДСВ: F(x) = P(ξ ≤ x).
- Свойства: Те же, что и для ДСВ, но для абсолютно непрерывных СВ функция F(x) является непрерывной.
- Вероятность попадания в интервал: P(a < ξ < b) = F(b) - F(a).
-
Плотность распределения (PDF - Probability Density Function):
- Определение: f(x) = F'(x). Плотность — это производная от функции распределения.
- Интуиция: f(x) характеризует "плотность" вероятности в окрестности точки x. Чем выше f(x), тем вероятнее СВ примет значение вблизи x.
- Свойства f(x):
- f(x) ≥ 0 для всех x.
- Условие нормировки: ∫₋∞⁺∞ f(x) dx = 1 (полная площадь под кривой плотности равна 1).
- Связь с F(x): F(x) = ∫₋∞ˣ f(t) dt.
- Вероятность попадания в интервал: P(a < ξ < b) = ∫ₐᵇ f(x) dx (площадь под кривой плотности на интервале).
- Равномерное распределение U[a, b]: СВ принимает значения на отрезке [a, b], и все значения одинаково вероятны.
- f(x) = 1/(b-a) при x ∈ [a, b], и 0 в остальных случаях.
- Показательное (экспоненциальное) распределение Exp(λ): Описывает время до наступления некоторого события (например, время безотказной работы прибора).
- f(x) = λe⁻ˡˣ при x ≥ 0, и 0 при x < 0.
- Нормальное (Гауссово) распределение N(μ, σ²): Самое важное распределение в теории вероятностей. Описывает многие природные и социальные явления.
- f(x) = (1 / (σ√(2π))) · e⁻⁽ˣ⁻ᵐ⁾²/⁽²ˢ²⁾
- μ — математическое ожидание (центр симметрии).
- σ — среднеквадратическое отклонение (определяет "ширину" колокола).
Числовые характеристики — это одиночные числа, которые описывают ключевые свойства распределения случайной величины (положение, разброс, форму).
-
Определение: Среднее взвешенное значение случайной величины. Центр распределения, "центр масс".
-
Формулы:
- Для ДСВ: M[ξ] = Σ xᵢ pᵢ (сумма произведений значений на их вероятности).
- Для НСВ: M[ξ] = ∫₋∞⁺∞ x · f(x) dx. (Пределы интегрирования обычно те области, где f(x) не равна нулю)
-
Свойства:
- M[C] = C (мат. ожидание константы равно самой константе).
- M[Cξ] = C · M[ξ] (константу можно выносить).
- M[ξ + η] = M[ξ] + M[η] (мат. ожидание суммы равно сумме мат. ожиданий, независимость не требуется!).
-
Доказательства
-
Свойства и доказательства для непрерывных случайных величин:
-
Свойство: M[C] = C
Доказательство: M[C] = ∫_{-∞}^{∞} C * f(x) dx = C ∫_{-∞}^{∞} f(x) dx = C * 1 = C
-
Свойство: M[Cξ] = C * M[ξ]
Доказательство: M[Cξ] = ∫_{-∞}^{∞} C * ξ * f(ξ) dξ = C ∫_{-∞}^{∞} ξ * f(ξ) dξ = C * M[ξ]
-
Свойство: M[ξ + η] = M[ξ] + M[η]
Доказательство: M[ξ + η] = ∫_{-∞}^{∞} ∫_{-∞}^{∞} (ξ + η) * f(ξ, η) dξ dη = ∫_{-∞}^{∞} ∫_{-∞}^{∞} ξ * f(ξ, η) dξ dη + ∫_{-∞}^{∞} ∫_{-∞}^{∞} η * f(ξ, η) dξ dη = ∫_{-∞}^{∞} ξ * f(ξ) dξ + ∫_{-∞}^{∞} η * f(η) dη = M[ξ] + M[η]
-
-
Свойства и доказательства для дискретных случайных величин:
-
Свойство: M[C] = C
Доказательство: M[C] = Σ_i C * P(X = x_i) = C Σ_i P(X = x_i) = C * 1 = C
-
Свойство: M[Cξ] = C * M[ξ]
Доказательство: M[Cξ] = Σ_i C * x_i * P(ξ = x_i) = C Σ_i x_i * P(ξ = x_i) = C * M[ξ]
-
Свойство: M[ξ + η] = M[ξ] + M[η]
Доказательство: M[ξ + η] = Σ_i Σ_j (x_i + y_j) * P(ξ = x_i, η = y_j) = Σ_i Σ_j x_i * P(ξ = x_i, η = y_j) + Σ_i Σ_j y_j * P(ξ = x_i, η = y_j) = Σ_i x_i * P(ξ = x_i) + Σ_j y_j * P(η = y_j) = M[ξ] + M[η]
-
- Определение: Математическое ожидание квадрата отклонения случайной величины от её математического ожидания. Характеризует разброс или изменчивость значений СВ вокруг её среднего.
- Основная формула: D[ξ] = M[(ξ - M[ξ])²].
- Расчетная формула (более удобная): D[ξ] = M[ξ²] - (M[ξ])²
- (Мат. ожидание квадрата минус квадрат мат. ожидания).
- Для вычисления M[ξ²] используются формулы:
- Для ДСВ: M[ξ²] = Σ xᵢ² pᵢ
- Для НСВ: M[ξ²] = ∫₋∞⁺∞ x² · f(x) dx
- Свойства:
- D[C] = 0 (у константы нет разброса).
- D[Cξ] = C² · D[ξ] (константа выносится в квадрате!).
- D[ξ + C] = D[ξ] (сдвиг на константу не меняет разброс).
- Для независимых СВ ξ и η: D[ξ + η] = D[ξ] + D[η].
- Определение: Корень квадратный из дисперсии. σ[ξ] = √D[ξ].
- Преимущество: Имеет ту же размерность, что и сама случайная величина, что делает его более интуитивно понятным для оценки разброса.
-
Мода (Mo): Наиболее вероятное значение случайной величины.
- Для ДСВ: Значение xᵢ с наибольшей вероятностью pᵢ.
- Для НСВ: Значение x, в котором плотность распределения f(x) достигает максимума.
- Распределение может иметь несколько мод (мультимодальное) или не иметь их вовсе.
-
Медиана (Me): Значение, которое делит распределение пополам.
- Определение: Такое число
me, что P(ξ ≤ me) = 0.5 и P(ξ ≥ me) = 0.5. - Находится из уравнения F(me) = 0.5, где F(x) — функция распределения.
- Определение: Такое число
-
Квантиль порядка p (xₚ): Обобщение медианы.
- Определение: Значение xₚ, для которого F(xₚ) = p, где p ∈ (0, 1).
- Медиана — это квантиль порядка 0.5. Квартили — квантили порядка 0.25, 0.5, 0.75.
Пусть ξ — случайная величина с известным законом распределения, и η = φ(ξ) — новая случайная величина, являющаяся функцией от ξ. Задача — найти закон распределения и характеристики η.
-
Если ξ — ДСВ:
- Алгоритм:
- Найти все возможные значения yⱼ = φ(xᵢ) для новой СВ η.
- Если разным xᵢ соответствуют одинаковые yⱼ, то вероятности этих xᵢ нужно сложить.
- Составить новый ряд распределения для η.
- Пример: ξ имеет ряд:
x={-1, 0, 1},p={0.2, 0.5, 0.3}. Найти распределение η = ξ².- y₁ = (-1)² = 1, y₂ = 0² = 0, y₃ = 1² = 1.
- Возможные значения для η: {0, 1}.
- P(η=0) = P(ξ=0) = 0.5.
- P(η=1) = P(ξ=-1) + P(ξ=1) = 0.2 + 0.3 = 0.5.
- Итоговый ряд для η:
y={0, 1},p={0.5, 0.5}.
- Алгоритм:
-
Если ξ — НСВ:
- Общий метод (через функцию распределения):
- Находим функцию распределения η: G(y) = P(η < y) = P(φ(ξ) < y).
- Выражаем неравенство φ(ξ) < y через ξ. Например, если η = ξ³, то ξ < ³√y.
- Вычисляем вероятность этого неравенства через известную функцию распределения F(x) величины ξ.
- Находим плотность распределения g(y) для η, дифференцируя G(y): g(y) = G'(y).
- Частный случай (для монотонной функции φ): Если φ(x) строго монотонна, то существует обратная функция x = ψ(y). Тогда плотность g(y) можно найти по формуле: g(y) = f(ψ(y)) · |ψ'(y)|
- Общий метод (через функцию распределения):
Для нахождения числовых характеристик η не обязательно находить ее закон распределения!
- Математическое ожидание (правило "бессознательного статистика"):
- Для ДСВ: M[η] = M[φ(ξ)] = Σ φ(xᵢ) · pᵢ.
- Для НСВ: M[η] = M[φ(ξ)] = ∫₋∞⁺∞ φ(x) · f(x) dx.
- Дисперсия: Используем расчетную формулу D[η] = M[η²] - (M[η])².
- M[η] находится по формулам выше.
- M[η²] = M[(φ(ξ))²] находится аналогично:
- Для ДСВ: M[η²] = Σ (φ(xᵢ))² · pᵢ.
- Для НСВ: M[η²] = ∫₋∞⁺∞ (φ(x))² · f(x) dx.
Эти распределения являются фундаментальными в математической статистике и получаются как функции от независимых нормально распределенных случайных величин.
Пусть ξ₁, ξ₂, ..., ξₙ — независимые случайные величины, имеющие стандартное нормальное распределение N(0, 1).
-
Распределение χ² (хи-квадрат) Пирсона:
- Определение: Сумма квадратов n независимых стандартных нормальных СВ. χ²ₙ = Σᵢ (ξᵢ)²
- Параметр:
n— число степеней свободы. Оно определяет форму распределения. - Свойства:
- Принимает только неотрицательные значения.
- Асимметрично, с "хвостом" вправо.
- Сумма двух независимых χ²-величин с n₁ и n₂ степенями свободы есть χ²-величина с (n₁+n₂) степенями свободы.
- Применение: Проверка гипотез о согласии (goodness-of-fit tests), анализ таблиц сопряженности, построение доверительных интервалов для дисперсии.
-
Распределение Стьюдента (t-распределение):
- Определение: Отношение стандартной нормальной СВ к корню из независимой от неё χ²-величины, деленной на число её степеней свободы. tₙ = ξ₀ / √(χ²ₙ / n)
- Параметр:
n— число степеней свободы (от χ²). - Свойства:
- Симметричное, колоколообразное, похожее на нормальное, но с более "тяжелыми" хвостами (больше вероятность экстремальных значений).
- При n → ∞, распределение Стьюдента стремится к стандартному нормальному N(0, 1).
- Применение: Построение доверительных интервалов и проверка гипотез о математическом ожидании при неизвестной дисперсии и малом объеме выборки.
-
Распределение Фишера (F-распределение):
- Определение: Отношение двух независимых χ²-величин, каждая из которых поделена на свое число степеней свободы. F(k₁, k₂) = (χ²ₖ₁ / k₁) / (χ²ₖ₂ / k₂)
- Параметры:
k₁иk₂— числа степеней свободы числителя и знаменателя. - Свойства:
- Принимает только неотрицательные значения.
- Асимметрично.
- Применение: Проверка гипотезы о равенстве дисперсий двух нормальных совокупностей, дисперсионный анализ (ANOVA).
- Система двух СВ (случайный вектор): Рассматриваем пару (ξ, η), значениями которой являются пары чисел (xᵢ, yⱼ).
- Таблица распределения (матрица): Наиболее наглядный способ.
y₁ y₂ ... yₘ x₁ p₁₁ p₁₂ ... p₁ₘ x₂ p₂₁ p₂₂ ... p₂ₘ ... ... ... ... ... xₙ pₙ₁ pₙ₂ ... pₙₘ - pᵢⱼ = P(ξ = xᵢ, η = yⱼ) — вероятность того, что ξ примет значение xᵢ и одновременно η примет значение yⱼ.
- Свойство нормировки: Сумма всех вероятностей в таблице равна 1: Σᵢ Σⱼ pᵢⱼ = 1.
Это законы распределения каждой из величин (ξ и η) в отдельности.
- Как найти: Чтобы найти распределение ξ, нужно просуммировать вероятности по столбцам для каждого значения xᵢ. Чтобы найти распределение η, нужно суммировать по строкам для каждого yⱼ.
- Формулы:
- P(ξ = xᵢ) = pᵢ. = Σⱼ pᵢⱼ (сумма по j-тому столбцу для i-той строки)
- P(η = yⱼ) = p.ⱼ = Σᵢ pᵢⱼ (сумма по i-той строке для j-того столбца)
- Определение: F(x, y) = P(ξ ≤ x, η ≤ y).
- Вычисление: F(x, y) = Σ_{xᵢ ≤ x} Σ_{yⱼ ≤ y} pᵢⱼ. (Суммируем вероятности для всех пар (xᵢ, yⱼ), где оба компонента меньше или равны (x, y)).
-
Совместная функция распределения (Joint CDF):
- Определение: F(x, y) = P(ξ ≤ x, η ≤ y).
- Свойства: Аналогичны одномерному случаю (неубывающая по каждому аргументу, пределы 0 и 1, и т.д.).
-
Совместная плотность распределения (Joint PDF):
- Определение: f(x, y) = ∂²F(x, y) / (∂x ∂y).
- Свойства:
- f(x, y) ≥ 0.
- Нормировка: ∫₋∞⁺∞ ∫₋∞⁺∞ f(x, y) dx dy = 1 (объем под поверхностью плотности равен 1).
- Вероятность попадания в область D: P((ξ, η) ∈ D) = ∬_D f(x, y) dx dy.
- Как найти: Чтобы найти плотность одной переменной, нужно "проинтегрировать" (исключить) другую переменную.
- Формулы:
- Плотность ξ: f_ξ(x) = ∫₋∞⁺∞ f(x, y) dy.
- Плотность η: f_η(y) = ∫₋∞⁺∞ f(x, y) dx.
- Идея: Закон распределения одной СВ при условии, что другая СВ приняла конкретное значение.
- Для ДСВ: Условная вероятность P(η = yⱼ | ξ = xᵢ) = pᵢⱼ / P(ξ = xᵢ) = pᵢⱼ / pᵢ.
- Для каждого фиксированного xᵢ мы получаем новый закон распределения для η.
- Для НСВ: Условная плотность распределения f(y|x) = f(x, y) / f_ξ(x).
- Эта функция, рассматриваемая как функция от
y(при фиксированномx), является полноценной плотностью распределения (интеграл поyравен 1).
- Эта функция, рассматриваемая как функция от
- Определение: Математическое ожидание, вычисленное по условному закону распределения.
- M(η | ξ = x) — это функция от
x. Она показывает, как в среднем изменяется η в зависимости от значения ξ. - Формулы:
- Для ДСВ: M(η | ξ = xᵢ) = Σⱼ yⱼ · P(η = yⱼ | ξ = xᵢ).
- Для НСВ: M(η | ξ = x) = ∫₋∞⁺∞ y · f(y|x) dy.
- Регрессия — это статистический метод, который используется для понимания и моделирования связи между одной зависимой переменной (которую мы хотим предсказать) и одной или несколькими независимыми переменными (предсказателями). Основная цель регрессии — найти уравнение, которое лучше всего описывает эту связь, чтобы мы могли использовать его для предсказания значений зависимой переменной на основе значений независимых переменных.
Кривые регрессии используются, когда связь между зависимой и независимой переменными не является линейной. В таких случаях линейная регрессия не подходит, и необходимо использовать более сложные модели для описания данных.
- Определение: График условного математического ожидания.
- Регрессия η на ξ: y = M(η | ξ = x). Показывает среднее значение η для заданного x.
- Регрессия ξ на η: x = M(ξ | η = y). Показывает среднее значение ξ для заданного y.
- Смысл: Кривая регрессии является наилучшим прогнозом одной переменной на основе другой в смысле минимизации среднеквадратичной ошибки.
Ковариация — это статистическая мера, которая показывает, как две случайные величины изменяются вместе. Она указывает на степень и направление линейной зависимости между двумя переменными.
- Определение: Математическое ожидание произведения отклонений случайных величин от их математических ожиданий. Cov(ξ, η) = M[(ξ - M[ξ])(η - M[η])].
- Расчетная формула: Cov(ξ, η) = M[ξη] - M[ξ]M[η].
- M[ξη] = Σᵢ Σⱼ xᵢyⱼ pᵢⱼ (для ДСВ) или ∫∫ xy f(x,y) dxdy (для НСВ).
- Свойства:
- Cov(ξ, η) = Cov(η, ξ).
- Cov(ξ, ξ) = D[ξ].
- Если ξ и η независимы, то Cov(ξ, η) = 0.
- Внимание! Обратное неверно: из Cov(ξ, η) = 0 не следует независимость. Это означает лишь отсутствие линейной зависимости.
Коэффициент корреляции — это статистическая мера, которая показывает степень и направление линейной зависимости между двумя переменными. В отличие от ковариации, коэффициент корреляции нормирован и принимает значения в диапазоне от -1 до 1, что делает его более удобным для интерпретации.
- Проблема ковариации: Зависит от единиц измерения СВ.
- Определение: Нормированная ковариация. ρ(ξ, η) = Cov(ξ, η) / (σ[ξ] · σ[η])
- Свойства:
- Безразмерная величина.
- -1 ≤ ρ ≤ 1.
- |ρ| = 1 <=> существует точная линейная зависимость η = aξ + b.
- ρ = 0 <=> величины некоррелированы (нет линейной связи).
- Знак ρ показывает направление связи: ρ > 0 (положительная связь - "чем больше ξ, тем в среднем больше η"), ρ < 0 (отрицательная).
- |ρ| показывает силу линейной связи.
- Задача: Кривые регрессии M(η|x) могут быть сложными. Часто их аппроксимируют прямой линией ŷ = a x + b, которая является "наилучшей" в некотором смысле.
- Критерий: Минимизация средней квадратичной ошибки прогноза. S(a, b) = M[(η - ŷ)²] = M[(η - (ax + b))²] → min
-
Целевая функция: S(a, b) = M[η² - 2η(ax + b) + (ax + b)²] Раскрываем скобки и используем линейность мат. ожидания: S(a, b) = M[η²] - 2aM[ξη] - 2bM[η] + a²M[ξ²] + 2abM[ξ] + b²
-
Находим минимум: Необходимое условие экстремума — равенство нулю частных производных по
aиb.- ∂S/∂b = -2M[η] + 2aM[ξ] + 2b = 0 => b = M[η] - aM[ξ] (Уравнение 1)
- ∂S/∂a = -2M[ξη] + 2aM[ξ²] + 2bM[ξ] = 0 => aM[ξ²] + bM[ξ] = M[ξη] (Уравнение 2)
-
Решаем систему: Подставляем
bиз (1) в (2): aM[ξ²] + (M[η] - aM[ξ])M[ξ] = M[ξη] aM[ξ²] + M[η]M[ξ] - a(M[ξ])² = M[ξη] a(M[ξ²] - (M[ξ])²) = M[ξη] - M[ξ]M[η] -
Получаем коэффициенты:
- В скобках слева стоит D[ξ], справа — Cov(ξ, η). a = Cov(ξ, η) / D[ξ]
- Подставляем
aв формулу дляb: b = M[η] - (Cov(ξ, η) / D[ξ]) · M[ξ]
-
Итоговое уравнение прямой регрессии η на ξ: ŷ = ax + b => ŷ = (Cov/Dξ)x + Mη - (Cov/Dξ)Mξ ŷ - M[η] = (Cov(ξ, η) / D[ξ]) · (x - M[ξ])
Используя, что a = ρ·(σ_η/σ_ξ), получаем канонический вид: ŷ - M[η] = ρ · (σ_η / σ_ξ) · (x - M[ξ])
Аналогично выводится прямая регрессии ξ на η: x̂ - M[ξ] = ρ · (σ_ξ / σ_η) · (y - M[η])
-
Задача: Найти закон распределения Z, зная законы распределения ξ и η. Решается просто только для независимых СВ.
-
Формула свертки (композиции):
- Для ДСВ: P(Z = z) = Σᵢ P(ξ = xᵢ) · P(η = z - xᵢ).
- Для НСВ: f_Z(z) = ∫₋∞⁺∞ f_ξ(x) · f_η(z - x) dx. (Интеграл свертки).
-
Важнейшее свойство нормального распределения: Сумма независимых нормальных СВ также распределена нормально. Если ξ ~ N(μ₁, σ₁²) и η ~ N(μ₂, σ₂²), то Z = ξ + η ~ N(μ₁ + μ₂, σ₁² + σ₂²).
- M[ξ₁ + ξ₂ + ... + ξₙ] = M[ξ₁] + M[ξ₂] + ... + M[ξₙ]
- Это свойство выполняется всегда, независимо от того, зависимы СВ или нет.
- Для двух СВ (общий случай): D[ξ + η] = D[ξ] + D[η] + 2Cov(ξ, η)
- Для n СВ (общий случай): D[Σξᵢ] = ΣD[ξᵢ] + 2Σ_{i<j} Cov(ξᵢ, ξⱼ)
- Для НЕЗАВИСИМЫХ СВ: Cov(ξᵢ, ξⱼ) = 0 для i≠j. Формула упрощается: D[ξ₁ + ξ₂ + ... + ξₙ] = D[ξ₁] + D[ξ₂] + ... + D[ξₙ] (Дисперсия суммы независимых СВ равна сумме их дисперсий). Это одно из самых фундаментальных свойств в теории вероятностей.
-
Случайный процесс (СП) X(t): Это семейство случайных величин, зависящих от некоторого параметра
t, который чаще всего интерпретируется как время. Обозначается X(t, ω), гдеω— элементарный исход из Ω.- При фиксированном
t = t₀, X(t₀) — это случайная величина. Её называют сечением или ордиантой процесса. - При фиксированном исходе
ω = ω₀, x(t) = X(t, ω₀) — это неслучайная функция времени, называемая реализацией или траекторией процесса.
- При фиксированном
-
Классификация СП:
- По типу времени
t:- С дискретным временем:
tпринимает дискретные значения (t = 0, 1, 2, ...). Называются случайными последовательностями. - С непрерывным временем:
tможет принимать любые значения из некоторого интервала.
- С дискретным временем:
- По типу значений (состояний) X(t):
- С дискретными состояниями: Множество значений X(t) конечно или счетно.
- С непрерывными состояниями: Множество значений X(t) — континуум.
- По типу времени
Поскольку СП — это бесконечномерный объект, его полное описание (аналог закона распределения для СВ) очень сложно. На практике используют его конечномерные распределения и числовые характеристики.
-
Одномерное распределение: Закон распределения сечения X(t) в заданный момент времени
t. Описывается функцией распределенияF₁(x, t) = P(X(t) < x)или плотностьюf₁(x, t). -
Двумерное распределение: Совместный закон распределения сечений X(t₁) и X(t₂) в два момента времени
t₁иt₂. Описывается функциейF₂(x₁, x₂; t₁, t₂) = P(X(t₁) < x₁, X(t₂) < x₂). -
Математическое ожидание (средняя функция):
m_x(t) = M[X(t)]. Это неслучайная функция, описывающая среднее значение процесса в каждый момент времени. -
Дисперсия:
D_x(t) = D[X(t)] = M[(X(t) - m_x(t))²]. Характеризует разброс реализаций процесса вокруг среднего в моментt. -
Корреляционная функция (автокорреляция):
- Определение:
K_x(t₁, t₂) = M[(X(t₁) - m_x(t₁))(X(t₂) - m_x(t₂))]. - Смысл: Характеризует степень статистической связи между значениями процесса в два разных момента времени
t₁иt₂. Это ключевая характеристика, описывающая "память" или внутреннюю структуру процесса.
- Определение:
Это процессы, вероятностные характеристики которых инвариантны относительно сдвига по времени.
- Стационарность в узком смысле: Все конечномерные функции распределения не меняются при сдвиге всех временных аргументов на одну и ту же величину
τ. - Стационарность в широком смысле (чаще используется):
- Мат. ожидание — константа:
m_x(t) = m = const. - Корреляционная функция зависит только от разности времен:
K_x(t₁, t₂) = K_x(t₂ - t₁) = K_x(τ), гдеτ = t₂ - t₁.
- Мат. ожидание — константа:
-
Сходимость по вероятности: Последовательность СВ
{ξₙ}сходится по вероятности к СВξ, если для любогоε > 0:lim_{n→∞} P(|ξₙ - ξ| > ε) = 0. Интуиция: С ростомnстановится всё менее вероятно, чтоξₙбудет отличаться отξна какую-либо, даже самую малую, величинуε. -
Неравенство Маркова: Для любой неотрицательной СВ
ξс конечным мат. ожиданием и для любогоa > 0:P(ξ ≥ a) ≤ M[ξ] / aСмысл: Дает верхнюю оценку вероятности "большого" значения СВ, зная только ее среднее.- Доказательство
Рассмотрим индикаторную функцию I, которая равна 1, если ξ≥a, и 0 в противном случае. Поскольку ξ неотрицательна, мы можем записать следующее неравенство: ξ≥aI Возьмем мат ожидание от обеих частей M[ξ]≥M[a⋅I] M[ξ]≥aM[I] M[I]=P(ξ≥a) M[ξ]=aP(ξ≥a) P(ξ≥a)≤M[ξ]/a -
Неравенство Чебышёва: Для любой СВ
ξс конечными M[ξ] и D[ξ], для любогоε > 0:P(|ξ - M[ξ]| ≥ ε) ≤ D[ξ] / ε²Смысл: Вероятность того, что СВ отклонится от своего среднего больше чем наε, ограничена сверху и тем меньше, чем меньше дисперсия. Это фундаментальная связь между разбросом (дисперсией) и вероятностью отклонения. -
Теорема Чебышёва (Закон больших чисел): Пусть
ξ₁, ξ₂, ..., ξₙ— попарно некоррелированные СВ, дисперсии которых равномерно ограничены (D[ξᵢ] ≤ C). Тогда их среднее арифметическое сходится по вероятности к среднему их мат. ожиданий:(1/n) Σξᵢ → (1/n) ΣM[ξᵢ]по вероятности. Частный случай (i.i.d.): Если СВ независимы и одинаково распределены с M[ξᵢ]=μ, то выборочное среднееX̄ = (1/n)Σξᵢсходится по вероятности к истинному среднемуμ. -
Теорема Бернулли: Пусть
k— число успехов вnиспытаниях Бернулли с вероятностью успехаp. Тогда относительная частота успеховk/nсходится по вероятности кp.k/n → pпо вероятности. Смысл: Это теоретическое обоснование статистического определения вероятности. С увеличением числа опытов частота события приближается к его вероятности.
- Сходимость по распределению: Последовательность СВ
{ξₙ}сходится по распределению к СВξ, если их функции распределения сходятся:lim_{n→∞} F_n(x) = F(x)во всех точкахx, где F(x) непрерывна. Интуиция: Форма распределенияξₙстановится всё больше похожей на форму распределенияξ. Это более слабая форма сходимости.
Это группа теорем, утверждающих, что сумма большого числа слабо зависимых случайных величин имеет распределение, близкое к нормальному.
-
Ключевая идея: Неважно, какое исходное распределение было у слагаемых (при некоторых мягких ограничениях), их сумма (или среднее) будет стремиться к нормальному распределению. Это объясняет, почему нормальное распределение так часто встречается в природе и статистике.
-
Формулировка (Ляпунова, для i.i.d. случая): Пусть
ξ₁, ξ₂, ..., ξₙ— независимые, одинаково распределенные СВ с конечными M[ξᵢ]=μ и D[ξᵢ]=σ². Рассмотрим их суммуSₙ = Σξᵢ. Тогда стандартизованная суммаZₙ = (Sₙ - M[Sₙ]) / √D[Sₙ] = (Sₙ - nμ) / (σ√n)сходится по распределению к стандартному нормальному распределению N(0, 1).F_{Z_n}(x) → Φ(x)(где Φ(x) - функция распределения N(0,1)). -
Теорема Муавра-Лапласа: Исторически первая ЦПТ, является частным случаем для суммы СВ, имеющих распределение Бернулли. Она теоретически обосновывает интегральную и локальную формулы Муавра-Лапласа для аппроксимации биномиального распределения.
-
Математическая статистика: Раздел математики, посвященный методам сбора, систематизации, обработки и интерпретации статистических данных для научных и практических выводов.
-
Статистическая совокупность: Множество однородных по каким-либо признакам объектов или явлений, подлежащих изучению.
- Генеральная совокупность: Все объекты изучаемой группы.
- Выборочная совокупность (выборка): Часть объектов, отобранных из генеральной совокупности для изучения.
-
Статистическая закономерность: Закономерность, проявляющаяся не в каждом отдельном явлении, а в их массе, в среднем, при большом числе наблюдений. (Например, закон больших чисел).
-
Этапы статистического исследования:
- Сбор данных (статистическое наблюдение): Сбор первичной информации об объекте исследования (например, путем опроса, эксперимента, из отчетности).
- Сводка и группировка данных: Систематизация и упорядочивание собранных данных, их классификация по существенным признакам. Результат — статистические таблицы и ряды.
- Статистический анализ: Вычисление обобщающих показателей (средние, дисперсия), оценка параметров, проверка гипотез, выявление зависимостей.
- Интерпретация результатов и выводы: Формулировка выводов, имеющих практическое или научное значение.
- Выборочный метод: Основной метод статистического исследования, при котором выводы о всей генеральной совокупности делаются на основе изучения ее части — выборки.
- Репрезентативность выборки: Главное требование. Выборка должна правильно отражать структуру и свойства генеральной совокупности. Достигается случайностью отбора.
- Повторный отбор: Каждый отобранный объект перед выбором следующего возвращается в генеральную совокупность.
- Бесповторный отбор: Отобранный объект не возвращается.
- Простой случайный отбор: Каждый элемент имеет равные шансы попасть в выборку (как лотерея).
- Механический (систематический) отбор: Элементы отбираются через равный интервал из упорядоченного списка.
- Типический (стратифицированный) отбор: Генеральная совокупность разбивается на однородные группы (страты), и из каждой страты производится случайный отбор.
- Серийный (гнездовой) отбор: Отбираются не отдельные элементы, а целые группы (серии), которые затем подвергаются сплошному обследованию.
- Ошибка репрезентативности: Расхождение между характеристиками выборки и генеральной совокупности.
- Средняя ошибка выборки (μ): Среднеквадратическое отклонение выборочной характеристики (например, среднего) от ее генерального значения. Показывает, насколько в среднем выборочные средние отклоняются от генерального среднего.
- Для выборочного среднего
X̄:μ_X̄ = σ/√n(повторный отбор),μ_X̄ = σ/√n · √(1 - n/N)(бесповторный), гдеσ- ген. СКО,n- объем выборки,N- объем ген. совокупности.
- Для выборочного среднего
- Предельная ошибка выборки (Δ): Максимально возможная ошибка для заданной доверительной вероятности
γ.- Δ = t · μ, где
t— квантиль распределения (Стьюдента или нормального), зависящий отγ. - Доверительный интервал: Генеральное среднее
μс вероятностьюγлежит в интервале(X̄ - Δ, X̄ + Δ).
- Δ = t · μ, где
-
Сводка: Научно организованная обработка материалов наблюдения, включающая систематизацию, группировку и подсчет итогов.
-
Группировка: Разделение совокупности на группы по существенным для них признакам.
- Типологическая: Выделение качественно разнородных типов (напр., предприятия по форме собственности).
- Структурная: Характеризует состав однородной совокупности (напр., население по возрасту).
- Аналитическая: Выявляет взаимосвязи между признаками (напр., группировка рабочих по стажу и производительности труда).
-
Статистический ряд: Упорядоченное распределение единиц совокупности по какому-либо признаку.
- Атрибутивный ряд: Построен по качественному признаку (пол, профессия).
- Вариационный ряд: Построен по количественному признаку (рост, зарплата).
-
Виды вариационных рядов:
- Дискретный: Значения признака (варианты
xᵢ) — целые числа. Состоит из вариант и их частотnᵢ(или частостейwᵢ = nᵢ/n). - Интервальный: Значения признака сгруппированы в интервалы. Состоит из интервалов и частот попадания в них.
- Дискретный: Значения признака (варианты
-
Построение интервального вариационного ряда:
- Определить размах вариации
R = x_max - x_min. - Выбрать число интервалов
k(часто по формуле Стерджессаk ≈ 1 + 3.322 lg(n)). - Определить ширину интервала
h = R / k. - Определить границы интервалов.
- Подсчитать частоты
nᵢ— число наблюдений, попавших в каждый интервал. - Графическое представление: гистограмма (столбчатая диаграмма, где высота столбца пропорциональна частоте/плотности), полигон (ломаная, соединяющая середины интервалов), кумулята (график накопленных частот, эмпирическая функция распределения).
- Определить размах вариации
- Оценка параметра: Статистика (т.е. функция от выборки), используемая для приближенного определения неизвестного параметра
θгенеральной совокупности. Обозначаетсяθ̂. - Точечная оценка: Оценка, которая определяется одним числом.
- Примеры: Выборочное среднее
X̄как оценка ген. среднегоμ. Выборочная дисперсияs²как оценка ген. дисперсииσ².
- Примеры: Выборочное среднее
Хорошая оценка должна обладать рядом желательных свойств.
-
Несмещенность: Оценка
θ̂называется несмещенной, если её математическое ожидание равно истинному значению параметра:M[θ̂] = θ.- Смещение (bias):
b(θ) = M[θ̂] - θ. У несмещенной оценки смещение равно нулю. - Примеры:
X̄ = (1/n)ΣXᵢ— несмещенная оценка M[X] = μ.- Выборочная дисперсия
s²_ biased = (1/n)Σ(Xᵢ - X̄)²— смещенная оценкаσ².M[s²_biased] = ((n-1)/n)σ². - Исправленная выборочная дисперсия
s² = (1/(n-1))Σ(Xᵢ - X̄)²— несмещенная оценкаσ².
- Смещение (bias):
-
Состоятельность: Оценка
θ̂называется состоятельной, если при увеличении объема выборкиn → ∞она сходится по вероятности к оцениваемому параметруθ.lim_{n→∞} P(|θ̂ₙ - θ| < ε) = 1для любогоε > 0.- Интуиция: С большой выборкой мы получаем сколь угодно точную оценку.
- Достаточное условие: Если оценка несмещенная и ее дисперсия
D[θ̂ₙ] → 0приn → ∞, то она состоятельна. - Примеры:
X̄иs²являются состоятельными оценкамиμиσ².
-
Эффективность: Несмещенная оценка
θ̂называется эффективной, если она имеет наименьшую возможную дисперсию среди всех несмещенных оценок данного параметраθ.- Интуиция: Эффективная оценка дает наименьший разброс, т.е. является самой "точной".
- Относительная эффективность: Для двух несмещенных оценок
θ̂₁иθ̂₂, их относительная эффективность — этоEff(θ̂₁, θ̂₂) = D[θ̂₂] / D[θ̂₁].
- Назначение: Дает нижнюю границу для дисперсии любой несмещенной оценки. Помогает определить, является ли оценка эффективной.
- Информация Фишера: Величина, показывающая, сколько информации о параметре
θсодержится в одном наблюдении.I(θ) = M[(∂ln(f(X, θ)) / ∂θ)²] = -M[∂²ln(f(X, θ)) / ∂θ²], гдеf(X, θ)— плотность распределения. - Неравенство: Для любой несмещенной оценки
θ̂параметраθна основе выборки объемаnвыполняется:D[θ̂] ≥ 1 / (n · I(θ)) - Вывод: Если дисперсия некоторой несмещенной оценки
θ̂совпадает с этой нижней границей (D[θ̂] = 1 / (nI(θ))), то эта оценка является эффективной.
- Проблема точечной оценки: Она почти никогда не совпадает с истинным значением параметра.
- Интервальная оценка: Указывает интервал, который с заданной высокой вероятностью накрывает истинное значение параметра.
- Доверительный интервал: Случайный интервал
(θ̂₁, θ̂₂)(границы зависят от выборки), который с заданной доверительной вероятностью γ (или уровнем надежности, обычно 0.9, 0.95, 0.99) содержит неизвестный параметрθ.P(θ̂₁ < θ < θ̂₂) = γ. - Уровень значимости:
α = 1 - γ. Вероятность того, что интервал не накроет параметр.
-
Для мат. ожидания μ при известной дисперсии σ²:
- Используется статистика
Z = (X̄ - μ) / (σ/√n) ~ N(0, 1). - Интервал:
X̄ ± z_(1-α/2) · (σ/√n)гдеz_(1-α/2)— квантиль стандартного нормального распределения (например, для γ=0.95, α=0.05,z_0.975≈ 1.96).
- Используется статистика
-
Для мат. ожидания μ при неизвестной дисперсии σ²:
- Используется статистика
T = (X̄ - μ) / (s/√n) ~ t(n-1)(распределение Стьюдента сn-1степенями свободы), гдеs— исправленное СКО. - Интервал:
X̄ ± t_(1-α/2, n-1) · (s/√n)гдеt_(1-α/2, n-1)— квантиль распределения Стьюдента.
- Используется статистика
-
Для дисперсии σ² (и СКО σ) при известном μ:
- Используется статистика
χ² = Σ(Xᵢ - μ)² / σ² ~ χ²(n). - Интервал для σ²:
(Σ(Xᵢ - μ)² / χ²_(1-α/2, n), Σ(Xᵢ - μ)² / χ²_(α/2, n))гдеχ²— квантили распределения хи-квадрат сnстепенями свободы.
- Используется статистика
-
Для дисперсии σ² (и СКО σ) при неизвестном μ:
- Используется статистика
χ² = (n-1)s² / σ² ~ χ²(n-1). - Интервал для σ²:
((n-1)s² / χ²_(1-α/2, n-1), (n-1)s² / χ²_(α/2, n-1))
- Используется статистика
- Статистическая гипотеза: Предположение о параметрах или виде распределения генеральной совокупности, которое можно проверить на основе выборки.
- Нулевая гипотеза (H₀): Основная, проверяемая гипотеза. Обычно это гипотеза об отсутствии различий, эффекта, связи (
μ₁ = μ₂,p = 0.5,ρ = 0). Мы исходим из того, что она верна, пока не доказано обратное. - Альтернативная гипотеза (H₁ или Hₐ): Гипотеза, которая принимается, если H₀ отвергается. Конкурирует с нулевой.
- Двусторонняя:
H₁: θ ≠ θ₀ - Правосторонняя:
H₁: θ > θ₀ - Левосторонняя:
H₁: θ < θ₀
- Двусторонняя:
- Выбор статистического критерия (статистики): Функция от выборки
T(X₁,...,Xₙ), распределение которой известно (по крайней мере, при условии верности H₀). - Задание уровня значимости α: Вероятность совершить ошибку I рода (обычно 0.05, 0.01, 0.1).
- Определение критической области (W): Множество значений критерия, при попадании в которое нулевая гипотеза отвергается. Границы этой области (критические точки) определяются уровнем значимости
αи видомH₁.- Область принятия гипотезы: Дополнение к W.
- Расчет наблюдаемого значения критерия (T_набл) по данным выборки.
- Принятие решения:
- Если
T_набл∈ W (попадает в критическую область), то H₀ отвергается в пользу H₁. Результат статистически значим. - Если
T_набл∉ W (не попадает в критическую область), то нет оснований отвергать H₀. Это не значит, что H₀ доказана, а лишь то, что данные не противоречат ей.
- Если
| Решение / Истина | H₀ верна | H₀ неверна |
|---|---|---|
| Принять H₀ | Верное решение | Ошибка II рода (β) |
| Отклонить H₀ | Ошибка I рода (α) | Верное решение (Мощность 1-β) |
- Ошибка I рода (α): Отвергнуть верную H₀. Вероятность
α— это уровень значимости. - Ошибка II рода (β): Принять неверную H₀.
- Мощность критерия (1-β): Вероятность отвергнуть неверную H₀. Чем выше мощность, тем лучше критерий.
- Задача: Проверить гипотезу H₀ о том, что выборка извлечена из генеральной совокупности с определенным законом распределения (например, нормальным, Пуассона).
- Критерий согласия: Статистический критерий для проверки такой гипотезы. Он измеряет "расхождение" между эмпирическим (наблюдаемым) распределением и теоретическим (предполагаемым).
- Применение: Для проверки простых и сложных гипотез о виде распределения. Особенно удобен для дискретных распределений или сгруппированных данных.
- Алгоритм:
- Разбить весь диапазон значений на
kинтервалов (или взятьkдискретных значений). - Подсчитать эмпирические частоты
nᵢ— число наблюдений, попавших в i-й интервал. - Вычислить теоретические вероятности
pᵢпопадания в i-й интервал, исходя из гипотезы H₀. Если параметры распределения (μ, σ²) неизвестны, их оценивают по выборке. - Вычислить теоретические частоты
Eᵢ = n · pᵢ. - Рассчитать наблюдаемое значение критерия:
χ²_набл = Σ_{i=1 to k} (nᵢ - Eᵢ)² / Eᵢ - Определить критическое значение
χ²_крит(α, df)по таблице распределения хи-квадрат, гдеα— уровень значимости,df— число степеней свободы.df = k - 1 - m, гдеm— число параметров, оцененных по выборке. - Решение: Если
χ²_набл > χ²_крит, то H₀ отвергается.
- Разбить весь диапазон значений на
- Применение: Для проверки простых гипотез (когда вид и все параметры распределения полностью заданы). Не требует группировки данных.
- Алгоритм:
- Построить эмпирическую функцию распределения
F*(x)(ступенчатая функция, показывающая долю наблюдений ≤ x). - Построить теоретическую функцию распределения
F(x)согласно гипотезе H₀. - Найти максимальное абсолютное расхождение между ними:
D_n = sup_x |F*(x) - F(x)| - Рассчитать статистику
λ = D_n · √n. - Сравнить
λс критическим значениемλ_крит(α)из таблиц распределения Колмогорова. - Решение: Если
λ > λ_крит, то H₀ отвергается.
- Построить эмпирическую функцию распределения
-
Задача: Определить, можно ли считать две (или более) выборки извлеченными из одной и той же генеральной совокупности или из совокупностей с одинаковыми параметрами.
-
Формулировки гипотез (для двух выборок):
- О равенстве средних:
H₀: μ₁ = μ₂. - О равенстве дисперсий:
H₀: σ₁² = σ₂². - О совпадении законов распределения в целом.
- О равенстве средних:
-
Критерии проверки:
- Для средних:
- t-критерий Стьюдента для независимых выборок (если дисперсии равны).
- Критерий Уэлча (модификация t-критерия, если дисперсии не равны).
- U-критерий Манна-Уитни (непараметрический аналог, если распределения не нормальные).
- Для дисперсий:
- F-критерий Фишера:
F_набл = s₁²/s₂²(гдеs₁² > s₂²). Сравнивается с F-критическим.
- F-критерий Фишера:
- Для средних:
- Назначение: Проверка гипотезы о равенстве средних трёх и более совокупностей (
H₀: μ₁ = μ₂ = ... = μₖ). - Идея: Сравнить изменчивость между группами с изменчивостью внутри групп. Если изменчивость между группами значительно больше, чем внутри, то средние, вероятно, различаются.
- Модель:
Xᵢⱼ = μ + αᵢ + εᵢⱼ, гдеXᵢⱼ— j-е наблюдение в i-й группе,μ— общее среднее,αᵢ— эффект i-й группы,εᵢⱼ— случайная ошибка. - Алгоритм:
- Общая вариация
SS_totalразлагается на две компоненты:SS_total = SS_between + SS_withinSS_between(межгрупповая сумма квадратов) — изменчивость, обусловленная различием групповых средних.SS_within(внутригрупповая сумма квадратов) — изменчивость, обусловленная случайностью внутри каждой группы.
- Вычисляются средние квадраты (Mean Squares):
MS = SS / df.MS_between = SS_between / (k-1)MS_within = SS_within / (n-k)
- Рассчитывается F-статистика:
F = MS_between / MS_within - Полученное значение F сравнивается с критическим значением F-распределения с
k-1иn-kстепенями свободы. ЕслиF_набл > F_крит, гипотеза о равенстве средних отвергается.
- Общая вариация
- Задача: Изучить линейную зависимость между двумя количественными переменными X (независимая, предиктор) и Y (зависимая, отклик).
- Модель:
yᵢ = β₀ + β₁xᵢ + εᵢ, гдеβ₀иβ₁— неизвестные параметры (коэффициенты регрессии),εᵢ— случайные ошибки.
- Метод наименьших квадратов (МНК): Параметры
b₀иb₁(оценки дляβ₀иβ₁) подбираются так, чтобы минимизировать сумму квадратов остатков (ошибок):Σ(yᵢ - ŷᵢ)² = Σ(yᵢ - (b₀ + b₁xᵢ))² → min - Формулы для коэффициентов:
b₁ = Cov(X, Y) / D(X) = (Σ(xᵢ-x̄)(yᵢ-ȳ)) / (Σ(xᵢ-x̄)²)b₀ = ȳ - b₁x̄
- Определение: Оценка коэффициента корреляции
ρпо выборке. Обозначаетсяr.r = Cov(X, Y) / (s_x · s_y) = (Σ(xᵢ-x̄)(yᵢ-ȳ)) / (√(Σ(xᵢ-x̄)²) · √(Σ(yᵢ-ȳ)²)) - Свойства: Аналогичны свойствам
ρ.-1 ≤ r ≤ 1. Показывает силу и направление линейной связи в выборке.
- Задача: Проверить, является ли наблюдаемый
rстатистически значимо отличным от нуля. - Гипотезы:
H₀: ρ = 0(линейной связи нет),H₁: ρ ≠ 0(линейная связь есть). - Критерий: Используется t-статистика:
t_набл = r · √(n-2) / √(1-r²) - Решение: Полученное значение
t_наблсравнивается с критическим значениемt_крит(α, n-2)из распределения Стьюдента. Если|t_набл| > t_крит, тоH₀отвергается, и корреляция считается статистически значимой.
- Ограничение
r: Коэффициент корреляции Пирсона измеряет только линейную связь. Если связь есть, но она нелинейная (например, параболическая),rможет быть близок к нулю.
-
Назначение: Измеряет силу любой (не обязательно линейной) корреляционной зависимости.
-
Идея: Основано на идеях дисперсионного анализа. Сравнивает межгрупповую дисперсию (объясненную регрессией) с общей дисперсией.
-
Расчет:
- Данные по
xгруппируются. - Вычисляются межгрупповая (
SS_between) и общая (SS_total) суммы квадратов для переменнойy. - Индекс корреляции:
R² = SS_between / SS_total. Показывает, какую долю общей вариацииyобъясняет регрессияyнаx.0 ≤ R² ≤ 1. - Корреляционное отношение:
η = √R².
- Данные по
-
Свойства:
0 ≤ η ≤ 1.η = 0<=> нет корреляционной зависимости.η = 1<=> есть точная функциональная зависимость.- Важное свойство:
η² ≥ r². Равенство достигается только при строгой линейной зависимости. Разницаη² - r²характеризует степень нелинейности связи.
-
Задача: Аппроксимировать зависимость
yотxнелинейной функцией. -
Примеры моделей:
- Полиномиальная:
y = β₀ + β₁x + β₂x² + ... - Степенная:
y = β₀x^{β₁} - Показательная:
y = β₀e^{β₁x} - Логарифмическая:
y = β₀ + β₁ln(x)
- Полиномиальная:
-
Метод решения: Многие нелинейные модели можно линеаризовать путем замены переменных и затем применить обычный МНК.
- Пример (степенная):
ln(y) = ln(β₀) + β₁ln(x). ЗаменаY = ln(y),X = ln(x),B₀ = ln(β₀),B₁ = β₁приводит к линейной моделиY = B₀ + B₁X.
- Пример (степенная):
-
Если линеаризация невозможна, используются численные итерационные методы для минимизации суммы квадратов остатков.