🟦Проверка гипотез#

Ститистической гипотезой называют любое предположение о распределении и свойствах случайной величины.


Статистическим критерием называют правило, позволяющее по реализации выборки отклонить или не отклонить нулевую гипотезу с заданным уровнем значимости.


Уровнем значимости называют вероятность отклонить H0, когда она верна (ошибка 1 рода).


Статистическая мощность - вероятность отклонения H0, когда верна альтернативная.


Критическая область - область выборочного пространста, при попадании в которую нулевая гипотеза отклоняется.



🔹t-критерий Стьюдента#

Одновыборочный t-критерий

Пусть \( X_1, X_2, \ldots, X_n \) — независимая выборка из нормального распределения

\[ X_i \sim \mathcal{N}(\mu, \sigma^2), \]

где \( \mu \) — неизвестное математическое ожидание, \( \sigma^2 \) — неизвестная дисперсия.

Нужно проверить гипотезу:

\[\begin{split} \begin{cases} H_0: \mu = \mu_0, \\ H_1: \mu \neq \mu_0. \end{cases} \end{split}\]

Выборочное среднее:

\[ \overline{X} = \frac{1}{n} \sum_{i=1}^n X_i, \]

Выборочная дисперсия:

\[ S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \overline{X})^2. \]

Тогда t-статистика определяется как:

\[ T = \frac{\overline{X} - \mu_0}{S / \sqrt{n}}. \]

Если гипотеза \( H_0 \) верна, то

\[ T \sim t_{n-1}, \]

где \( t_{n-1} \) — распределение Стьюдента с \( n-1 \) степенями свободы.


Двухвыборочный t-критерий (равные дисперсии)

Пусть есть две независимые выборки:

\[ X_1, \ldots, X_{n_1} \sim \mathcal{N}(\mu_1, \sigma^2), \quad Y_1, \ldots, Y_{n_2} \sim \mathcal{N}(\mu_2, \sigma^2). \]

Проверяем гипотезу:

\[\begin{split} \begin{cases} H_0: \mu_1 = \mu_2, \\ H_1: \mu_1 \neq \mu_2. \end{cases} \end{split}\]

Общая (объединённая) выборочная дисперсия:

\[ S_p^2 = \frac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1 + n_2 - 2}. \]

Тогда

\[ T = \frac{\overline{X} - \overline{Y}}{S_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t_{n_1 + n_2 - 2}. \]

t-критерий для неравных дисперсий (Уэлча)

Если предполагать, что \( \sigma_1^2 \neq \sigma_2^2 \),
то статистика:

\[ T = \frac{\overline{X} - \overline{Y}}{\sqrt{\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2}}} \]

имеет распределение, приближённое к \( t_{\nu} \), где эффективное число степеней свободы вычисляется по формуле Уэлча:

\[ \nu = \frac{\left( \frac{S_1^2}{n_1} + \frac{S_2^2}{n_2} \right)^2}{ \frac{(S_1^2 / n_1)^2}{n_1 - 1} + \frac{(S_2^2 / n_2)^2}{n_2 - 1} }. \]

import numpy as np
import scipy.stats as stats
import matplotlib.pyplot as plt

np.random.seed(40)
# --- Параметры ---
mu_true = 5          # истинное среднее
sigma_true = 2       # истинное стандартное отклонение
n = 50           # размер выборки
alpha = 0.05         # уровень значимости

# --- Генерация выборки ---
sample = np.random.normal(mu_true, sigma_true, n)

# Проверяем гипотезу H0: mu = mu0
mu0 = 5

# --- Вычисление t-статистики ---
x_bar = np.mean(sample)
s = np.std(sample, ddof=1)
t_stat = (x_bar - mu0) / (s / np.sqrt(n))

# --- p-value ---
p_value = 2 * (1 - stats.t.cdf(abs(t_stat), df=n-1))

# --- Критическое значение ---
t_crit = stats.t.ppf(1 - alpha/2, df=n-1)

print(f"Выборочное среднее: {x_bar:.3f}")
print(f"Стандартное отклонение: {s:.3f}")
print(f"t-статистика: {t_stat:.3f}")
print(f"Критическое значение (двустороннее): ±{t_crit:.3f}")
print(f"p-value: {p_value:.4f}")

if abs(t_stat) > t_crit:
    print("❌ Отвергаем H0: среднее отличается от μ₀")
else:
    print("✅ Не отвергаем H0: нет оснований считать, что среднее отличается от μ₀")

# --- Визуализация ---
x = np.linspace(-4, 4, 400)
t_pdf = stats.t.pdf(x, df=n-1)
norm_pdf = stats.norm.pdf(x, 0, 1)

plt.figure(figsize=(8, 5))
plt.plot(x, t_pdf, label=f"t({n-1}) распределение", linewidth=2)
plt.plot(x, norm_pdf, '--', label="N(0,1)", color='gray')
plt.axvline(t_stat, color='r', linestyle='--', label=f"t_stat = {t_stat:.2f}")
plt.fill_between(x, 0, t_pdf, where=(x > t_crit) | (x < -t_crit), color='red', alpha=0.3, label="Критическая область")
plt.title("t-критерий Стьюдента (одновыборочный)")
plt.xlabel("t")
plt.ylabel("Плотность вероятности")
plt.legend()
plt.grid(alpha=0.3)
plt.show()
Выборочное среднее: 5.157
Стандартное отклонение: 1.686
t-статистика: 0.660
Критическое значение (двустороннее): ±2.010
p-value: 0.5123
✅ Не отвергаем H0: нет оснований считать, что среднее отличается от μ₀
../_images/3c1d63ad34d92f53ab9798eabaad75f69eabbc4754fbedf0cb5089f005b3f645.png

🔹 U-критерий Манна–Уитни#

📎 U-критерий Манна–Уитни — это непараметрический тест, применяемый для проверки гипотезы о распределений двух независимых выборок.
Он является аналогом двухвыборочного t-критерия Стьюдента, но не требует нормальности распределений и устойчив к выбросам.

Пусть заданы две независимые выборки: $\( X_1, X_2, \ldots, X_{n_1}, \quad Y_1, Y_2, \ldots, Y_{n_2}. \)$

Проверяется гипотеза:

\[\begin{split} \begin{cases} H_0: \text{распределения } X \text{ и } Y \text{ одинаковы}, \\ H_1: \text{одно распределение сдвинуто относительно другого.} \end{cases} \end{split}\]

Алгоритм вычисления статистики

  1. Объедини обе выборки в одну совокупность из \( n = n_1 + n_2 \) наблюдений.

  2. Отсортируй все элементы по возрастанию и присвой ранги от 1 до \( n \).
    Если есть одинаковые значения (связи), присваиваются средние ранги.

  3. Найди сумму рангов первой выборки: $\( R_X = \sum_{i=1}^{n_1} r(X_i), \)\( где \) r(X_i) \( — ранг элемента \) X_i $.

  4. Вычисли статистику: $\( U_X = R_X - \frac{n_1 (n_1 + 1)}{2}. \)\( Аналогично можно вычислить \) U_Y \(: \)\( U_Y = R_Y - \frac{n_2 (n_2 + 1)}{2}. \)$

📎 Связь между ними: $\( U_X + U_Y = n_1 n_2. \)$


Критическая статистика

Выбирают минимальное из двух значений:

\[ U = \min(U_X, U_Y). \]

Дальше находим критическое значение U-критерия при заданных \(n_1\) и \(n_2\) и сравниваем с полученным.

Нормальность U-статистики

Если верна H0, то статистика будет иметь распределение

\[ U(X, Y) = N\left(\frac{n_1 n_2}{2}, \frac{n_1 n_2(n_1+n_2+1)}{12}\right) \]

Пример:

Наблюдения X

Наблюдения Y

8

3

7

6

6

5

Общая выборка: 3, 5, 6, 6, 7, 8
Присвоим ранги:
3→1, 5→2, 6→3.5, 6→3.5, 7→5, 8→6

\[ R_X = 3.5 + 5 + 6 = 14.5, \quad R_Y = 1 + 2 + 3.5 = 6.5 \]
\[ U_X = 14.5 - \frac{3(3+1)}{2} = 8.5, \quad U_Y = 6.5 - 6 = 0.5, \quad U = 0.5 \]

По таблице критических значений (для \( n_1 = n_2 = 3 \), \(\alpha = 0.05\)) → \( U_{crit} = 2 \).
Так как \( U = 0.5 < 2 \), отвергаем \( H_0 \).

🔹Критеий отношения правдоподобия (hard ml)#

Что же делать, когда для гипотезы нет критерия? Введем функцию правдоподобия \(L(\theta) = \prod_{i=1}^n f(X_i|\theta)\)

Гипотезы: \(H_0: \theta \in \Theta_0\) \(H_1: \theta \notin \Theta_0\)


Пример: \(X_1, X_2, ..., X_n = N(\mu, \sigma^2)\) \(\theta = (\mu, \sigma^2)\), тогда \(\Theta = \{\mu: \mu \in [0, 5], \sigma^2: \sigma^2 \in [1, 2]\}\)

Тогда можно вести такую статистику, как отногение правдоподобия

\[ \lambda(\overline{X}) = 2ln\frac{sup_{\theta \in \Theta}L(\theta)}{sup_{\theta \notin \Theta}L(\theta)} = 2ln\frac{L(\hat{\theta})}{L(\hat{\theta_0})} \]

где \(\hat{\theta} - ОМП\), а \(\hat{\theta_0}\) - ОМП при условии \(\theta \in \Theta\).

Допустим \(\theta= (\theta_1, ..., \theta_q, \theta_{q+1}, ..., \theta_r)\). Пусть \(\Theta_0 = \{\theta: (\theta_{q+1}, ..., \theta_r) = (\theta_{0, q+1}, ..., \theta_{0, r})\}\) Если \(H_0\) верна, то \(\lambda(X^n) \sim \chi^2_{r-q, \alpha}\), где \(r-q\) -размерность \(\Theta\) минус размерность \(\Theta_0\), \(\alpha\) - уровень значимости.

\[\begin{split} \delta(X^n)= \begin{equation*} \begin{cases} H_0, если \,\,\, \lambda(X^n) < C \\ H_1, если \,\,\, \lambda(X^n) \geq C \end{cases} \end{equation*} \end{split}\]