🟦ЦПТ#

Т. Ляпунова

Пусть \(X_1, X_2, ...,X_n\) попарно независимые, одинаково распределеные, с конечной дисперсией случайные величины, тогда при \(n\rightarrow \infty\)

  • \(S_n = X_1 + X_2 + ...+X_n \xrightarrow{d} N(n\mathbb{E}[X_i], nVar[X_i])\)


  • \(\overline{X} = \frac{X_1 + X_2 + ...+X_n}{n} \xrightarrow{d} N(0, 1)\)


  • \( \sqrt{n} (\overline{X} - \mathbb{E}[X_i])\xrightarrow{d} N(0, Var[X_i])\)


  • \(\frac{\overline{X} - \mathbb{E}[X_i]}{\sqrt{\frac{Var[X_i]}{n}}} \xrightarrow{d} N(0, 1)\)


Замечания

  • ЦПТ не требует нормальности исходных данных, но требует одинаковости распределений и независимости случайных величин.

  • Если дисперсия не существует (например, распределение Коши), ЦПТ не применима.

  • Существуют обобщённые формы ЦПТ, допускающие слабую зависимость или разные распределения (например, теорема Линдеберга–Феллера).

from scipy import stats
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Распределения
dest = [('uniform', stats.uniform(0, 1)), ('bernoulli', stats.bernoulli(0.5)), ('expon', stats.expon())]

# Кол-во случайных величин, которые будем ссумировать
n = [1, 2, 3, 5, 10, 20, 100, 1000, 10000]
fig, axes = plt.subplots(len(n), len(dest), figsize=(14, 28))
axes = axes.flatten()
c=0

for i in [1, 2, 3, 5, 10, 20, 100, 1000, 10000]:
    for name, d in dest:
        r = d.rvs((i, 1000))
        r = np.sum(r, axis=0)
        sns.histplot(r, ax=axes[c], kde=True)
        
        axes[c].set_xlabel(name)
        axes[c].set_ylabel(f"n={i}")
        c+=1
../_images/0f1d7b20685d087c89c81392b3a2a32234f1278acc3d22b74dd7d7bef31df773.png

🟦Доверительные интервалы#

Доверительным интервалом для \(\theta\) с уровнем надежности \(\alpha \in [0, 1]\) называется пара статистик \(T_1(X) \leq T_2(X)\):

\[ P\left(T_1(X) \leq \theta \leq T_2(X)\right) \geq \alpha \]

Метод центральной статистики

Функция \(z(X, \theta)\) называется центральной статистикой, если:

  1. Распределение \(z(X, \theta)\) не зависит от \(\theta\)

  2. \(z(X, \theta)\) монотонна и непрерывна

\[ \alpha = P(C_1 \leq z(X, \theta) \leq C_2) = P(T_1(X) \leq \theta \leq T_2(X)) \]
\[ C_1 = q_{z(X, \theta)}\left(\frac{1-\alpha}{2}\right) \,\,\,\, C_2 = q_{z(X, \theta)}\left(\frac{1+\alpha}{2}\right) \]

Теорема Фишера

Пусть \(X_1, X_2, ..., X_n \sim N(\mu, \sigma^2)\), тогда

  1. \(\sqrt{n} \frac{\overline{X}-\mu}{\sigma} \sim N(0, 1)\)

  2. \(\frac{n-1}{\sigma^2}S_1^2 \sim \chi^2_{n-1}\)

  3. \(\sqrt{n} \frac{\overline{X}-\mu}{S_1} \sim st_{n-1}\)

Где \(S^2_1 = \frac{1}{n-1}\,\sum_{i=1}^n (X_i - \overline{X})^2\)


Примеры:


Резюме

  1. \(\mu\) известна, \(\sigma\) неизвестна

\[ \sigma^* \in \left(\sqrt{\frac{n}{C_2}} S_0, \sqrt{\frac{n}{C_1}} S_0\right), \]
\[ С_1 = q_{\chi^2_{n}}\left(\frac{1-\alpha}{2}\right) С_2 = q_{\chi^2_{n}}\left(\frac{1+\alpha}{2}\right) \]
\[ z(X, \theta) = \frac{n}{\sigma^2}S_1^2 \sim \chi^2_{n} \]

  1. \(\mu\) неизвестна, \(\sigma\) известна

\[ \mu^* \in \left(\overline X - C\frac{\sigma}{\sqrt n}, \overline X + C\frac{\sigma}{\sqrt n}\right), \]
\[ С = q_{N{(0, 1)}}\left(\frac{1+\alpha}{2}\right) \]
\[ z(X, \theta) = \sqrt{n} \frac{\overline{X}-\mu}{\sigma} \sim N(0, 1) \]

  1. \(\mu\) неизвестна, \(\sigma\) неизвестна

\[ \mu* \in \left(\overline X - C\frac{S_1}{\sqrt n}, \overline X + C\frac{S_1}{\sqrt n}\right), \]
\[ С = q_{st_{n-1}}\left(\frac{1+\alpha}{2}\right) \]
\[ z(X, \theta) = \sqrt{n} \frac{\overline{X}-\mu}{S_1} \sim st_{n-1} \]

\[ \sigma^* \in \left(\sqrt{\frac{n-1}{C_2}} S_1, \sqrt{\frac{n-1}{C_1}} S_1\right), \]
\[ С_1 = q_{\chi^2_{n-1}}\left(\frac{1-\alpha}{2}\right) С_2 = q_{\chi^2_{n-1}}\left(\frac{1+\alpha}{2}\right) \]
\[ z(X, \theta) = \frac{n-1}{\sigma^2}S_1^2 \sim \chi^2_{n-1} \]



🔹Ассимптотические доверительные интервалы#

\[ \lim_{n\to \infty} P(T_1(X) \leq \theta \leq T_2(X)) \geq \alpha, \,\,\,\, \alpha \in [0, 1] \]

Примеры:


\(T(X)\) - ассимптотически нормальная оценка параметра \(\tau(\theta)\) c коэфф. \(\sigma(\theta)\), если

\[ \sqrt n \frac{T(X) - \tau(\theta)}{\sigma(\theta)} \to \xi \sim N(0, 1) \]

Примеры: