🟦ЦПТ

🟦ЦПТ#

Т. Ляпунова

Пусть \(X_1, X_2, ...,X_n\) попарно независимые, одинаково распределеные, с конечной дисперсией случайные величины, тогда при \(n\rightarrow \infty\)

\(S_n = X_1 + X_2 + ...+X_n \xrightarrow{d} N(n\mathbb{E}[X_i], nVar[X_i])\)

\(\overline{X} = \frac{X_1 + X_2 + ...+X_n}{n} \xrightarrow{d} N(0, 1)\)

\( \sqrt{n} (\overline{X} - \mathbb{E}[X_i])\xrightarrow{d} N(0, Var[X_i])\)

\(\frac{\overline{X} - \mathbb{E}[X_i]}{\sqrt{\frac{Var[X_i]}{n}}} \xrightarrow{d} N(0, 1)\)

Замечания

ЦПТ не требует нормальности исходных данных, но требует одинаковости распределений и независимости случайных величин.
Если дисперсия не существует (например, распределение Коши), ЦПТ не применима.
Существуют обобщённые формы ЦПТ, допускающие слабую зависимость или разные распределения (например, теорема Линдеберга–Феллера).

from scipy import stats
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Распределения
dest = [('uniform', stats.uniform(0, 1)), ('bernoulli', stats.bernoulli(0.5)), ('expon', stats.expon())]

# Кол-во случайных величин, которые будем ссумировать
n = [1, 2, 3, 5, 10, 20, 100, 1000, 10000]
fig, axes = plt.subplots(len(n), len(dest), figsize=(14, 28))
axes = axes.flatten()
c=0

for i in [1, 2, 3, 5, 10, 20, 100, 1000, 10000]:
    for name, d in dest:
        r = d.rvs((i, 1000))
        r = np.sum(r, axis=0)
        sns.histplot(r, ax=axes[c], kde=True)
        
        axes[c].set_xlabel(name)
        axes[c].set_ylabel(f"n={i}")
        c+=1

../_images/0f1d7b20685d087c89c81392b3a2a32234f1278acc3d22b74dd7d7bef31df773.png

🟦Доверительные интервалы#

Доверительным интервалом для \(\theta\) с уровнем надежности \(\alpha \in [0, 1]\) называется пара статистик \(T_1(X) \leq T_2(X)\):

\[ P\left(T_1(X) \leq \theta \leq T_2(X)\right) \geq \alpha \]

Метод центральной статистики

Функция \(z(X, \theta)\) называется центральной статистикой, если:

Распределение \(z(X, \theta)\) не зависит от \(\theta\)
\(z(X, \theta)\) монотонна и непрерывна

\[ \alpha = P(C_1 \leq z(X, \theta) \leq C_2) = P(T_1(X) \leq \theta \leq T_2(X)) \]

\[ C_1 = q_{z(X, \theta)}\left(\frac{1-\alpha}{2}\right) \,\,\,\, C_2 = q_{z(X, \theta)}\left(\frac{1+\alpha}{2}\right) \]

Теорема Фишера

Пусть \(X_1, X_2, ..., X_n \sim N(\mu, \sigma^2)\), тогда

\(\sqrt{n} \frac{\overline{X}-\mu}{\sigma} \sim N(0, 1)\)
\(\frac{n-1}{\sigma^2}S_1^2 \sim \chi^2_{n-1}\)
\(\sqrt{n} \frac{\overline{X}-\mu}{S_1} \sim st_{n-1}\)

Где \(S^2_1 = \frac{1}{n-1}\,\sum_{i=1}^n (X_i - \overline{X})^2\)

Примеры:

Резюме

\(\mu\) известна, \(\sigma\) неизвестна

\[ \sigma^* \in \left(\sqrt{\frac{n}{C_2}} S_0, \sqrt{\frac{n}{C_1}} S_0\right), \]

\[ С_1 = q_{\chi^2_{n}}\left(\frac{1-\alpha}{2}\right) С_2 = q_{\chi^2_{n}}\left(\frac{1+\alpha}{2}\right) \]

\[ z(X, \theta) = \frac{n}{\sigma^2}S_1^2 \sim \chi^2_{n} \]

\(\mu\) неизвестна, \(\sigma\) известна

\[ \mu^* \in \left(\overline X - C\frac{\sigma}{\sqrt n}, \overline X + C\frac{\sigma}{\sqrt n}\right), \]

\[ С = q_{N{(0, 1)}}\left(\frac{1+\alpha}{2}\right) \]

\[ z(X, \theta) = \sqrt{n} \frac{\overline{X}-\mu}{\sigma} \sim N(0, 1) \]

\(\mu\) неизвестна, \(\sigma\) неизвестна

\[ \mu* \in \left(\overline X - C\frac{S_1}{\sqrt n}, \overline X + C\frac{S_1}{\sqrt n}\right), \]

\[ С = q_{st_{n-1}}\left(\frac{1+\alpha}{2}\right) \]

\[ z(X, \theta) = \sqrt{n} \frac{\overline{X}-\mu}{S_1} \sim st_{n-1} \]

\[ \sigma^* \in \left(\sqrt{\frac{n-1}{C_2}} S_1, \sqrt{\frac{n-1}{C_1}} S_1\right), \]

\[ С_1 = q_{\chi^2_{n-1}}\left(\frac{1-\alpha}{2}\right) С_2 = q_{\chi^2_{n-1}}\left(\frac{1+\alpha}{2}\right) \]

\[ z(X, \theta) = \frac{n-1}{\sigma^2}S_1^2 \sim \chi^2_{n-1} \]

🔹Ассимптотические доверительные интервалы#

\[ \lim_{n\to \infty} P(T_1(X) \leq \theta \leq T_2(X)) \geq \alpha, \,\,\,\, \alpha \in [0, 1] \]

Примеры:

\(T(X)\) - ассимптотически нормальная оценка параметра \(\tau(\theta)\) c коэфф. \(\sigma(\theta)\), если

\[ \sqrt n \frac{T(X) - \tau(\theta)}{\sigma(\theta)} \to \xi \sim N(0, 1) \]

Примеры:

🟦ЦПТ

Contents

🟦ЦПТ#

🟦Доверительные интервалы#

🔹Ассимптотические доверительные интервалы#