Дельта-метод

Дельта-метод (англ. Delta method) у статистиці — твердження щодо наближеного ймовірнісного розподілу функції асимптотично нормальної статистичної оцінки за відомої граничної варіації цієї оцінки.

Одновимірний дельта-метод

У той час, як метод дельта легко узагальнюється до багатовимірного випадку, точне обґрунтування цієї методики легше продемонструвати в одновимірних умовах. Грубо кажучи, якщо є послідовність випадкових величин $X_{n}$ , що задовольняють

{{\sqrt {n}}[X_{n}-\theta ]\,{\xrightarrow {D}}\,{\mathcal {N}}(0,\sigma ^{2})},

де $\theta$ та $\sigma ^{2}$ — скінченні константи і ${\xrightarrow {D}}$ позначає збіжність за розподілом, тоді

{{\sqrt {n}}[g(X_{n})-g(\theta )]\,{\xrightarrow {D}}\,{\mathcal {N}}(0,\sigma ^{2}[g'(\theta )]^{2})}

для довільної функції g, яка задовольняє властивість: $\exists \ g'(\theta )\neq 0$ (існує і не дорівнює нулю).

Доведення одновимірного випадку

Доведення твердження досить просте у випадку неперервної похідної $g'(\theta )$ . Для початку скористаємось теоремою Лагранжа про середнє:

g(X_{n})=g(\theta )+g'({\tilde {\theta }})(X_{n}-\theta ),

де ${\tilde {\theta }}$ знаходиться між $X n$ та $\theta$ . Зауважте, що оскільки $X_{n}\,{\xrightarrow {P}}\,\theta$ та $X_{n}<{\tilde {\theta }}<\theta$ , то відповідно маємо ${\tilde {\theta }}\,{\xrightarrow {P}}\,\theta$ і оскільки $g'(\theta )$ неперервна, то, застосовуючи теорему про неперервне відображення, маємо

g'({\tilde {\theta }})\,{\xrightarrow {P}}\,g'(\theta ),

де ${\xrightarrow {P}}$ позначає збіжність за розподілом.

Після тривіальних перетворень і множення на ${\sqrt {n}}$ маємо

{\sqrt {n}}[g(X_{n})-g(\theta )]=g'\left({\tilde {\theta }}\right){\sqrt {n}}[X_{n}-\theta ].

Оскільки

{{\sqrt {n}}[X_{n}-\theta ]{\xrightarrow {D}}{\mathcal {N}}(0,\sigma ^{2})}

за припущенням і використовуючи теорему Слуцького випливає

{{\sqrt {n}}[g(X_{n})-g(\theta )]{\xrightarrow {D}}{\mathcal {N}}(0,\sigma ^{2}[g'(\theta )]^{2})}.

Що й треба було показати.

Доведення з явним використанням О-символіки

Альтернативно, можна було б додати ще один крок в кінці для отримання порядкового наближення:

{\begin{aligned}{\sqrt {n}}[g(X_{n})-g(\theta )]&=g'\left({\tilde {\theta }}\right){\sqrt {n}}[X_{n}-\theta ]={\sqrt {n}}[X_{n}-\theta ]\left[g'({\tilde {\theta }})+g'(\theta )-g'(\theta )\right]\\&={\sqrt {n}}[X_{n}-\theta ]\left[g'(\theta )\right]+{\sqrt {n}}[X_{n}-\theta ]\left[g'({\tilde {\theta }})-g'(\theta )\right]\\&={\sqrt {n}}[X_{n}-\theta ]\left[g'(\theta )\right]+O_{p}(1)\cdot o_{p}(1)\\&={\sqrt {n}}[X_{n}-\theta ]\left[g'(\theta )\right]+o_{p}(1)\end{aligned}}

Що показує прямування наближення за ймовірністю до нуля.

Багатовимірний дельта-метод

За означенням, конзистентна оцінка B збігається за ймовірністю до її справжнього значення β, і, застосовуючи центральну граничну теорему, можна отримати асимптотичну нормальність:

{\sqrt {n}}\left(B-\beta \right)\,{\xrightarrow {D}}\,N\left(0,\Sigma \right),

де n — число спостережень і Σ — матриця коваріації (симетрична позитивно напів-визначена). Нехай треба оцінити варіацію функції h оцінки B. Беручи до уваги тільки два перші члени розкладу Тейлора, з використанням векторного позначення градієнта, можемо оцінити h(B) як

h(B)\approx h(\beta )+\nabla h(\beta )^{T}\cdot (B-\beta )

звідки випливає, що варіація h(B) наближено дорівнює

{\begin{aligned}\operatorname {Var} \left(h(B)\right)&\approx \operatorname {Var} \left(h(\beta )+\nabla h(\beta )^{T}\cdot (B-\beta )\right)\\&=\operatorname {Var} \left(h(\beta )+\nabla h(\beta )^{T}\cdot B-\nabla h(\beta )^{T}\cdot \beta \right)\\&=\operatorname {Var} \left(\nabla h(\beta )^{T}\cdot B\right)\\&=\nabla h(\beta )^{T}\cdot \operatorname {Cov} (B)\cdot \nabla h(\beta )\\&=\nabla h(\beta )^{T}\cdot (\Sigma /n)\cdot \nabla h(\beta )\end{aligned}}

Застосовуючи теорему Лагранжа про середнє (для дійснозначних функцій багатьох змінних), можна переконатись, що доведення не спирається на той факт, що враховуються тільки наближення першого порядку.

Отже, з дельта-методу випливає

{\sqrt {n}}\left(h(B)-h(\beta )\right)\,{\xrightarrow {D}}\,N\left(0,\nabla h(\beta )^{T}\cdot \Sigma \cdot \nabla h(\beta )\right)

чи в одновимірному випадку,

{\sqrt {n}}\left(h(B)-h(\beta )\right)\,{\xrightarrow {D}}\,N\left(0,\sigma ^{2}\cdot \left(h^{\prime }(\beta )\right)^{2}\right).

Джерела

Casella, G. and Berger, R. L. (2002), Statistical Inference, 2nd ed.
Cramér, H. (1946), Mathematical Methods of Statistics, p. 353.
Davison, A. C. (2003), Statistical Models, pp. 33-35.
Greene, W. H. (2003), Econometric Analysis, 5th ed., pp. 913f.
Klein, L. R. (1953), A Textbook of Econometrics, p. 258.

Посилання

Oehlert, G. W. (1992), A Note on the Delta Method, The American Statistician, Vol. 46, No. 1, p. 27-29. http://www.jstor.org/stable/2684406 [Архівовано 5 березня 2016 у Wayback Machine.]
Lecture notes [Архівовано 13 червня 2009 у Wayback Machine.]
More lecture notes
Explanation from Stata software corporation [Архівовано 2 січня 2010 у Wayback Machine.]