Регрессия (математич.)

Регрессия (математич.)
Регрессия в теории вероятностей и математической статистике, зависимость среднего значения какой-либо величины от некоторой другой величины или от нескольких величин. В отличие от чисто функциональной зависимости у = f(х), когда каждому значению независимой переменной х соответствует одно определённое значение величины у, при регрессионной связи одному и тому же значению х могут соответствовать в зависимости от случая различные значения величины у. Если при каждом значении х = xi наблюдается ni, значений yi1, ...,

величины у, то зависимость средних арифметических

от xi и является Р. в статистическом понимании этого термина. Примером такого рода зависимости служит, в частности, зависимость средних диаметров сосен от их высот; см. табл. в ст. Корреляция.

Изучение Р. в теории вероятностей основано на том, что случайные величины Х и Y, имеющие совместное распределение вероятностей, связаны вероятностной зависимостью: при каждом фиксированном значении Х = х величина Y является случайной величиной с определённым (зависящим от значения х) условным распределением вероятностей. Р. величины Y по величине Х определяется условным математическим ожиданием Y, вычисленным при условии, что Х = х:

Е(Y êх) = u(х).

Уравнение у = u(х), в котором х играет роль «независимой» переменной, называется уравнением регрессии, а соответствующий график ‒ линией регрессии величины Y по X. Точность, с которой уравнение Р. Y по Х отражает изменение Y в среднем при изменении х, измеряется условной дисперсией величины Y, вычисленной для каждого значения Х = х:

D(Y êх) = s2(x).

Если s2(х) = 0 при всех значениях х, то можно с достоверностью утверждать, что Y и Х связаны строгой функциональной зависимостью Y = u(X). Если s2(х) = 0 при всех значениях х и u(х) не зависит от х, то говорят, что Р. Y по Х отсутствует. Аналогичным образом определяется Р. Х по Y и в частности, уравнение Р. х = u(у), = Е(ХïY = у). Функции у = u(х) и х = u(у), вообще говоря, не являются взаимно обратными.

Линии Р. обладают следующим замечательным свойством: среди всех действительных функций f (х) минимум математического ожидания Е[Yf(X)]2 достигается для функции f(x) = u(х), т. е. Р. Y по Х даёт наилучшее, в указанном смысле, представление величины Y по величине X. Это свойство используется для прогноза Y по X: если значение Y непосредственно не наблюдается и эксперимент позволяет регистрировать лишь компоненту Х вектора (X, Y), то в качестве прогнозируемого значения Y используют величину u (X).

Наиболее простым является случай, когда Р. Y по Х линейна:

Е(Yïx) = b0 + b1x.

Коэффициенты b0 и b1, называются коэффициентами регрессии, определяются равенствами

,

где mХ и mY математические ожидания Х и Y, и

‒ дисперсии Х и Y, а r ‒ коэффициент корреляции между Х и Y. Уравнение Р. при этом выражается формулой


В случае, когда совместное распределение Х и Y нормально, обе линии Р. у = u(х) и х = u(у) являются прямыми.

Если Р. Y по Х отлична от линейной, то последнее уравнение есть линейная аппроксимация истинного уравнения Р.: математическое ожидание Е[Y b0 ‒ b1X]2 достигает минимума b0 и b1 при b0 = b0 и b1 = b1. Особенно часто встречается случай уравнения Р., выражающегося линейной комбинацией тех или иных заданных функций:

у = u(Х) = b0j0(x) + b1j1(x) + ... + bmjm(x).

Наиболее важное значение имеет параболическая (полиномиальная) Р., при которой j0(x) = 1 , j1(x) = x, ..., jm(x) = xm.

Понятие Р. применимо не только к случайным величинам, но и к случайным векторам. В частности, если Y ‒ случайная величина, а Х = (X1, ..., Xk) случайный вектор, имеющие совместное распределение вероятностей, то Р. Y по X определяется уравнением

y = u ( x1, ..., xk),

где u( x1, ..., xk) = E{YïX = x1, ... , Xk = xk}.

Если

u ( x1, ..., xk) = b0 + b1x1 + ... + bkxk,

то Р. называется линейной. Эта форма уравнения Р. включает в себя многие типы Р. с одной независимой переменной, в частности полиномиальная Р. Y по Х порядка k сводится к линейной Р. Y по X1, ..., Xk, если положить Xk = Xk.

Простым примером Р. Y по Х является зависимость между Y и X, которая выражается соотношением: Y = u(X) + d, где u(x) = Е(Y IX = х), а случайные величины Х и d независимы. Это представление полезно, когда планируется эксперимент для изучения функциональной связи у = u(х) между неслучайными величинами у и х.

На практике обычно коэффициенты Р. в уравнении у = u(х) неизвестны и их оценивают по экспериментальным данным (см. Регрессионный анализ).

Первоначально термин «Р.» был употреблен английским статистиком Ф. Гальтоном (1886) в теории наследственности в следующем специальном смысле: «возвратом к среднему состоянию» (regression to mediocrity) было названо явление, состоящее в том, что дети тех родителей, рост которых превышает среднее значение на а единиц, имеют в среднем рост, превышающий среднее значение меньше чем на а единиц.


Лит.: Крамер Г., Математические методы статистики, пер. с англ., М., 1948; Кендалл М. Дж., Стьюарт А., Статистические выводы и связи, пер. с англ., М., 1973.

А. В. Прохоров.


Большая советская энциклопедия. — М.: Советская энциклопедия. 1969—1978.

Игры ⚽ Нужна курсовая?

Полезное


Смотреть что такое "Регрессия (математич.)" в других словарях:

  • Регрессия (математич.) — Статистическая регрессия  частный случай ошибки селекции, когда группы отбираются на основе крайних показателей. «Эффекты статистической регрессии означают дрейф крайних, отличающихся от остальных, оценок в сторону средней величины. Известно, что …   Википедия

  • РЕГРЕССИЯ — зависимость среднего значения какой либо случайной величины от нек рой другой величины или от нескольких величин. Если, например, при каждом значении х=xi наблюдается ni значений случайной величины Y, то зависимость средних арифметических этих… …   Математическая энциклопедия

  • ЛИНЕЙНАЯ РЕГРЕССИЯ — одной случайной переменной Y=(Y(1), ..., Y(m)) по другой Х=(Х (1), ..., Х (p)) линейная по xm мерная векторная форма, описывающая зависимость условного математич. ожидания (при условии Х=x).случайного вектора Y от значений x = (х (1) ..., х (p)) …   Математическая энциклопедия

  • КОРРЕЛЯЦИЯ — зависимость между случайными величинами, не имеющая, вообще говоря, строго функционального характера. В отличие от функциональной зависимости К., как правило, рассматривается тогда, когда одна из величин зависит не только от данной другой, но и… …   Математическая энциклопедия

  • РЕГРЕССИОННЫЙ АНАЛИЗ — раздел математич. статистики, объединяющий практич. методы исследования регрессионной зависимости между величинами по статистич. данным (см. Регрессия). Проблема регрессии в математич. статистике характерна тем, что о распределениях изучаемых… …   Математическая энциклопедия

  • АНАЛИЗ ДАННЫХ — 1. Совокупность действий, осуществляемых исследователем в процессе изучения полученных тем или иным образом данных с целью формирования определенных представлений о характере явления, описываемого этими данными. В процессе А.д. исследователь чаще …   Российская социологическая энциклопедия

  • МНОГОМЕРНЫЙ СТАТИСТИЧЕСКИЙ АНАЛИЗ — раздел математич. статистики, посвященный математич. методам построения оптимальных планов сбора, систематизации и обработки многомерных статистич. данных, направленным на выявление характера и структуры взаимосвязей между компонентами… …   Математическая энциклопедия

  • МАТЕМАТИЧЕСКАЯ СТАТИСТИКА — раздел математики, посвященный математич. методам систематизации, обработки и использования статистич. данных для научных и практич. выводов. При этом статистич. данными наз. сведения о числе объектов в какой либо более или менее обширной… …   Математическая энциклопедия

  • РАСПРЕДЕЛЕНИЕ ВЕРОЯТНОСТЕЙ — одно из основных понятий вероятностей теории и математической статистики. При современном подходе в качестве математич. модели изучаемого случайного явления берется соответствующее вероятностное пространство{W, S, Р}, где W множество элементарных …   Математическая энциклопедия

  • МНОГОМЕРНОЕ РАСПРЕДЕЛЕНИЕ — распределение вероятностей на алгебре борелевских множеств s мерного евклидова пространства . О М. р. обычно говорят как о распределении многомерной случайной величины или случайного вектора , понимая под этим совместное распределение… …   Математическая энциклопедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»