Независимая и зависимая переменные

Независимая переменная — в эксперименте переменная, которая намеренно манипулируется или выбирается экспериментатором с целью выяснить её влияние на зависимую переменную.

Зависимая переменная — в научном эксперименте измеряемая переменная, изменения которой связывают с изменениями независимой переменной.

Независимой переменной, например, в психологическом эксперименте может считаться интенсивность стимула, а зависимой — способность испытуемого ощущать этот стимул.

undefined

В чистой математике

В математике функция — это правило, сопоставляющее входу (в простейшем случае, числу или множеству чисел)[2] некоторый выход (который также может быть числом или множеством чисел)[2]. Символ, обозначающий произвольный вход, называется независимой переменной, а символ, обозначающий произвольный выход, — зависимой переменной[3]. Наиболее часто для входа используется символ x, а для выхода — y; сама функция обычно записывается как y = f(x)[3][4].

Возможны функции с несколькими независимыми или несколькими зависимыми переменными. Например, в многомерном анализе часто встречаются функции вида z = f(x, y), где z — зависимая переменная, а x и y — независимые[5]. Функции с несколькими выходами часто называют векторными функциями.

В моделировании и статистике

В математическом моделировании изучается связь между множеством зависимых и множеством независимых переменных.

В простейшей стохастической линейной модели y_i = a + b x_i + e_i величина y_i — это i-ое значение зависимой переменной, а x_ii-ое значение независимой переменной. Величина e_i называется «ошибкой» и содержит ту часть изменчивости зависимой переменной, которая не объясняется независимой переменной.

При наличии нескольких независимых переменных модель принимает вид y_i = a + b x_{i,1} + b x_{i,2} + \ldots + b x_{i,n} + e_i, где n — число независимых переменных.

В статистике, в частности в линейной регрессии, строится диаграмма рассеяния с X в роли независимой переменной и Y — зависимой. Такой набор данных называют бивариантным: (x_1, y_1), (x_2, y_2), \ldots, (x_i, y_i). Простая линейная регрессия имеет вид Y_i = a + B x_i + U_i, где i = 1, 2, \ldots, n. В этом случае U_i, \ldots, U_n — независимые случайные величины, что справедливо, если измерения не влияют друг на друга. Благодаря распространению независимости, независимость U_i влечёт независимость Y_i, хотя каждое Y_i имеет своё математическое ожидание. Для каждого U_i математическое ожидание равно 0, а дисперсия — \sigma^2[6]. Доказательство для математического ожидания Y_i:[6]

Прямая наилучшего приближения для бивариантного набора данных имеет вид y = \alpha + \beta x и называется линией регрессии. α и β соответствуют, соответственно, свободному члену и угловому коэффициенту[6].

В эксперименте переменная, которой управляет экспериментатор, называется независимой переменной[7]. Зависимая переменная — это событие, ожидаемое к изменению при манипуляции независимой переменной[8].

В инструментах интеллектуального анализа данных (для многомерной статистики и машинного обучения) зависимая переменная получает роль целевой переменной (или, в некоторых инструментах, метки), а независимая переменная может быть назначена как обычная переменная[9] или признак. Известные значения целевой переменной предоставляются для обучающей и тестовой выборок, но должны быть предсказаны для других данных. Целевая переменная используется в алгоритмах обучения с учителем, но не в обучении без учителя.

Синонимы

В зависимости от контекста, независимая переменная может называться «предиктор», «регрессор», «ковариата», «манипулируемая переменная», «объясняющая переменная», «экспозиционная переменная» (см. Теория надёжности), «фактор риска» (см. Медицинская статистика), «признак» (в машинном обучении и распознавании образов) или «входная переменная»[10][11]. В эконометрике вместо «ковариата» обычно используется термин «контролируемая переменная».[12][13][14][15][16]

Термин "объясняющая переменная" предпочитается некоторыми авторами вместо «независимая переменная», когда рассматриваемые как независимые переменные величины могут не быть статистически независимыми или не могут быть независимо изменяемыми исследователем.[17][18] Если независимая переменная называется «объясняющей переменной», то для зависимой переменной некоторыми авторами предпочитается термин "отклик" («response variable»).[11][17][18]

В зависимости от контекста, зависимая переменная может называться «отклик», «регрессанд», «критерий», «предсказанная переменная», «измеряемая переменная», «объяснённая переменная», «экспериментальная переменная», «реагирующая переменная», «результативная переменная», «выходная переменная», «цель» или «метка»[11]. В экономике для обозначения цели обычно используют термин «эндогенная переменная».

Термин "объяснённая переменная" предпочитается некоторыми авторами вместо «зависимая переменная», когда рассматриваемые как «зависимые переменные» величины могут не быть статистически зависимыми[19]. Если зависимая переменная называется «объяснённой переменной», то для независимой переменной некоторыми авторами предпочитается термин "предиктор"[19].

Примером может служить анализ тренда уровня моря в работе Woodworth (1987). Здесь зависимой переменной (и основной интересующей величиной) был среднегодовой уровень моря в определённой точке, для которой имелся ряд годовых значений. Главной независимой переменной было время. В качестве ковариаты использовались годовые значения среднего атмосферного давления на уровне моря. Результаты показали, что включение ковариаты позволило получить более точные оценки тренда по времени по сравнению с анализами, в которых ковариата не учитывалась.

Антонимичные пары
независимая зависимая
вход выход
регрессор регрессанд
предиктор предсказанная
объясняющая объяснённая
экзогенная эндогенная
манипулируемая измеряемая
экспозиционная результативная
признак метка или цель

Другие переменные

Переменная может предполагаться влияющей на зависимые или независимые переменные, но не быть объектом исследования. Такие переменные стараются держать постоянными или контролировать, чтобы минимизировать их влияние на эксперимент. Такие переменные могут называться «контролируемая переменная», «контрольная переменная» или «фиксированная переменная».

Посторонние переменные, если они включены в регрессионный анализ как независимые, могут помочь исследователю более точно оценить параметры отклика, прогнозировать и улучшить качество аппроксимации, но не представляют существенного интереса для проверяемой гипотезы. Например, в исследовании влияния высшего образования на доход за жизнь посторонними переменными могут быть пол, этническая принадлежность, социальный статус, генетика, интеллект, возраст и т. д. Переменная считается посторонней только если можно предположить (или показать), что она влияет на зависимую переменную. Если её включить в регрессию, это может улучшить аппроксимацию модели. Если её исключить, а она имеет ненулевую ковариацию с одной или несколькими независимыми переменными, это приведёт к смещению оценки эффекта интересующей независимой переменной. Этот эффект называется смешением или смещением из-за пропущенной переменной; в таких случаях необходимы изменения дизайна и/или статистический контроль.

Посторонние переменные часто делят на три типа:

  1. Переменные субъекта — характеристики испытуемых, которые могут влиять на их поведение: возраст, пол, состояние здоровья, настроение, происхождение и др.
  2. Блокирующие или экспериментальные переменные — характеристики экспериментаторов, которые могут влиять на поведение испытуемых: пол, наличие дискриминации, язык и др.
  3. Ситуационные переменные — особенности среды, в которой проводится исследование, влияющие на результат эксперимента негативно: температура воздуха, уровень активности, освещённость, время суток и др.

В моделировании изменчивость, не объяснённая независимой переменной, обозначается как и называется «остаток», «побочный эффект», «ошибка», «необъяснённая часть», «остаточная переменная», «возмущение» или «толеранс».

Примеры

  • Влияние удобрений на рост растений: В исследовании, измеряющем влияние различных количеств удобрений на рост растений, независимой переменной будет количество удобрений, а зависимой — прирост высоты или массы растения. Контролируемыми переменными будут вид растения, тип удобрения, количество солнечного света, размер горшков и т. д.
  • Влияние дозы лекарства на выраженность симптомов: В исследовании влияния различных доз лекарства на выраженность симптомов исследователь может сравнивать частоту и интенсивность симптомов при разных дозах. Здесь независимая переменная — доза, зависимая — частота/интенсивность симптомов.
  • Влияние температуры на пигментацию: При измерении количества пигмента, вымываемого из образцов свёклы при разных температурах, температура — независимая переменная, а количество вымываемого пигмента — зависимая.
  • Влияние сахара на вкус кофе: Вкус меняется в зависимости от количества добавленного сахара. Здесь сахар — независимая переменная, а вкус — зависимая.

Примечания