Factor De Inflación De Varianza (Vif)

Índice
  1. ¿Qué es el factor de inflación de varianza (VIF)?
  2. Comprender el factor de inflación de varianza (VIF)
    1. problema de multicolinealidad
    2. Pruebas para resolver la multicolinealidad
  3. Fórmula y cálculo de VIF
  4. ¿Qué pueden decirle los VIF?
  5. Ejemplo usando VIF
  6. ¿Qué es un buen valor VIF?
  7. ¿Qué significa un VIF de 1?
  8. ¿Para qué se utilizan los VIF?
  9. línea de fondo

¿Qué es el factor de inflación de varianza (VIF)?

El factor de inflación de la varianza (VIF) es una medida de la cantidad de multicolinealidad en un conjunto de regresores múltiples. Matemáticamente, el VIF de una variable del modelo de regresión es igual a la relación entre la varianza general del modelo y la varianza de un modelo que incluye solo esa única variable independiente. La razón se calcula para cada variable independiente. Un VIF alto indica que la variable independiente dependiente es altamente colineal con otras variables en el modelo.

  • El factor de inflación de varianza (VIF) proporciona una medida de multicolinealidad entre variables independientes en un modelo de regresión múltiple.
  • La detección de la multicolinealidad es importante porque, si bien la multicolinealidad no reduce el poder explicativo del modelo, reduce la significación estadística de las variables independientes.
  • Los factores de inflación de varianza grande (VIF) en las variables independientes indican un alto grado de colinealidad con otras variables, que deben tenerse en cuenta o ajustarse en la estructura del modelo y la selección de la variable independiente.

Comprender el factor de inflación de varianza (VIF)

El factor de inflación de la varianza es una herramienta para ayudar a determinar el grado de multicolinealidad. La regresión múltiple se usa cuando se quiere probar el efecto de múltiples variables en un resultado particular. La variable dependiente es el resultado de la acción de la variable independiente: la entrada al modelo. La multicolinealidad existe cuando existe una relación o correlación lineal entre una o más variables o entradas independientes.

problema de multicolinealidad

La multicolinealidad crea un problema en los modelos de regresión múltiple porque todas las entradas se afectan entre sí. Por lo tanto, en realidad no son independientes y es difícil probar cuánto afecta una combinación de variables independientes a la variable dependiente o al resultado en un modelo de regresión.

Si bien la multicolinealidad no reduce el poder predictivo general del modelo, produce estimaciones estadísticamente insignificantes de los coeficientes de regresión. En cierto sentido, se puede considerar como una especie de doble cálculo en el modelo.

En términos estadísticos, un modelo de regresión múltiple con un alto grado de multicolinealidad hará más difícil estimar la relación entre cada variable independiente y la variable dependiente. En otras palabras, cuando dos o más variables independientes están estrechamente relacionadas o miden casi lo mismo, el efecto subyacente que miden se explica dos veces (o más) en la variable. Es difícil o imposible saber qué variable afecta realmente a la variable independiente.

Pequeños cambios en los datos utilizados o en la estructura de las ecuaciones del modelo pueden causar cambios grandes e inestables en los coeficientes estimados de las variables independientes. Esto es un problema porque el objetivo de muchos modelos econométricos es probar con precisión esta relación estadística entre las variables independientes y dependientes.

Pruebas para resolver la multicolinealidad

Para asegurarse de que el modelo esté correctamente especificado y funcione correctamente, puede ejecutar algunas pruebas de multicolinealidad. El factor de inflación de la varianza es una de esas herramientas de medición. El uso de un factor de inflación de varianza ayuda a identificar la gravedad de cualquier problema de multicolinealidad para que el modelo pueda ajustarse. El factor de inflación de la varianza mide cuánto se ve afectado o inflado el comportamiento (varianza) de una variable independiente por sus interacciones/correlaciones con otras variables independientes.

El factor de inflación de la varianza permite una medida rápida de cuánto contribuye una variable al error estándar de la regresión. Cuando existe un problema significativo de multicolinealidad, el factor de inflación de la varianza de las variables involucradas será muy grande. Una vez identificadas estas variables, existen varios métodos que se pueden utilizar para eliminar o combinar las variables colineales, resolviendo así el problema de la multicolinealidad.

Fórmula y cálculo de VIF

La fórmula para VIF es:

donde RUna generación2representa el coeficiente de determinación no ajustado para la regresión ielvariables independientes para el resto de variables.

¿Qué pueden decirle los VIF?

cuando rUna generación2es igual a 0, por lo que cuando VIF o tolerancia es igual a 1, ielLa variable independiente no está correlacionada con el resto de variables, lo que significa que no hay multicolinealidad. 1

general,

  • VIF igual a 1 = las variables no están correlacionadas
  • VIF entre 1 y 5 = la variable está moderadamente correlacionada
  • VIF mayor que 5 = las variables están altamente correlacionadas 2

Cuanto mayor sea el VIF, mayor será la posibilidad de multicolinealidad, lo que requiere más estudio. Cuando VIF es mayor que 10, existe una multicolinealidad significativa que debe corregirse. 1

Ejemplo usando VIF

Por ejemplo, suponga que un economista quiere probar si existe una relación estadísticamente significativa entre el desempleo (la variable independiente) y la inflación (la variable dependiente). La inclusión de variables independientes adicionales relacionadas con el desempleo, como nuevas solicitudes iniciales de desempleo, puede introducir multicolinealidad en el modelo.

El modelo completo puede mostrar un poder explicativo fuerte y estadísticamente suficiente, pero es imposible determinar si el efecto se debe principalmente a la tasa de desempleo o a las nuevas solicitudes iniciales de desempleo. Eso es lo que detectará el VIF, lo que sugiere que una de las variables podría eliminarse del modelo, o que se encuentra alguna forma de consolidarlas para capturar su efecto combinado en función de la hipótesis específica que el investigador está interesado en probar.

¿Qué es un buen valor VIF?

Como regla general, los VIF de 3 o menos no son motivo de preocupación. A medida que aumenta el VIF, menos fiables serán los resultados de la regresión.

¿Qué significa un VIF de 1?

Un VIF igual a 1 significa que las variables no están correlacionadas y que no hay multicolinealidad en el modelo de regresión.

¿Para qué se utilizan los VIF?

VIF mide la fuerza de la correlación entre variables independientes en el análisis de regresión. Esta correlación se denomina multicolinealidad y puede causar problemas con los modelos de regresión.

línea de fondo

Si bien la multicolinealidad moderada es aceptable en los modelos de regresión, una multicolinealidad más alta puede ser motivo de preocupación.

Se pueden tomar dos acciones para corregir la alta multicolinealidad: Primero, se pueden eliminar una o más variables altamente correlacionadas porque la información proporcionada por estas variables es redundante. El segundo enfoque consiste en reemplazar la regresión OLS con análisis de componentes principales o regresión de mínimos cuadrados parciales, que pueden reducir las variables individualmente a un conjunto más pequeño sin correlación, o crear nuevas variables no correlacionadas. Esto mejorará la previsibilidad del modelo. 1

Entradas relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir

Este sitio web utiliza cookies