Cómo utilizar variables ficticias en la regresión de Excel

El popular programa Excel de Microsoft tiene capacidades de análisis de datos que incluyen la realización de análisis de regresión con variables ficticias. Las variables ficticias son variables categóricas expresadas numéricamente como 1 o 0 para indicar la presencia o ausencia de una cualidad o característica particular. Excel no requiere ninguna función especial cuando un modelo de regresión incluye una variable ficticia entre las variables independientes. Sin embargo, los modelos de regresión con variables ficticias dependientes requieren complementos adicionales, programas que amplían las opciones y características de Excel.

Regresión con variables ficticias usando Excel

Paso 1

Cargue la herramienta de análisis de datos desde los complementos de Excel, incluidos en todas las versiones de Excel. Debe hacer esto para realizar una regresión o cualquier otro tipo de análisis de datos. Al hacer clic en "Herramientas" se abre un menú desplegable. Seleccione "Complementos" y, en el menú que se abre, marque "Analysis ToolPak" y haga clic en "Aceptar". "Análisis de datos" debería aparecer en el menú Herramientas.

Paso 2

Ingrese los datos que usará para su regresión en una hoja de cálculo de Excel, codificando cualquier variable ficticia con el valor 1 o 0, dependiendo de si el sujeto tiene la característica en cuestión. El género es un ejemplo de variable ficticia, ya que los sujetos de un estudio pueden ser solo hombres o mujeres. Un estudio de los puntajes del examen de ingreso a la universidad que incluyera el género de los sujetos, por ejemplo, podría codificar a las estudiantes con un 1. El uso de variables ficticias entre sus variables independientes no requiere funciones especiales en Excel. Recuerde que si una variable ficticia tiene solo dos categorías (como hombre o mujer), solo se necesita una variable para representar las dos categorías.

Paso 3

Codifique variables categóricas con más de dos categorías como múltiples variables ficticias, asegurándose de que el número de variables sea uno menos que el número de categorías (n-1, en términos estadísticos). Por ejemplo, la categoría etnicidad expresada en cinco niveles (blanco, negro, hispano, asiático, indio americano) requeriría cuatro variables ficticias separadas. Por ejemplo, si estuviera estudiando los puntajes del examen de ingreso a la universidad, podría crear las siguientes variables ficticias:negro, hispano, asiático e indio americano, codificando cada una con un 1 si el estudiante en cuestión se ajusta a esa categoría étnica.

Paso 4

Expanda la capacidad de regresión de Excel con variables ficticias con un complemento que permitirá que el programa realice regresiones con variables dependientes ficticias. Uno de estos programas es XLStat, disponible para compra y descarga del fabricante, Addinsoft. Programas como este le permiten realizar regresiones en las que la variable dependiente toma los valores 1 o 0.

Advertencia

Un error común entre los principiantes es utilizar tantas variables ficticias como categorías (como, por ejemplo, dos variables ficticias para hombre y mujer). Tal enfoque crearía multicolinealidad, en la cual dos variables independientes están altamente correlacionadas, haciendo casi imposible determinar sus efectos separados en la variable dependiente. Recuerde que el número de variables ficticias siempre debe ser uno menos que el número de categorías.