Cómo eliminar valores atípicos en SPSS

Los valores atípicos en los análisis estadísticos son valores extremos que no parecen encajar con la mayoría de un conjunto de datos. Si no se eliminan, estos valores extremos pueden tener un gran efecto en cualquier conclusión que se pueda extraer de los datos en cuestión, ya que pueden sesgar los coeficientes de correlación y las líneas de mejor ajuste en la dirección incorrecta. SPSS es uno de varios programas de software de análisis estadístico que se pueden utilizar para interpretar un conjunto de datos e identificar y eliminar valores atípicos.

Análisis de datos exploratorios

Paso 1

Haz clic en "Analizar". Seleccione "Estadísticas descriptivas" seguido de "Explorar".

Paso 2

Arrastre y suelte las columnas que contienen los datos de la variable dependiente en el cuadro denominado "Lista de dependientes". Haz clic en "Aceptar".

Paso 3

Elimine cualquier valor atípico identificado por SPSS en los diagramas de tallo y hojas o en los diagramas de caja eliminando los puntos de datos individuales. Alternativamente, puede configurar un filtro para excluir estos puntos de datos.

Paso 4

Seleccione "Datos" y luego "Seleccionar casos" y haga clic en una condición que tenga valores atípicos que desee excluir. Determine un valor para esta condición que excluya solo los valores atípicos y ninguno de los puntos de datos no atípicos.

Paso 5

Elija "Si se cumple la condición" en el cuadro "Seleccionar" y luego haga clic en el botón "Si" justo debajo. Ingrese la regla para excluir los valores atípicos que determinó en el paso anterior en el cuadro en la parte superior derecha. Por ejemplo, si estuviera excluyendo medidas superiores a 74,5 pulgadas de la condición "altura", ingresaría "altura <=74,5". Haga clic en "Continuar" y "Aceptar" para activar el filtro.

Análisis de regresión

Paso 1

En el menú "Analizar", seleccione "Regresión" y luego "Lineal". Seleccione las variables dependientes e independientes que desea analizar.

Paso 2

Haga clic en "Guardar" y luego seleccione "Distancia de Cook". Los valores calculados para la distancia de Cook se guardarán en su archivo de datos como variables etiquetadas como "COO-1".

Paso 3

Ejecute un diagrama de caja seleccionando "Gráficos" seguido de "Diagrama de caja". Haga clic en "Simple" y seleccione "Resúmenes de variables separadas". Ingrese "COO-1" en el cuadro "Representación de cuadros" y luego ingrese una identificación o nombre por el cual identificar los casos en el cuadro "Etiquetar casos por".

Paso 4

Amplíe el diagrama de caja en el archivo de salida haciendo doble clic en él. Tome nota de los casos que se encuentran más allá de las líneas negras:estos son sus valores atípicos. Puede optar por eliminar todos los valores atípicos o solo los valores atípicos extremos, que están marcados con una estrella (*).

Paso 5

Vuelva al archivo de datos y localice los casos que deben borrarse. Trabajando de abajo hacia arriba, resalte el número en el extremo izquierdo, en la columna gris, para que se seleccione toda la fila. Haga clic en "Editar" y seleccione "Borrar". Repita este paso para cada valor atípico que haya identificado en el diagrama de caja.

Advertencia

Cuando borre casos en la Sección 2, paso 5, siempre trabaje desde la parte inferior del archivo de datos hacia arriba porque los números de identificación cambian cuando borra un caso. Si trabaja de arriba hacia abajo, terminará borrando los casos equivocados.