CIE EXORDIO CERO MAYA LIBRO LIBRE HUATAPERA PROFESOR ESCRITOR
                          












 



 


     

 

 

 

 

 










.

Datos influyentes

 

 

Un aspecto importante es el hecho que existe en cuanto puede influir un dato en todo un resultado, así por ejemplo, veamos que sucede con el siguiente conjunto de datos

 

Datos X

Datos Y

0.5

0.5

1.21

1.21

1.21

0.5

2

1.21

0.16

-0.44

2

0.5

0.16

1.21

-0.44

2

2

0.16

0.16

0.16

3

3

1.96

1.96

1.96

 

 

 

Por lo que el coeficiente de correlación es igual a

 

Su posible gráfico se observa  a continuación.

 

sin embargo, observamos que este valor se modifica notoriamente, si quitamos el último valor, es decir, considerando los siguientes datos tendremos:

 

Datos X

Datos Y

0.5

0.5

0.5625

0.5625

0.5625

0.5

2

0.5625

0.5625

-0.5625

2

0.5

0.5625

0.5625

-0.5625

2

2

0.5625

0.5625

0.5625

 

 

El coeficiente de correlación es igual a cero, lo que indica que el dato de la primera tabla si afectaba considerablemente la información. A este tipo de datos es común llamarle datos influyentes.

El gráfico para los datos sin incluir el último dato es el siguiente:

 

 

 

En el siguiente ejemplos e observa más claramente como determina un resultado un dato influyente:

 

Datos X

Datos Y

1

1

3.24

3.24

3.24

1

2

3.24

0.64

1.44

2

1

0.64

3.24

1.44

2

2

0.64

0.64

0.64

8

8

27.04

27.04

27.04

 

 

 

 

Por lo que el coeficiente de correlación es igual a

 

Su gráfico se puede apreciar a continuación:

 

¿Cómo serán sus valores si eliminamos el último dato?

 

Datos X

Datos Y

1

1

0.25

0.25

0.25

1

2

0.25

0.25

-0.25

2

1

0.25

0.25

-0.25

2

2

0.25

0.25

0.25

 

 

Por lo que la correlación es igual a cero, como se puede apreciar a continuación:

 

En este último ejemplo se observa que incluyendo el último dato la relación es casi lineal ya que el coeficiente de correlación de Pearson es casi uno, mientras que si no incluimos el último se nota una independencia nula. Por comodidad se ha colocado el dato influyente, pero este puede aparecer en cualquier posición, ya que no existe una preferencia en la posición.