CIE EXORDIO CERO MAYA LIBRO LIBRE HUATAPERA PROFESOR ESCRITOR
                          












 



 


     

 

 

 

 

 










.

Varianza y desviación estándar o desviación típica.

 Datos no agrupados

Datos agrupados

Media ponderada de las variaciones

Corrección Sheppard

 

La varianza se define como

 

nótese que la varianza tiene las unidades que tiene los datos al cuadrado. Sin embargo,  si obtenemos la raíz cuadrada positiva tendremos

 

Éste último se conoce como desviación estándar. Debido a que la desviación estándar tiene las mismas unidades que la media, la desviación estándar es más utilizada que la varianza.

 

 Esta notación de  se utiliza para denotar la media y la desviación estándar de una muestra, sin embargo, si la muestra es toda la población se utilizara  , para la media y desviación estándar de una población. Estas dos medidas junto con la media, seguramente, son las más utilizadas en todo análisis estadístico.

 

Otra expresión útil de  ver la desviación varianza es encuentra en el siguiente teorema.

 

Teorema. Se dice que la varianza se puede expresar como:

 

Demostración.

A partir de la definición de la varianza tenemos:

Un teorema que nos permite cambiar de una variable a otra variable lineal es el siguiente.

 

Teorema 2.  Si  entonces la desviación estándar .

 

Demostración.

   La desviación estándar para la variable y es dada por

como  entonces   , por consiguiente

 

 

el resultado anterior nos muestra que si un valor es trasladado una cantidad no tiene por que aumentar, como se observa en el hecho de realizar el cambio  a sin embargo, al multiplicar por a, es decir, las características de la concentración de datos se modificara de pendiendo de a, por ejemplo, si a<1 la información se concentrara alrededor de la media, es decir tendrá menor varianza pero si por el contrario se a>1 la concentración de datos tendera a dispersarse, es decir, tendrá una mayor varianza.

 

Una de la interrogantes es como saber si  el considerar la suma de los cuadrados de la diferencia con respecto a al media es mínima, es decir, no existe otro parámetro, r, que cumpla  lo cual es formulado en el siguiente teorema presentando su respectiva demostración

 

Teorema. La relación considerada para la desviación estándar es mínima, es decir no existe otro parámetro diferente a al media  para el cual  la suma de los cuadrados sea mínima.

 

Demostración.

 

Considérese la diferencia

elevemos al cuadrado lo que nos conduce a la relación

considerando la sumatoria

tenemos

consideremos que en la segunda sumatoria  es una constante y que ,  pero que además es constante por lo que, suponiendo que la suma es con respecto a n datos tendremos:

 

recordamos además el siguiente teorema

entonces tendremos:

como todas las sumas son positivas por tratarse de suma de cuadrados entonces

 

lo que demuestra el teorema.

Esta generalidad de las desviaciones queda expresada como una propiedad propia de la desviación típica

 

 

donde a expresa cualquier promedio aritmético, sin embargo, en el caso en que dicho promedio es la media, como se demostró, este valor es mínimo, es decir, . Debido a esta generalidad es común llamarle a la desviación típica como desviación estándar.

 

Ejemplo:

 

Obtener la varianza y desviación estándar de la siguiente muestra, que nos indica el número de cigarros que son consumidos en promedio al día por un conjunto de 20 encuestados.

 

2

4

10

6

0

4

1

0

3

6

10

2

4

2

3

2

5

5

8

0

 

La media es igual a

a continuación reportamos la tabla de la diferencia de cuadrados  :

3.4225

0.0225

37.8225

4.6225

14.8225

0.0225

8.1225

14.8225

0.7225

4.6225

37.8225

3.4225

0.0225

3.4225

0.7225

3.4225

1.3225

1.3225

17.2225

14.8225

 

Por lo que

 

por lo para determinar la desviación estándar basta con obtener la raíz cuadrada, con lo que finalmente la desviación estándar es igual a:

 

cigarros.