jueves, 19 de junio de 2008

MEDIDAS DE DISPERSION O VERIABILIDAD

Breve Introducción
Hasta el momento hemos estudiado los valores centrales de la distribución, pero también es importante conocer si los valores en general están cerca o alejados de estos valores centrales, es por lo que surge la necesidad de estudiar medidas de dispersión. Rango:
Es la primera medida que vamos a estudiar, se define como la diferencia existente entre el valor mayor y el menor de la distribución,. Lo notaremos como R. Realmente no es una medida muy significativa e la mayoría de los casos, pero indudablemente es muy fácil de calcular.

La primera solución puede ser calcular la media de todas las desviaciones, es decir, si consideramos como muestra la de todas las desviaciones y calculamos su media. Pero esta solución es mala pues como veremos siempre va a ser 0.
Luego por lo tanto esta primera idea no es valida, pues las desviaciones positivas se contrarrestan con las negativas.
Para resolver este problema, tenemos dos caminos:
Tomar el valor absoluto de las desviaciones. Desviación media
Elevar al cuadrado las desviaciones. Varianza.
Desviación media:
Es la media de los valores absolutos de las desviaciones, y la denotaremos por dm.

Varianza:
Es la media de los cuadrados de las desviaciones, y la denotaremos por o también por .
Aunque también es posible calcularlo como:
Este estadístico tiene el inconveniente de ser poco significativo, pues se mide en el cuadrado de la unidad de la variable, por ejemplo, si la variable viene dada en cm. La varianza vendrá en cm2.


Desviación típica:
Es la raíz cuadrada de la varianza, se denota por Sx o s x.

Este estadístico se mide en la misma unidad que la variable por lo que se puede interpretar mejor.
Otros dos estadísticos importantes son la cuasivarianza y la cuasidesviación típica, que como veremos cuando estudiemos el tema de estimación estadística, son los estimadores de la varianza y desviación típica poblacionales respectivamente.
Cuasivarianza:
Es una medida de dispersión, cuya única diferencia con la varianza es que dividimos por N-1, la representaremos por o y la calcularemos de la siguiente forma:

Cuasidesviación típica:
La raíz cuadrada de la cuasivarianza y la denotaremos por SN—1 o s N-1.
Todas estas medidas de dispersión vienen influidas por la unidad en la que se mide la variable, esto implica que si cambiamos de unidad de medida, los valores de estos estadísticos se vean a su vez modificados. Además, no permite comparar por ejemplo, en un grupo de alumnos si los pesos o las alturas presentan mas dispersión. Pues no es posible comparar unidades de distinto tipo.
Precisamos por lo tanto, una medida "escalar", es decir, que no lleve asociado ninguna unidad de medida.
Coeficiente de Variación:
Es un estadístico de dispersión que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitirá decir entre dos muestras, cual es la que presenta mayor dispersión. La denotaremos por C.V.

Ejemplo
Veamos por último un ejemplo de cómo se calculan todas estas medidas.

45
55
6
6
50
300
-19,4
116,4
2258,16
15000
55
65
10
16
60
600
-9,4
94
883,6
36000
65
75
19
35
70
1330
0,6
11,4
6,84
93100
75
85
11
46
80
880
10,6
116,6
1235,96
70400
85
95
4
50
90
360
20,6
82,4
1697,44
32400
N=
50
3470
420,8
6082
246900
=
Dm=
=

C.V.=