viernes, 22 de julio de 2011

guia sobre medidas de dispersion

UNIVERSIDAD ALEJANDRO DE HUMBOLDT
CATEDRA ESTADÍSTICA


Medidas de dispersión
A pesar de la gran importancia de las medidas de tendencia central y de la cantidad de información que aportan individualmente, no hay que dejar de señalar que en muchas ocasiones esa información, no sólo no es completa, sino que puede inducir a errores en su interpretación.
Medidas de dispersión : mide que tanto se dispersan las observaciones alrededor de su media.
Ejemplo: se toman por ejemplo los tres conjuntos de datos que se observan acontinuacion.
Conjunto de datos 1: 0,5,10
Conjunto de datos 2: 4,5,6
Conjunto de datos 3: 5,5,5
·         Los tres (3) tienen una media de cinco (5)

¿ Se debe por tanto concluir que los conjuntos de datos son similares ?

Hay 2 tipos de medidas de dispersión , que son:
1.      Medidas dispersión absolutas
2.      Medidas dispersión relativa

1.      Medidas dispersión absoluta:
·   Rango o Recorrido
·  Rango o recorrido intercuartilico
·  Desviación media
·  Desviación estándar o típica
· Varianza
· Desigualdad de tchebycheff
· Estandarización

Medidas de dispersión absoluta ( viene expresada en el mismo valor de la variable)

2.      Medidas de dispersión relativa:
·         Coeficiente de variación
Medidas de dispersión relativa ( viene expresada en porcentaje)


Ø  Rango :  valor máximo- valor mínimo
Ø  Rango intercuartílico:   Q3-Q1

Donde:
Q3 = tercer cuartil
Fórmula de Q3, para series de Datos agrupados:
Donde:
L1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase.
Otra manera de verlo es partir de que todas las medidas no son sino casos particulares del percentil, ya que el primer cuartil es el 25% percentil y el tercer cuartil 75% percentil.

Fórmula de Q1, para series de Datos agrupados:
Q1= primer cuartil:

Donde:
L1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase
·         El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de los datos, es decir aquel valor de la variable que supera al 75% y es superado por el 25% de las observaciones.

El cuartíl es un indicador de posición.

El indicador de posición: son indicadores para señalar que porcentaje de datos dentro, de una distribución de frecuencia superan esta expresión.

= posición del q1, la cual se localiza en la primera frecuencia  acumulada que la
    4         contenga , siendo la clase q1, la correspondiente a tal frecuencia acumulada.


Ø Rango semi-intercuartiliico:   Q3 - Q1
                                              2

Ø    Desviación media

Formula general para datos simples
donde  xi= datos de la serie
                                                                                        N = numero de datos
                                                                                         a= , Md o moda




Ejemplo
Calcular la desviación media de la distribución:
9, 3, 8, 8, 9, 8, 9, 18

Desviación media para datos agrupados
Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la desviación media es:






Ejemplo

Calcular la desviación media de la distribución:
Ø Desviación típica o estandar
La desviación típica es la raíz cuadrada de la varianza.
Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación.
La desviación típica se representa por σ.

Desviación típica para datos agrupados

Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Desviación típica para datos agrupados

Ejemplo:

Calcular la desviación típica de la distribución:
9, 3, 8, 8, 9, 8, 9, 18

Calcular la desviación típica de la distribución de la tabla:

Propiedades de la desviación típica:

1 La desviación típica será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
2 Si a todos los valores de la variable se les suma un número la desviación típica no varía.
3 Si todos los valores de la variable se multiplican por un número la desviación típica queda multiplicada por dicho número.
4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones típicas se puede calcular la desviación típica total.
Ø varianza
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.
La varianza se representa por .
Varianza para datos agrupados
Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.


Varianza para datos agrupados

Ejercicios de varianza

Calcular la varianza  para datos no agrupados:
9, 3, 8, 8, 9, 8, 9, 18
Calcular la varianza de la distribución de la tabla:

Propiedades de la varianza

1 La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
2 Si a todos los valores de la variable se les suma un número la varianza no varía.
3 Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho número.
4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total.
Si todas las muestras tienen el mismo tamaño:
Si las muestras tienen distinto tamaño:

Observaciones sobre la varianza:

1 La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas.
2 En los casos que no se pueda hallar la media tampoco será posible hallar la varianza.
3 La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones están elevadas al cuadrado.

No hay comentarios:

Publicar un comentario en la entrada