martes, 21 de abril de 2015

Medidas de centralización y dispersión

Medidas de centralización:

Un conjunto de los datos mediante la estadística permite realizar representaciones gráficas, que informan sobre ese conjunto. Además de los gráficos es conveniente resumir dichos datos en un solo número, que nos describan de una manera sencilla el comportamiento y las características de los datos estudiados.

Esos números que resumen los datos se llaman medidas de centralización. Hay varios, nosotros vamos a estudiar tres: la media, la moda y la mediana

La Media:

Media aritmética:


La media aritmética de una variable se define como la suma ponderada de los valores de la variable por sus frecuencias relativas y lo denotaremos por y se calcula mediante la expresión:
xi representa el valor de la variable o en su caso la marca de clase.



Propiedades:

  • Si multiplicamos o dividimos todas las observaciones por un mismo número, la media queda multiplicada o dividida por dicho numero.
  • Si le sumamos a todas las observaciones un mismo número, la media aumentará en dicha cantidad.
  • Además de la media aritmética existen otros conceptos de media, como son la media geométrica y la media armónica.



  • Media geométrica:

    Es la raíz N-ésima del producto de los N elementos. 

    Fórmula de la media geométrica


    Solo se puede calcular si no hay observaciones negativas. Es una medida estadística poco o nada usual. Es útil para calcular medias de porcentajes, tantos por uno, puntuaciones o índices. Tiene la ventaja de que no es tan sensible como la media a los valores extremos.
    Media armónica:

    La media armónica de N observaciones es la inversa de la media de las inversas de las observaciones y la denotaremos por H.
    Al igual que en el caso de la media geométrica su utilización es bastante poco frecuente. Suele utilizarse principalmente para calcular la media de velocidades, tiempos o en electrónica.

    Por ejemplo:

    Un tren realiza un trayecto de 400km. La vía tiene en mal estado que no permitían correr. Los primeros 100 km los recorre a 120km/h, los siguientes 100km la vía está en mal estado y va a 20km/h, los terceros a 100km/h y los 100 últimos a 130km/h. Para calcular el promedio de velocidades, calculamos la media armónica.


    Cálculo de la media armónica en el ejemplo de la velocidad de un tren

    La media armónica es de H=52,61km/h.



    La Moda:
     
    Se llama moda al valor de la variable de mayor frecuencia

    La moda se puede calcular de todos los tipos de variables aleatorias Si hay más de un valor con mayor frecuencia hay más de una moda.

     Por ejemplo:

    De cien personas entrevistadas en la calle 80 llevan falda; 13 pantalones largos y 7 pantalones cortos. ¿Cuál es la moda?

    La moda seria llevar falda.

    La Mediana:
     
    La mediana de una colección de datos ordenados de menor a mayor es el valor que está en medio, es
    decir que la mitad de los datos son mayores que él y la otra mitad son menores que él, si hay un
    número impar de datos; si el número de datos es par, la mediana es la media aritmética entre los dos
    valores centrales.

    Por lo tanto, la mediana sólo se puede calcular con variables estadísticas de tipo cuantitativo.
     
     
    Medidas de dispersión:
     
    Al grado en que los datos tienden a extenderse alrededor de la media se le llama variación o dispersión de los datos.
     
     Rango o recorrido:
     
    Es la diferencia entre el valor mayor y el valor menor de la variable estadística.
     
    Por ejemplo:

    Los siguientes datos son los tiempos de duración en segundos de 50 conversaciones: 
     
    125, 65, 80, 97, 325, 400, 98, 74, 90, 120, 240, 85, 370, 135, 78, 326, 282, 145,
    192, 64, 108, 324, 207, 183, 94, 62, 315, 217, 192, 106, 78, 89, 207, 70, 69,
    402, 68, 108, 361, 304, 273, 181, 91, 107, 404, 315, 125, 106, 176, 207           

    ¿Cual es el rango?

    El valor mayor es 404 y el menor es 62; por tanto el rango es 404 - 62 = 342

    Desviación media:
     
     Desviación media de una serie de valores es la media aritmética de las diferencias en valor absoluto de cada uno de los valores y la media.
      
    La desviación media es una indicación de cómo están agrupados los datos: si estuviesen muy cercanos unos a otros, situados de forma muy sucesiva, la desviación media sería pequeña; si los datos estuviesen muy lejos unos de otros, o muy desagrupados, por ejemplo formando dos o tres grupos de datos separados entre sí, la desviación media sería grande.
     
    Veamos un ejemplo sencillo para aclarar cuál es el sentido de la desviación media:
     
    Tenemos estos datos: 50, 50
    1. La media es ( 50 + 50 )/ 2 = 50; la desviación media será [| 50 - 50 | + | 50 - 50 | ] / 2= 0 
    2. Si ahora consideramos los datos: 25, 75. La media es ( 25 + 75 ) / 2 = 50; es la misma media que con los datos anteriores, pero... la desviación media será [ | 50 - 25 | +| 75 - 25 | ] / 2 = 37,5
    Es decir, con la misma media, la desviación media es muy diferente, porque los datos son muy distintos, están situados de forma muy distinta.
     
    Varianza: 
     
     Varianza de una serie es la media aritmética de las diferencias al cuadrado de cada uno de los valores y la media; es decir, una vez hallada la media, se halla las diferencias entre cada valor individual y la media, esas medidas se elevan al cuadrado; una vez hecho esto, se suman todas y se dividen entre el número de datos.
     
     
     
    Variación típica: 
      Es la raíz cuadrada de la varianza:






    No hay comentarios:

    Publicar un comentario