Medidas de centralización:
Un conjunto de los datos mediante la estadística permite realizar representaciones gráficas, que informan sobre ese conjunto. Además de los gráficos es conveniente resumir dichos datos en un solo número, que nos describan de una manera sencilla el comportamiento y las características de los datos estudiados.
Esos números que resumen los datos se llaman medidas de centralización. Hay varios, nosotros vamos a estudiar tres: la media, la moda y la mediana
La Media:
Media aritmética:
La media aritmética de una variable se
define como la suma ponderada de los valores de la variable por sus
frecuencias relativas y lo denotaremos por y se calcula mediante la expresión:
xi representa el valor de la variable o en su caso la marca de clase.
Propiedades:
Media geométrica:
Es la raíz N-ésima del producto de los N elementos.
Solo se puede calcular si no hay observaciones negativas. Es una medida estadística poco o nada usual. Es útil para calcular medias de porcentajes, tantos por uno,
puntuaciones o índices. Tiene la ventaja de que no es tan sensible como
la media a los valores extremos.
Media armónica:
La media armónica de N observaciones es la inversa de la media de las inversas de las observaciones y la denotaremos por H.
Al igual que en el caso de la media geométrica su utilización es bastante poco frecuente. Suele utilizarse principalmente para calcular la media de velocidades, tiempos o en electrónica.
Por ejemplo:
Un tren realiza un trayecto de 400km. La vía tiene en mal estado que no permitían correr. Los primeros 100 km los recorre a 120km/h, los siguientes 100km la vía está en mal estado y va a 20km/h, los terceros a 100km/h y los 100 últimos a 130km/h. Para calcular el promedio de velocidades, calculamos la media armónica.
La media armónica es de H=52,61km/h.
Se llama moda al valor de la variable de mayor frecuencia
Por ejemplo:
Un tren realiza un trayecto de 400km. La vía tiene en mal estado que no permitían correr. Los primeros 100 km los recorre a 120km/h, los siguientes 100km la vía está en mal estado y va a 20km/h, los terceros a 100km/h y los 100 últimos a 130km/h. Para calcular el promedio de velocidades, calculamos la media armónica.
La Moda:
La moda se puede calcular de todos los tipos de variables aleatorias Si hay más de un valor con mayor frecuencia hay más de una moda.
Por ejemplo:
De
cien personas entrevistadas en la calle 80 llevan falda; 13
pantalones largos y 7 pantalones cortos. ¿Cuál es la moda?
La
moda seria llevar falda.
La Mediana:
La mediana de una colección de datos ordenados de menor a mayor es el valor que está en medio, es
decir que la mitad de los datos son mayores que él y la otra mitad son menores que él, si hay un
número impar de datos; si el número de datos es par, la mediana es la media aritmética entre los dos
valores centrales.
decir que la mitad de los datos son mayores que él y la otra mitad son menores que él, si hay un
número impar de datos; si el número de datos es par, la mediana es la media aritmética entre los dos
valores centrales.
Por lo tanto, la mediana sólo se puede calcular con variables estadísticas de tipo cuantitativo.
Medidas de dispersión:
Al grado en que los datos tienden a extenderse alrededor de la media se le llama variación o dispersión de los datos.
Rango o recorrido:
Es la diferencia entre el valor mayor y el valor menor de la variable estadística.
Por ejemplo:
Los siguientes datos son los tiempos de duración en segundos de 50 conversaciones:
125, 65, 80, 97, 325, 400, 98, 74, 90, 120, 240, 85, 370, 135, 78, 326, 282, 145,
192, 64, 108, 324, 207, 183, 94, 62, 315, 217, 192, 106, 78, 89, 207, 70, 69,
402, 68, 108, 361, 304, 273, 181, 91, 107, 404, 315, 125, 106, 176, 207
192, 64, 108, 324, 207, 183, 94, 62, 315, 217, 192, 106, 78, 89, 207, 70, 69,
402, 68, 108, 361, 304, 273, 181, 91, 107, 404, 315, 125, 106, 176, 207
¿Cual es el rango?
El valor mayor es 404 y el menor es 62; por tanto el rango es 404 - 62 = 342
Desviación media:
Desviación media de una serie de valores es la media aritmética de las diferencias en valor absoluto de cada uno de los valores y la media.
La desviación media es una indicación de cómo están agrupados los datos: si estuviesen muy cercanos unos a otros, situados de forma muy sucesiva, la desviación media sería pequeña; si los datos estuviesen muy lejos unos de otros, o muy desagrupados, por ejemplo formando dos o tres grupos de datos separados entre sí, la desviación media sería grande.
Veamos un ejemplo sencillo para aclarar cuál es el sentido de la desviación media:
Tenemos estos datos: 50, 50
- La media es ( 50 + 50 )/ 2 = 50; la desviación media será [| 50 - 50 | + | 50 - 50 | ] / 2= 0
- Si ahora consideramos los datos: 25, 75. La media es ( 25 + 75 ) / 2 = 50; es la misma media que con los datos anteriores, pero... la desviación media será [ | 50 - 25 | +| 75 - 25 | ] / 2 = 37,5
Varianza:
Varianza de una serie es la media aritmética de las diferencias al cuadrado de cada uno de los valores y la media; es decir, una vez hallada la media, se halla las diferencias entre cada valor individual y la media, esas medidas se elevan al cuadrado; una vez hecho esto, se suman todas y se dividen entre el número de datos.
Variación típica:
Es la raíz cuadrada de la varianza:
No hay comentarios:
Publicar un comentario