miércoles, 5 de diciembre de 2012

Medidas de centralización

 La mediana, representa el valor de la variable de posición central en un conjunto de datos ordenados. De acuerdo con esta definición el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del total de datos de la muestra.  Su cálculo no se ve afectado por valores extremos.


Es el valor medio en un conjunto de valores ordenados.Los pasos son:
  1. Ordena los valores en orden del menor al mayor
  2. Cuenta de derecha a izquierda, o al revés, hasta encontrar el valor o valores medios.
Ejemplo: tenemos el siguiente conjunto de números 8,3,7,4,11,2,9,4,10,11,4 ordenamos: 2,3,4,4,4,7,8,9,10,11,11 En esta secuencia la mediana es 7, que es el número central. Y si tuviésemos: 8,3,7,4,11,9,4,10,11,4, entonces ordenamos: 3,4,4,4,7,8,9,10,11,11 y la mediana (Md) está en: los números centrales son 7 y 8, lo que haces es sumar 7 + 8 y divides entre 2 y Md= 7.5.
Existen dos métodos para el cálculo de la mediana:
  1. Considerando los datos en forma individual, sin agruparlos.
  2. Utilizando los datos agrupados en intervalos de clase.

La media aritmética (también llamada promedio o simplemente media) de un conjunto finito de números es el valor característico de una serie de datos cuantitativos objeto de estudio que parte del principio de la esperanza matemática o valor esperado, se obtiene a partir de la suma de todos sus valores dividida entre el número de sumandos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestral siendo uno de los principales estadísticos muestrales.
Expresada de forma más intuitiva, podemos decir que la media (aritmética) es la cantidad total de la variable distribuida a partes iguales entre cada observación.
Por ejemplo, si en una habitación hay tres personas, la media de dinero que tienen en sus bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la información de una distribución (dinero en el bolsillo) suponiendo que cada observación (persona) tuviera la misma cantidad de la variable.
También la media aritmética puede ser denominada como centro de gravedad de una distribución, el cual no está necesariamente en la mitad.
Una de las limitaciones de la media aritmética es que se trata de una medida muy sensible a los valores extremos; valores muy grandes tienden a aumentarla mientras que valores muy pequeños tienden a reducirla, lo que implica que puede dejar de ser representativa de la población.


La moda es el valor con una mayor frecuencia en una distribución de datos.
Hablaremos de una distribución bimodal de los datos adquiridos en una columna cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Una distribución trimodal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda.
El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos agrupados antes de definir la moda, se ha de definir el intervalo modal.
La moda, cuando los datos están agrupados, es un punto que divide al intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:
\frac{p}{c-p}=\frac{n_i-n_{i-1} }{n_i-n_{i+1} }
Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al intervalo modal.
\gamma n_{i-1} \gamma n_{i+1}


Para obtener la moda en datos agrupados se usa la siguiente fórmula:
M = L_{i-1} + \left( \frac{D_1}{D_1+D_2} \right)i
Donde:
L_{i-1} = L-inferior de la clase modal.
D_1 = es el delta de frecuencia absoluta modal y la frecuencia absoluta premodal.
D_2 = es el delta de frecuencia absoluta modal y la frecuencia absoluta postmodal.
i = intervalo

No hay comentarios:

Publicar un comentario