Calidad

 Medidas descriptivas ¿ Posición  ¿    Centralización   ¿   Dispersión  ¿  Forma ¿  Ejemplo 1 ¿  Ejemplo 2   ¿  Calculadoras    ¿   Resumen de Fórmulas

 

 

 

 Medidas descriptivas

Las medidas descriptivas son valores numéricos calculados a partir de la muestra y que nos resumen la información contenida en ella.

  

Arriba

 

 Medidas de Posición: Cuantiles

Los cuantiles son valores de la distribución que la dividen en partes iguales, es decir, en intervalos, que comprenden el mismo número de valores. Los más usados son los cuartiles, los deciles y los percentiles.

 u PERCENTILES: son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Ejemplo, el percentil de orden 15 deja por debajo al 15% de las observaciones, y por encima queda el 85%

 u CUARTILES: son los tres valores que dividen al conjunto de datos ordenados en cuatro partes iguales, son un caso particular de los percentiles:

- El primer cuartil Q 1 es el menor valor que es mayor que una cuarta parte de los datos
- El segundo cuartil Q 2 (la mediana), es el menor valor que es mayor que la mitad de los datos
- El tercer cuartil Q 3 es el menor valor que es mayor que tres cuartas partes de los datos

 u DECILES: son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son también un caso particular de los percentiles.

    Ejemplo:

Dada la siguiente distribución en el número de hijos (Xi) de cien familias, calcular sus cuartiles.

 

xi ni Ni
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100
  n=100  

Solución:

1.
Primer cuartil:
\begin{displaymath}\displaystyle \frac{n}{4} =25; \mbox{ Primera }N_i>n/4 = 39; \mbox{ luego }
{\cal Q}_1=2.
\end{displaymath}
2.
Segundo cuartil:
\begin{displaymath}\displaystyle \frac{2\, n}{4} =50; \mbox{ Primera }N_i>2\,n/4 = 65
; \mbox { luego } {\cal Q}_2=3.
\end{displaymath}
3.
Tercer cuartil:
\begin{displaymath}\displaystyle \frac{3\, n}{4} =75;
\mbox{ Primera }N_i>3\,n/4 = 85; \mbox{ luego }{\cal Q}_3=4.
\end{displaymath}
 

Arriba

 

 Medidas de Centralización

Nos dan un centro de la distribución de frecuencias, es un valor que se puede tomar como representativo de todos los datos. Hay diferentes modos para definir el "centro" de las observaciones en un conjunto de datos. Por orden de importancia, son:

 u MEDIA : (media aritmética o simplemente media). es el promedio aritmético de las observaciones, es decir, el cociente entre la suma de todos los datos y el numero de ellos. Si xi es el valor de la variable y ni su frecuencia, tenemos que:

Si los datos están agrupados utilizamos las marcas de clase, es decir ci en vez de xi.

 

 u MEDIANA (Me):es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son menores que la mediana  y el otro 50% son mayores. Si el número de datos es impar la mediana será el valor central, si es par tomaremos como mediana la media aritmética de los dos valores centrales.

 u MODA (M0): es el valor de la variable que más veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. No tiene porque ser única.

Arriba

 

 Medidas de Dispersión

Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras.

MEDIDAS DE DISPERSIÓN ABSOLUTAS

 u VARIANZA ( s2 ): es el promedio del cuadrado de las distancias entre cada observación y la media aritmética del conjunto de observaciones.

   

Haciendo operaciones en la fórmula anterior obtenemos otra fórmula para calcular la varianza:

Si los datos están agrupados utilizamos las marcas de clase en lugar de Xi.

 u DESVIACIÓN TÍPICA (S): La varianza viene dada por las mismas unidades que la variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersión la desviación típica que se define como la raíz cuadrada positiva de la varianza

Para estimar la desviación típica de una población a partir de los datos de una muestra se utiliza la fórmula (cuasi desviación típica):

 u RECORRIDO O RANGO MUESTRAL (Re). Es la diferencia entre el valor de las observaciones mayor y el menor.  Re = xmax - xmin

MEDIDAS DE DISPERSIÓN RELATIVAS

 u COEFICIENTE DE VARIACIÓN DE PEARSON: Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variación de Pearson que se define como el cociente entre la desviación típica y el valor absoluto de la media aritmética

CV representa el número de veces que la desviación típica contiene a la media aritmética y por lo tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de la media.

 

Arriba

 

  Medidas de Forma

Comparan la forma que tiene la representación gráfica, bien sea el histograma o el diagrama de barras de la distribución, con la distribución normal.

MEDIDA DE ASIMETRÍA

Diremos que una distribución es simétrica cuando su mediana, su moda y su media aritmética coinciden.

Diremos que una distribución es asimétrica a la derecha si las frecuencias (absolutas o relativas) descienden más lentamente por la derecha que por la izquierda.

Si las frecuencias descienden más lentamente por la izquierda que por la derecha diremos que la distribución es asimétrica a la izquierda.

Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas es el Coeficiente de Asimetría de Pearson:

Su valor es cero cuando la distribución es simétrica, positivo cuando existe asimetría a la derecha y negativo cuando existe asimetría a la izquierda.

 

MEDIDA DE APUNTAMIENTO O CURTOSIS

   Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos de distribuciones según su grado de curtosis:

   Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal). Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable. Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable.

 

Arriba

 

  EJEMPLO 1 

El número de diás necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales características han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 días. Calcular la media, mediana, moda, varianza y desviación típica.

SOLUCIÓN:

  La media: suma de todos los valores de una variable dividida entre el número total de datos de los que se dispone:

 La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:

15, 21, 32, 59, 60, 60,61, 64, 71, 80.

Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los dos valores que se encuentran en el medio son 60 y 60. Si realizamos el cálculo de la media de estos dos valores nos dará a su vez 60, que es el valor de la mediana.

La moda: el valor de la variable que presenta una mayor frecuencia es 60

La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución.

Sx2=

 La desviación típica S: es la raíz cuadrada de la varianza.

S = √ 427,61 = 20.67

 El rango: diferencia entre el valor de las observaciones mayor y el menor

80 - 15 = 65 días

 El coeficiente de variación: cociente entre la desviación típica y el valor absoluto de la media aritmética

CV = 20,67/52,3 = 0,39

 

Arriba

 

  EJEMPLO 2 

   El precio de un interruptor magentotérmico en 10 comercios de electricidad de una ciudad son : 25, 25, 26, 24, 30, 25, 29, 28, 26, y 27 Euros. Hallar la media, moda, mediana, (abrir la calculadora estadística, más abajo) diagrama de barras y el diagrama de caja.

SOLUCIÓN:

(Utilizar la calculadora de debajo)

[El diagrama de cajas: caja desde Q1 a Q3 (50% de los datos), bigotes el recorrido]

 

Arriba

 Arriba

Ir a Calculadora Estadística

 

 Arriba

 

   Resumen de Fórmulas 

 

 

Arriba  

Arriba