Medidas descriptivas
Las medidas descriptivas son valores numéricos
calculados a partir de la muestra y que nos resumen la información
contenida en ella.


Medidas de Posición: Cuantiles
Los
cuantiles son valores de la distribución que la dividen en partes
iguales, es decir, en intervalos, que comprenden el mismo número de
valores. Los más usados son los cuartiles, los deciles y los
percentiles.
u
PERCENTILES:
son
99 valores que dividen en cien partes iguales el conjunto de datos
ordenados.
Ejemplo, el percentil de orden 15 deja por debajo al 15% de las
observaciones, y por encima queda el 85%
•
u
CUARTILES:
son los tres
valores que dividen al conjunto de datos ordenados en cuatro partes
iguales, son un caso particular de los percentiles:
- El primer
cuartil Q 1 es el menor valor que es mayor que una
cuarta parte de los datos
- El segundo cuartil Q 2 (la mediana), es el menor valor
que es mayor que la mitad de los datos
- El tercer cuartil Q 3 es el menor valor que es mayor
que tres cuartas partes de los datos |
u
DECILES:
son
los nueve valores que dividen al conjunto de datos ordenados en diez
partes iguales, son también un caso particular de los percentiles.
Ejemplo:
Dada la siguiente distribución en el número de hijos
(Xi) de cien familias, calcular sus cuartiles.
xi |
ni |
Ni |
0 |
14 |
14 |
1 |
10 |
24 |
2 |
15 |
39 |
3 |
26 |
65 |
4 |
20 |
85 |
5 |
15 |
100 |
|
n=100 |
|
Solución:
- 1.
- Primer cuartil:
- 2.
- Segundo cuartil:
- 3.
- Tercer cuartil:

Medidas de Centralización
Nos
dan un centro de la distribución de frecuencias, es un valor que se
puede tomar como representativo de todos los datos. Hay diferentes
modos
para definir el "centro" de las observaciones en un conjunto de
datos. Por orden de importancia, son:
u
MEDIA : (media
aritmética
o simplemente
media). es el promedio aritmético de las observaciones, es decir, el
cociente entre la suma de todos los datos y el numero de ellos.
Si xi es el valor de la variable y ni su
frecuencia, tenemos que:

Si los
datos están agrupados utilizamos las marcas de clase, es decir ci
en vez de xi.
u
MEDIANA
(Me):es el valor que separa por la mitad las observaciones
ordenadas de menor a mayor, de tal forma que el 50% de estas son
menores que la mediana y el otro 50% son mayores. Si el número
de datos es impar la mediana será el valor central, si es par
tomaremos como mediana la media aritmética de los dos valores
centrales.

u
MODA
(M0):
es el valor de la variable que más veces se repite, es decir,
aquella cuya frecuencia absoluta es mayor. No tiene porque ser
única.


Medidas de Dispersión
Las
medidas de tendencia central tienen
como objetivo el sintetizar los datos en un valor representativo,
las medidas de dispersión nos dicen
hasta que punto estas medidas de tendencia central son
representativas como síntesis de la información. Las medidas de
dispersión cuantifican la separación, la dispersión, la variabilidad
de los valores de la distribución respecto al valor central.
Distinguimos
entre medidas de dispersión absolutas, que no son comparables entre
diferentes muestras y las relativas que nos permitirán comparar
varias muestras.
MEDIDAS DE DISPERSIÓN ABSOLUTAS
u
VARIANZA
( s2
): es el promedio del cuadrado de las distancias entre cada
observación y la media aritmética del conjunto de observaciones.
Haciendo operaciones en la fórmula
anterior obtenemos otra fórmula para calcular la varianza:

Si los
datos están agrupados utilizamos las marcas de clase en lugar de Xi.
u
DESVIACIÓN TÍPICA (S):
La varianza
viene
dada por las mismas unidades que la variable pero al cuadrado, para
evitar este problema podemos usar como medida de dispersión la
desviación típica que se define como la raíz cuadrada positiva de la
varianza

Para estimar la desviación típica de una
población a partir de los datos de una muestra se utiliza la fórmula
(cuasi desviación típica):

u
RECORRIDO O RANGO MUESTRAL (Re).
Es la diferencia entre el valor de las observaciones
mayor y el menor. Re = xmax - xmin
MEDIDAS DE DISPERSIÓN RELATIVAS
u
COEFICIENTE DE VARIACIÓN DE PEARSON: Cuando se quiere
comparar el grado de dispersión de dos distribuciones que no vienen
dadas en las mismas unidades o que las medias no son iguales se
utiliza el coeficiente de variación de Pearson que se define como el
cociente entre la desviación típica y el valor absoluto de la media
aritmética

CV
representa el número de veces que la desviación típica contiene
a la media aritmética y por lo tanto cuanto mayor es CV mayor
es la dispersión y menor la representatividad de la media.

Medidas de Forma
Comparan la forma que tiene la representación gráfica, bien sea el
histograma o el diagrama de barras de la distribución, con la
distribución normal.
MEDIDA
DE ASIMETRÍA
Diremos que una
distribución es simétrica cuando su mediana, su moda y su media
aritmética coinciden.
Diremos que una
distribución es asimétrica a la derecha si las frecuencias
(absolutas o relativas) descienden más lentamente por la derecha que
por la izquierda.
Si las frecuencias
descienden más lentamente por la izquierda que por la derecha
diremos que la distribución es asimétrica a la izquierda.
Existen varias
medidas de la asimetría de una distribución de frecuencias. Una de
ellas es el
Coeficiente de Asimetría de Pearson:

Su valor es cero cuando la distribución es
simétrica, positivo cuando existe asimetría a la derecha y negativo
cuando existe asimetría a la izquierda.

MEDIDA
DE APUNTAMIENTO O CURTOSIS
Miden la mayor o
menor cantidad de datos que se agrupan en torno a la moda.
Se definen 3 tipos de distribuciones según su
grado de curtosis:
Distribución
mesocúrtica: presenta un grado de
concentración medio alrededor de los valores centrales de la
variable (el mismo que presenta una distribución normal). Distribución
leptocúrtica: presenta un elevado grado de
concentración alrededor de los valores centrales de la variable.
Distribución platicúrtica: presenta un reducido grado de
concentración alrededor de los valores centrales de la variable.


EJEMPLO
1
|