Estadística
La
Estadística
es la ciencia que trata de los métodos y procedimientos para
recoger, clasificar, resumir, hallar regularidades y analizar
datos, así como de realizar inferencias a
partir de ellos, con la finalidad de ayudar a la toma de
decisiones y en su caso formular predicciones. Podemos por tanto clasificar la
Estadística en:
u
Descriptiva o
deductiva, que tiene por
objeto la recogida, recopilación, y reducción de datos, su
organización en tablas y gráficos y el cálculo de unos valores que
representen al conjunto de datos.
u
Inferencial
o inductiva tiene por objeto
establecer previsiones o conclusiones sobre una población basándose
en los resultados obtenidos de una muestra
Definiciones de términos estadísticos
u
Población:
es el
conjunto de elementos, individuos o entes sujetos a estudio y de
los cuales queremos obtener un resultado.
u
Variable: es
la característica que estamos midiendo.
Existen dos tipos
de variables:
Variable cualitativa:
Es
aquella que expresa un atributo o característica, ejemplo: Rubio,
moreno, etc.
Variable cuantitativa:
Es
aquella que podemos expresar numéricamente: edad, peso, etc. Esta a su vez la podemos subdividir en:
Variable discreta,
aquella que entre dos valores próximos puede tomar a lo sumo un
número finito de valores. Ejemplos: el número de TSE de una
familia, el de obreros de una fabrica, el de alumnos de la
universidad, etc.
Variable continua
la que puede tomar los infinitos valores de un intervalo. En muchas
ocasiones la diferencia es más teórica que práctica, ya que los
aparatos de medida dificultan que puedan existir todos los valores
del intervalo. Ejemplos, peso, estatura, distancias, etc.
La
variable se denota por las mayúsculas de letras finales del alfabeto
castellano. A su vez cada una de estas variables puede tomar
distintos valores , colocando un subíndice, que indica orden.
X = (x1,
x2
,
......
Xn)
u
Muestra:
Conjunto de elementos que forman parte de población . La muestra
representa a esta población.
u
Tamaño muestral:
Es le
número de elementos u observaciones que tomamos. Se denota por n ó
N.
u
Dato:
Cada uno de los
individuos, cosas, entes abstractos que integran una población o
universo determinado. Dicho de otra forma, cada valor observado de
la variable.
Frecuencias absolutas,
relativas
y
acumuladas.
u
Frecuencia absoluta:
Llamaremos así al número de repeticiones que presenta una
observación. Se representa por ni.
u
Frecuencia relativa:
Es la frecuencia absoluta dividida por el número total de datos, se
suele expresar en tanto por uno:
La suma de todas las frecuencias relativas, siempre
debe ser igual a la unidad.
u
Frecuencia absoluta acumulada:
es la suma de los distintos valores de la frecuencia absoluta
tomando como referencia un individuo dado. La última frecuencia
absoluta acumulada es igual al nº de casos:
N1
= n1
N2
= n1+ n2
Nn
= n1 + n2 + . . . . . . + nn-1
+ nn=
n
u
Frecuencia relativa acumulada:
es el resultado de dividir cada frecuencia absoluta acumulada por el
número total de datos, se la suele representar con la notación: Fi
Tabla de frecuencias para una variable discreta. |
xi |
ni |
Ni |
fi |
Fi |
x1 |
n1 |
N1 |
f1 |
F1 |
x2 |
n2 |
N2 |
f2 |
F2 |
x3 |
n3 |
N |
f3 |
1 |
|
Sni=N |
|
1 |
|
|
EJEMPLO 1º
Queremos hacer un
estudio estadístico del
número de Técnicos
Superiores en Electricidad (TSE) que existen en las empresas
eléctricas de una determinada ciudad.
Para ello se ha
encuestado a 50 empresas
y
se
han
obtenido los siguientes datos:
2 |
4 |
2 |
3 |
1 |
2 |
4 |
2 |
3 |
0 |
2 |
2 |
2 |
3 |
2 |
6 |
2 |
3 |
2 |
2 |
3 |
2 |
3 |
3 |
4 |
3 |
3 |
4 |
5 |
2 |
0 |
3 |
2 |
1 |
2 |
3 |
2 |
2 |
3 |
1 |
4 |
2 |
3 |
2 |
4 |
3 |
3 |
2 |
2 |
1 |
Se
pide:
a) ¿Cuál es la población objeto de estudio?
b)
¿Qué variable estamos estudiando?
c)
¿Qué tipo de variable es?
d)
Construir la tabla de frecuencias?
e)
¿Cuál es el número de
empresas
que tiene como máximo 2 TSE?
f)
¿Cuántas
empresas
tienen más de 1 TSE,
pero como máximo 3?
g)
¿Qué
porcentaje de empresas
tiene más de 3 TSE
?
SOLUCIÓN:
a) La población objeto de estudio es
las empresas de
electricidad de una ciudad.
b) La variable que estamos estudiando es el número
de TSE
por
empresa.
c) El tipo de variable es discreta ya que el número
de
TSE
solo puede tomar
determinados valores enteros.
d) Para construir la tabla de frecuencias tenemos que
ver cuantas
empresas
tienen un determinado número de
TSE.
Podemos ver que el número de
TSE,
toma los valores existentes entre 0
TSE,
los que menos y 6 TSE,
los que más y tendremos:
xi |
ni |
Ni |
fi |
Fi |
0 |
2 |
2 |
0.04 |
0.04 |
1 |
4 |
6 |
0.08 |
0.12 |
2 |
21 |
27 |
0.42 |
0.54 |
3 |
15 |
42 |
0.30 |
0.84 |
4 |
6 |
48 |
0.12 |
0.96 |
5 |
1 |
49 |
0.02 |
0.98 |
6 |
1 |
50 |
0.024 |
1 |
|
N = 50 |
|
1 |
|
e) El número de
empresas
que
tienen dos o menos TSE es: 2+4+21 = 27
f) El número de empresas que tienen más de un TSE
pero tres como máximo es: 21 + 15 = 36
Por último el porcentaje de empresas que tiene más de
tres TSE, son aquellos que tienen 4; 5 y 6 es decir 6+1+1= 8
El porcentaje será el tanto por uno multiplicado por
cien es decir, la frecuencia relativa de dichos valores multiplicado
por 100: ( 0.12+0.02+0.02)* 100 = 0,16 + 100 = 16 %
Marca de Clase
|
Cuando nos encontramos con una distribución con un gran número de
variables, se se suelen agrupar en intervalos para facilitar la
comprensión de los datos Se indica por Li-1 al extremo
inferior del intervalo y por Li al extremo superior.
Cerramos el intervalo por la izquierda y abrimos por la derecha,
pero se puede hacer al contrario;
[Li-1
, Li) Para operar utilizaremos la
marca
de clase,
el punto medio de un intervalo
u
Amplitud del
intervalo:
la longitud del intervalo, se representa por:
a
= Li -
Li-1
u
Nº
de
intervalos: A partir de la raíz cuadrada del número de datos,
decidimos, redondeando el número de intervalos.
u
Recorrido: Valor mayor, menos valor menor de los datos. Re= xn-x1
u
Amplitud: División entre el Recorrido y el número de intervalos
que hayamos decidido.
EJEMPL0 2º
|
Se desea hacer un
estudio estadístico
del precio de un pequeño
interruptor eléctrico de la marca Interelec, en las tiendas de
material eléctrico de una ciudad. Para ello se conocen los
precios en 40
tiendas de
esa ciudad. Los datos obtenidos
en euros son:
3,9 |
4,7 |
3,7 |
5,6 |
4,3 |
4,9 |
5,0 |
6,1 |
5,1 |
4,5 |
5,3 |
3,9 |
4,3 |
5,0 |
6,0 |
4,7 |
5,1 |
4,2 |
4,4 |
5,8 |
3,3 |
4,3 |
4,1 |
5,8 |
4,4 |
4,8 |
6,1 |
4,3 |
5,3 |
4,5 |
4,0 |
5,4 |
3,9 |
4,7 |
3,3 |
4,5 |
4,7 |
4,2 |
4,5 |
4,8 |
Se
pide:
a)
¿Cuál es la población objeto de estudio?
b)
¿Qué variable estamos estudiando?
c)
¿Qué tipo de variable es?
d)
¿Qué problema plantea la construcción de la tabla de frecuencias?
e)
¿Cuántas
tiendas
tienen un precio entre 3,25 y 3,75
euros?
f)
¿Cuánto
tiendas
tienen un precio superior a 4,75
euros?
g)
¿Qué porcentaje de
tiendas tienen precios menores de
4,25 euros?
SOLUCION:
a) La
población objeto de estudio son
las tiendas dematerial
eléctrrico de una ciudad
b) La
variable que estamos estudiando es el precio
de un interruptor de la marca Interelec.
c) El
tipo de variable es continua.
d) El
problema que plantea es que existen muchos valores diferentes
para por tanto es
conveniente
agrupar la serie en intervalos.
La
manera de hacerlo sería la siguiente: primero, calculamos el
recorrido Re = xn– x1= 6.1 –3.3 =
2.8
Cuando no se nos dice nada el nº de intervalos, se obtiene
calculando la raíz cuadrada del nº de datos observado. Veremos que
la raíz cuadrada de 40 es igual a 6.32 por lo tanto tomaremos 6
intervalos.
Como
el recorrido es 2.8 si lo dividimos por el nº de intervalos
tendremos la amplitud de cada uno de ellos y así: 2,8/6 = 0,46.
Importante:
La
amplitud es de 0,46 por lo que además de no ser muy fácil operar,
puede que no cubra el rango de la variable. Lo podemos evitar,
tomaremos un valor superior, en este caso 0,5:
[Li-1,,
Li) |
ni |
Ni |
fi |
Fi |
[3,25,
3,75) |
3 |
3 |
0.075 |
0.075 |
[3,75,
4,25) |
8 |
11 |
0.2 |
0.275 |
[4,25,
4,75) |
14 |
25 |
0.35 |
0.625 |
[4,75,
5,25) |
6 |
31 |
0.15 |
0.775 |
[5,25,
5,75) |
4 |
35 |
0.1 |
0.875 |
[5,75,
6,25) |
5 |
40 |
0.125 |
1 |
|
N= 40 |
|
|
|
e) 3
f) 15
g) %=F2*100=0.275*100=27.5
|