Professional Documents
Culture Documents
UNIVARIANTE
ESTADISTICADESCRIPTIVAUNIVARIANTE
Objetivos:
Organizar
ESTADISTICADESCRIPTIVAUNIVARIANTE
Datos:sonlamateriaprimadelaestadstica.
Cualitativos
Cuantitativos
o Discretos
o Continuos
Escalas de medida:
Nominal
Ordinal
De Intervalo
De Proporcin o Razn
ORGANIZACIN
DELOSDATOS
DISTRIBUCIONESDEFRECUENCIAS
N Visitas
F.A.
F.R.
F.A.A.
F.R.A
20
0.256
20
0.256
25.6
29
0.373
49
0.629
37.3
16
0.205
65
0.834
20.5
0.115
74
0.949
11.5
0.051
78
TOTAL
78
OBESIDAD
F.A.
F.R.
%.
NORMAL
19
0.244
24.4
5.1
SOBREPESO
34
0.436
43.6
100
OBESO
25
0.32
32
TOTAL
78
100
ORGANIZACINDELOSDATOS DISTRIBUCIONESDEFRECUENCIAS
Datos
cualitativos
x1
n1
f1
100*f1
x2
n2
f2
100*f2
...
...
xk
nk
fk
...
F.R.
fi=ni/n
...
Xi
F.A.
ni
100*fk
SEXO
F.A.
F.R.
PORCENT.
VARON
42
0.538
53.8
MUJER
36
0.462
46.2
TOTAL
78
100
OBESIDAD
F.A.
F.R.
PORCENT.
NORMAL
19
0.244
24.4
SOBREPESO
34
0.436
43.6
OBESO
25
0.32
32
TOTAL
78
100
ORGANIZACINDELOSDATOS DISTRIBUCIONESDEFRECUENCIAS
Datoscuantitativosdiscretos
Frecuencia Absoluta Acumulada (F.A.A.):
es la frecuencia absoluta de cada caracterstica
de la variable ms la suma de las frecuencias
absolutas de las categoras anteriores
F.R.
fi=ni/n
F.A.A.
F.R.A.
Xi
F.A.
ni
Ni=n1+...+ni
Fi=f1+...+fi
x1
n1
f1
N1
F1
100*f1
x2
n2
f2
N2
F2
100*f2
...
...
...
...
...
...
xk
nk
fk
Nk
Fk
100*fk
N Visitas
F.A.
F.R.
F.A.A.
F.R.A
20
0.256
20
0.256
25.6
29
0.373
49
0.629
37.3
16
0.205
65
0.834
20.5
0.115
74
0.949
11.5
0.051
78
5.1
TOTAL
78
100
ORGANIZACINDELOSDATOS DISTRIBUCIONESDEFRECUENCIAS
Datoscuantitativoscontinuos
Marca de Clase (M.C.):
es el valor central de cada
intervalo
F.R.
fi=ni/n
F.A.A.
Ni=n1+...+ni
F.R.A.
Fi=f1+...+fi
[l1,l2)
x1
n1
f1
N1
F1
100*f1
[l2,l3)
x2
n2
f2
N2
F2
100*f2
...
...
...
Nk
Fk
100*fk
...
F.A.
ni
...
M.C.
Xi
...
INTERVALO
...
[li-1,li)
xk
nk
fk
ORGANIZACINDELOSDATOS DISTRIBUCIONESDEFRECUENCIAS
Datoscuantitativoscontinuos
PESO
M.C.
F.A.
F.R.
F.A.A.
F.R.A.
20-32.5
26.25
0.0256
0.0256
2.56
32.5-45
38.75
18
0.2308
20
0.2564
23.08
45-57.5
51.25
21
0.2692
41
0.5256
26.92
57.5-70
63.75
12
0.1538
53
0.6795
15.38
70-82.5
76.25
11
0.1410
64
0.8205
14.1
82.5-95
88.75
0.1026
72
0.9231
10.26
95-107.5
101.25
0.0641
77
0.9872
6.41
107.5-120
113.75
0.0128
78
1.28
78
TOTAL
REPRESENTACIONES
GRFICAS
Datos
cualitativos
SEXO
F.A.
F.R.
PORCENT.
VARON
42
0.538
53.8
MUJER
36
0.462
46.2
TOTAL
78
100
Grfico de Sectores
Diagrama de Barras
OBESIDAD
F.A.
F.R.
PORCENT.
NORMAL
19
0.244
24.4
SOBREPESO
34
0.436
43.6
OBESO
25
0.32
32
TOTAL
78
100
Datoscuantitativosdiscretos
N
Visitas
F.A.
F.R.
F.A.A.
F.R.A
20
0.256
20
0.256
25.6
29
0.373
49
0.629
37.3
16
0.205
65
0.834
20.5
0.115
74
0.949
11.5
0.051
78
5.1
TOTAL
78
100
Datoscuantitativoscontinuos
PESO
M.C.
F.A.
F.R.
F.A.A.
F.R.A.
20-32.5
26.25
0.0256
0.0256
2.56
32.5-45
38.75
18
0.2308
20
0.2564
23.08
45-57.5
51.25
21
0.2692
41
0.5256
26.92
57.5-70
63.75
12
0.1538
53
0.6795
15.38
70-82.5
76.25
11
0.1410
64
0.8205
14.1
82.5-95
88.75
0.1026
72
0.9231
10.26
95-107.5
101.25
0.0641
77
0.9872
6.41
107.5-120
113.75
0.0128
78
1.28
78
TOTAL
Histograma
MEDIDASDESNTESISDEUNA
DISTRIBUCIN
Medidas de Tendencia central: Indican valores con respecto a los cuales parecen agruparse
los datos
Medidas de Posicin: Una vez que los datos han sido ordenados, agrupan stos en conjuntos
con el mismo nmero de individuos
Medidas de Dispersin: Indican la concentracin de los datos con respecto a las medidas de
centralizacin
xn
i i
i 1
Caractersticas:
Para obtenerla es necesario utilizar todos los valores.
Es sensible a valores extremos, por ello no se suele utilizar como medida central
de distribuciones muy asimtricas.
Se expresa en la misma unidad que los datos.
La suma de las desviaciones de los valores de la distribucin respecto a la media
es igual a cero.
Si a cada dato de una variable X se le suma una constante, se obtiene una nueva
variable Y con media igual a la anterior ms la constante.
Si cada dato de una variable X se multiplica por una constante, la media de la
nueva variable resultante queda multiplicada por dicha constante.
si n es impar
Me = (x (n/2) + x (n/2+1))/2
si n es par
Me = 4
x 4,2
1, 3, 4, 6, 10
Me = 4
x 4,8
EJEMPLO
N
Visitas
F.A.
F.R.
F.A.A.
F.R.A
20
0.256
20
0.256
25.6
29
0.373
49
0.629
37.3
16
0.205
65
0.834
20.5
0.115
74
0.949
11.5
0.051
78
5.1
TOTAL
78
xn
i i
i 1
1 20 2 29 5 4
2.33
78
Me = 2
Mo = 2
100
EJEMPLO
PESO
M.C.
F.A.
F.R.
F.A.A.
F.R.A.
20-32.5
26.25
0.0256
0.0256
2.56
32.5-45
38.75
18
0.2308
20
0.2564
23.08
45-57.5
51.25
21
0.2692
41
0.5256
26.92
57.5-70
63.75
12
0.1538
53
0.6795
15.38
70-82.5
76.25
11
0.1410
64
0.8205
14.1
82.5-95
88.75
0.1026
72
0.9231
10.26
95-107.5
101.25
0.0641
77
0.9872
6.41
107.5-120
113.75
0.0128
78
1.28
78
TOTAL
k
xn
i i
i 1
61'03
78
Mo = 51.25
125
45
20
x
19
Me
39
21
575
41
x
Valores
Posiciones
19 12 '5
11'31
21
21 ------- 125
19 ------- x
Me = 45 + 1131 =5631
MEDIDAS DE POSICIN
i = 1,,9
EJEMPLOS
N
Visitas
F.A.
F.R.
F.A.A.
F.R.A
20
0.256
20
0.256
25.6
29
0.373
49
0.629
37.3
16
0.205
65
0.834
20.5
0.115
74
0.949
11.5
0.051
78
5.1
TOTAL
78
P30 = D3 = 2
P75 = Q3 = 3
P85 = 4
100
PESO
M.C.
F.A.
F.R.
F.A.A.
F.R.A.
20-32.5
26.25
0.0256
0.0256
2.56
32.5-45
38.75
18
0.2308
20
0.2564
23.08
45-57.5
51.25
21
0.2692
41
0.5256
26.92
57.5-70
63.75
12
0.1538
53
0.6795
15.38
70-82.5
76.25
11
0.1410
64
0.8205
14.1
82.5-95
88.75
0.1026
72
0.9231
10.26
95-107.5
101.25
0.0641
77
0.9872
6.41
107.5-120
113.75
0.0128
78
1.28
78
TOTAL
P80?
El 80% de 78
es 62.4
125
70
53 94
P80
624
11
825
64
X
Valores
Posiciones
9 ' 4 12 '5
10 '682
11
11 ------- 125
94 ------- X
P80 = 70 + 10682 = 80682
MEDIDAS DE DISPERSIN
VARIANZA y DESVIACIN TPICA o ESTNDAR: La varianza, S2, se
define como la media de las diferencias cuadrticas de n puntuaciones con respecto
a la media.
n
1
S ( xi x) 2 ni
n i 1
2
S S2
Caractersticas:
* Si se suma una constante a una variable, la varianza de la nueva variable no
cambia.
* Si se multiplica una variable por una constante, la varianza de la nueva
variable queda multiplicada por la constante al cuadrado.
MEDIDAS DE DISPERSIN
COEFICIENTE DE VARIACIN: El coeficiente de variacin, C.V., se
define como el cociente entre la desviacin tpica y la media:
S
C.V .
x
Caractersticas:
Es una medida adimensional.
Da informacin sobre la representatividad de la media
(C.V. <0.5).
Permite comparar la dispersin de varias distribuciones.
Es invariante frente a cambios de escala.
n
dm
xi X
i 1
MEDIDAS DE DISPERSIN
RANGO: Se define el rango, R, como la diferencia entre el mayor y el
menor de los valores de la distribucin.
R Valormax Valormin
Caractersticas:
Es fcil de calcular.
Tiene la misma unidad de medida que la variable.
No utiliza todas las observaciones.
Se puede ver afectado por observaciones extremas.
EJEMPLOS
x 2 '33
s 1 29 1 136
1 136
04875
C.V .
233
Rango 4
N
Visitas
F.A.
F.R.
F.A.A.
F.R.A
20
0.256
20
0.256
25.6
29
0.373
49
0.629
37.3
16
0.205
65
0.834
20.5
0.115
74
0.949
11.5
0.051
78
5.1
TOTAL
78
PESO
M.C.
F.A.
F.R.
F.A.A.
F.R.A.
20-32.5
26.25
0.0256
0.0256
2.56
32.5-45
38.75
18
0.2308
20
0.2564
23.08
45-57.5
51.25
21
0.2692
41
0.5256
26.92
57.5-70
63.75
12
0.1538
53
0.6795
15.38
70-82.5
76.25
11
0.1410
64
0.8205
14.1
82.5-95
88.75
0.1026
72
0.9231
10.26
95-107.5
101.25
0.0641
77
0.9872
6.41
107.5-120
113.75
0.0128
78
1.28
78
TOTAL
100
x 61'03
s 428415 20698
Rango 87 '5
20698
0339
C.V .
61 03
TIPIFICACIN
Tipificar una variable cualquiera X consiste en realizar un cambio de origen y
escala de dicha variable con el fin de obtener una nueva variable Z que tendr
media 0 y desviacin tpica 1 y a la que denominaremos variable tipificada.
El procedimiento de tipificacin consiste en restar la media y dividir por la
desviacin tpica de la variable X a un valor cualquiera de la variable:
La variable tipificada carece de unidades, lo que
permite hacer comparables dos medidas
procedentes de dos distribuciones distintas.
xx
Z
s
Ejemplo:
Los alumnos de primero de grado en medicina han obtenido en bioestadstica una nota
media de 6.5 con desviacin tpica 2.3, y en otra asignatura una media de 7.1 con desviacin
tpica 3.4. Si un alumno ha obtenido un 6.8 en bioestadstica y un 7.2 en la otra asignatura,
en cul de ellas ha obtenido mejor puntuacin?
Z Bioestadstica
6.8 6.5
0.1304
2.3
Z?
7.2 7.1
0.0294
3.4
MEDIDAS DE FORMA
COEFICIENTE DE ASIMETRA: Mide el grado de asimetra de la
distribucin de frecuencias.
(x
i 1
X)
n
S3
(x
i 1
X ) 3 ni
n
S3
(x
i 1
X )3 fi
S3
MEDIDAS DE FORMA
COEFICIENTE DE APUNTAMIENTO O KURTOSIS: Mide
el grado de apuntamiento de la distribucin de frecuencias.
n
(x X )
i 1
(x X )
n
S4
i 1
n
S4
ni
(x X )
i 1
fi
EJEMPLOS
x 2 '33
s 1 136
(1 2 33) 3 20 (5 2 33) 3 4
78
1
0 671
3
1 136
(1 2 33) 20 (5 2 33) 4
78
2
3 0 265
4
1 136
4
N
Visitas
F.A.
F.R.
F.A.A.
F.R.A
20
0.256
20
0.256
25.6
29
0.373
49
0.629
37.3
16
0.205
65
0.834
20.5
0.115
74
0.949
11.5
0.051
78
5.1
TOTAL
78
PESO
M.C.
F.A.
F.R.
F.A.A.
F.R.A.
20-32.5
26.25
0.0256
0.0256
2.56
32.5-45
38.75
18
0.2308
20
0.2564
23.08
45-57.5
51.25
21
0.2692
41
0.5256
26.92
57.5-70
63.75
12
0.1538
53
0.6795
15.38
70-82.5
76.25
11
0.1410
64
0.8205
14.1
82.5-95
88.75
0.1026
72
0.9231
10.26
95-107.5
101.25
0.0641
77
0.9872
6.41
107.5-120
113.75
0.0128
78
1.28
78
TOTAL
20 698
100
x 61'03
s 20698
M.C.
F.A.
F.R.
F.A.A.
F.R.A.
20-32.5
26.25
0.0256
0.0256
2.56
32.5-45
38.75
18
0.2308
20
0.2564
23.08
45-57.5
51.25
21
0.2692
41
0.5256
26.92
57.5-70
63.75
12
0.1538
53
0.6795
15.38
70-82.5
76.25
11
0.1410
64
0.8205
14.1
82.5-95
88.75
0.1026
72
0.9231
10.26
95-107.5
101.25
0.0641
77
0.9872
6.41
107.5-120
113.75
0.0128
78
1.28
78
TOTAL
Mximo
P75
Mnimo
P25
Mediana
Media
ESTADISTICADESCRIPTIVAUNIVARIANTE
Objetivos:
Organizar