You are on page 1of 32

ESTADISTICADESCRIPTIVA

UNIVARIANTE

ESTADISTICADESCRIPTIVAUNIVARIANTE

Objetivos:
Organizar

un conjunto de datos de forma eficiente.


Realizar representaciones grficas que muestren la
disposicin de los mismos
Calcular y seleccionar valores que representen lo
suficientemente bien al colectivo de datos
Sistematizar estos clculos para otros conjuntos de
datos parecidos.

ESTADISTICADESCRIPTIVAUNIVARIANTE

Datos:sonlamateriaprimadelaestadstica.

x1, x2, ..., xn


Tiposdedatos:
Enfuncindelaformaenlaque
stosvengandadossepodrn
realizardistintasclasificaciones
delosmismos.

Cualitativos
Cuantitativos
o Discretos
o Continuos

Escalas de medida:
Nominal
Ordinal
De Intervalo
De Proporcin o Razn

ORGANIZACIN
DELOSDATOS
DISTRIBUCIONESDEFRECUENCIAS
N Visitas

F.A.

F.R.

F.A.A.

F.R.A

20

0.256

20

0.256

25.6

29

0.373

49

0.629

37.3

16

0.205

65

0.834

20.5

0.115

74

0.949

11.5

0.051

78

TOTAL

78

OBESIDAD

F.A.

F.R.

%.

NORMAL

19

0.244

24.4

5.1

SOBREPESO

34

0.436

43.6

100

OBESO

25

0.32

32

TOTAL

78

100

ORGANIZACINDELOSDATOS DISTRIBUCIONESDEFRECUENCIAS

Datos
cualitativos

Xi son las categoras de la


variable que pretendemos
estudiar

x1

n1

f1

100*f1

x2

n2

f2

100*f2

...

...

xk

nk

fk

...

F.R.
fi=ni/n

...

Xi

F.A.
ni

100*fk

Frecuencia Absoluta (F.A.):


es el nmero de sujetos que se
encuentran dentro de cada
categora
Frecuencia Relativa (F.R.): es el
nmero de sujetos que se encuentran
dentro de cada categora con respecto
al total de individuos

SEXO

F.A.

F.R.

PORCENT.

VARON

42

0.538

53.8

MUJER

36

0.462

46.2

TOTAL

78

100

OBESIDAD

F.A.

F.R.

PORCENT.

NORMAL

19

0.244

24.4

SOBREPESO

34

0.436

43.6

OBESO

25

0.32

32

TOTAL

78

100

ORGANIZACINDELOSDATOS DISTRIBUCIONESDEFRECUENCIAS

Datoscuantitativosdiscretos
Frecuencia Absoluta Acumulada (F.A.A.):
es la frecuencia absoluta de cada caracterstica
de la variable ms la suma de las frecuencias
absolutas de las categoras anteriores

Frecuencia Relativa Acumulada (F.R.A.): es


la frecuencia relativa de cada caracterstica de la
variable ms la suma de las frecuencias relativas
de las categoras anteriores

F.R.
fi=ni/n

F.A.A.

F.R.A.

Xi

F.A.
ni

Ni=n1+...+ni

Fi=f1+...+fi

x1

n1

f1

N1

F1

100*f1

x2

n2

f2

N2

F2

100*f2

...

...

...

...

...

...

xk

nk

fk

Nk

Fk

100*fk

N Visitas

F.A.

F.R.

F.A.A.

F.R.A

20

0.256

20

0.256

25.6

29

0.373

49

0.629

37.3

16

0.205

65

0.834

20.5

0.115

74

0.949

11.5

0.051

78

5.1

TOTAL

78

100

ORGANIZACINDELOSDATOS DISTRIBUCIONESDEFRECUENCIAS

Datoscuantitativoscontinuos
Marca de Clase (M.C.):
es el valor central de cada
intervalo

En ocasiones, es necesario agrupar los valores que toma


la variable en intervalos

F.R.
fi=ni/n

F.A.A.
Ni=n1+...+ni

F.R.A.
Fi=f1+...+fi

[l1,l2)

x1

n1

f1

N1

F1

100*f1

[l2,l3)

x2

n2

f2

N2

F2

100*f2

...

...

...

Nk

Fk

100*fk

...

F.A.
ni

...

M.C.
Xi

...

INTERVALO

...

[li-1,li)

xk

nk

fk

ORGANIZACINDELOSDATOS DISTRIBUCIONESDEFRECUENCIAS

Datoscuantitativoscontinuos
PESO

M.C.

F.A.

F.R.

F.A.A.

F.R.A.

20-32.5

26.25

0.0256

0.0256

2.56

32.5-45

38.75

18

0.2308

20

0.2564

23.08

45-57.5

51.25

21

0.2692

41

0.5256

26.92

57.5-70

63.75

12

0.1538

53

0.6795

15.38

70-82.5

76.25

11

0.1410

64

0.8205

14.1

82.5-95

88.75

0.1026

72

0.9231

10.26

95-107.5

101.25

0.0641

77

0.9872

6.41

107.5-120

113.75

0.0128

78

1.28

78

TOTAL

REPRESENTACIONES
GRFICAS

Datos
cualitativos
SEXO

F.A.

F.R.

PORCENT.

VARON

42

0.538

53.8

MUJER

36

0.462

46.2

TOTAL

78

100
Grfico de Sectores

Diagrama de Barras
OBESIDAD

F.A.

F.R.

PORCENT.

NORMAL

19

0.244

24.4

SOBREPESO

34

0.436

43.6

OBESO

25

0.32

32

TOTAL

78

100

Datoscuantitativosdiscretos
N
Visitas

F.A.

F.R.

F.A.A.

F.R.A

20

0.256

20

0.256

25.6

29

0.373

49

0.629

37.3

16

0.205

65

0.834

20.5

0.115

74

0.949

11.5

0.051

78

5.1

TOTAL

78

100

Datoscuantitativoscontinuos
PESO

M.C.

F.A.

F.R.

F.A.A.

F.R.A.

20-32.5

26.25

0.0256

0.0256

2.56

32.5-45

38.75

18

0.2308

20

0.2564

23.08

45-57.5

51.25

21

0.2692

41

0.5256

26.92

57.5-70

63.75

12

0.1538

53

0.6795

15.38

70-82.5

76.25

11

0.1410

64

0.8205

14.1

82.5-95

88.75

0.1026

72

0.9231

10.26

95-107.5

101.25

0.0641

77

0.9872

6.41

107.5-120

113.75

0.0128

78

1.28

78

TOTAL

Grfico de Caja y Bigotes

Histograma

MEDIDASDESNTESISDEUNA
DISTRIBUCIN
Medidas de Tendencia central: Indican valores con respecto a los cuales parecen agruparse
los datos

Medidas de Posicin: Una vez que los datos han sido ordenados, agrupan stos en conjuntos
con el mismo nmero de individuos

Medidas de Dispersin: Indican la concentracin de los datos con respecto a las medidas de
centralizacin

Medidas de Forma: Muestran la forma de la distribucin

MEDIDAS DE TENDENCIA CENTRAL


MEDIA

No es ms que la media aritmtica de los datos, se representa


por x y su frmula es:
k
x

xn

i i

i 1

Caractersticas:
Para obtenerla es necesario utilizar todos los valores.
Es sensible a valores extremos, por ello no se suele utilizar como medida central
de distribuciones muy asimtricas.
Se expresa en la misma unidad que los datos.
La suma de las desviaciones de los valores de la distribucin respecto a la media
es igual a cero.
Si a cada dato de una variable X se le suma una constante, se obtiene una nueva
variable Y con media igual a la anterior ms la constante.
Si cada dato de una variable X se multiplica por una constante, la media de la
nueva variable resultante queda multiplicada por dicha constante.

MEDIDAS DE TENDENCIA CENTRAL


MEDIANA

Se llama mediana al primer valor que deja por debajo de s al


50% de los datos una vez que stos han sido ordenados.
* Si los datos no estn agrupados:
Me = x ((n+1)/2)

si n es impar

Me = (x (n/2) + x (n/2+1))/2

si n es par

* Si los datos estn agrupados, es necesario interpolar.

MEDIDAS DE TENDENCIA CENTRAL


MEDIANA
Caractersticas:
No se ve afectada por observaciones extremas, ya que no depende de los
valores que toma la variable sino del orden de los mismos.
1, 3, 4, 6, 7

Me = 4

x 4,2

1, 3, 4, 6, 10

Me = 4

x 4,8

Su clculo es rpido y su interpretacin es sencilla.

MEDIDAS DE TENDENCIA CENTRAL


MODA

La moda de una distribucin es el valor que ms se repite.


Caractersticas:
Es muy fcil de calcular.
Puede no ser nica

EJEMPLO
N
Visitas

F.A.

F.R.

F.A.A.

F.R.A

20

0.256

20

0.256

25.6

29

0.373

49

0.629

37.3

16

0.205

65

0.834

20.5

0.115

74

0.949

11.5

0.051

78

5.1

TOTAL

78

xn

i i

i 1

1 20 2 29 5 4
2.33
78

Me = 2
Mo = 2

100

EJEMPLO
PESO

M.C.

F.A.

F.R.

F.A.A.

F.R.A.

20-32.5

26.25

0.0256

0.0256

2.56

32.5-45

38.75

18

0.2308

20

0.2564

23.08

45-57.5

51.25

21

0.2692

41

0.5256

26.92

57.5-70

63.75

12

0.1538

53

0.6795

15.38

70-82.5

76.25

11

0.1410

64

0.8205

14.1

82.5-95

88.75

0.1026

72

0.9231

10.26

95-107.5

101.25

0.0641

77

0.9872

6.41

107.5-120

113.75

0.0128

78

1.28

78

TOTAL
k

xn

i i

i 1

26 ' 25 2 38'75 18 113'75 1

61'03
78

Mo = 51.25

125
45
20

x
19

Me
39
21

575
41
x

Valores
Posiciones
19 12 '5
11'31
21

21 ------- 125
19 ------- x
Me = 45 + 1131 =5631

MEDIDAS DE POSICIN

Percentiles: se llama percentil de orden k (Pk) a la


observacin que deja por debajo de s al k% de la poblacin.
Los percentiles dividen a los datos ordenados en 100 partes.
P50 = Me

Cuartiles: Los cuartiles dividen a los datos ordenados en 4


partes iguales, por tanto, hay 3 y se definen como:
Q1 = P25
Q2 = P50 = Me
Q3 = P75

Deciles: Los deciles dividen a los datos ordenados en 10 partes


iguales, por tanto, hay 9 y se definen como:
Di = P10i

i = 1,,9

EJEMPLOS

N
Visitas

F.A.

F.R.

F.A.A.

F.R.A

20

0.256

20

0.256

25.6

29

0.373

49

0.629

37.3

16

0.205

65

0.834

20.5

0.115

74

0.949

11.5

0.051

78

5.1

TOTAL

78

P30 = D3 = 2
P75 = Q3 = 3
P85 = 4

100

PESO

M.C.

F.A.

F.R.

F.A.A.

F.R.A.

20-32.5

26.25

0.0256

0.0256

2.56

32.5-45

38.75

18

0.2308

20

0.2564

23.08

45-57.5

51.25

21

0.2692

41

0.5256

26.92

57.5-70

63.75

12

0.1538

53

0.6795

15.38

70-82.5

76.25

11

0.1410

64

0.8205

14.1

82.5-95

88.75

0.1026

72

0.9231

10.26

95-107.5

101.25

0.0641

77

0.9872

6.41

107.5-120

113.75

0.0128

78

1.28

78

TOTAL

P80?
El 80% de 78
es 62.4

125
70
53 94

P80
624
11

825
64
X

Valores
Posiciones
9 ' 4 12 '5
10 '682
11

11 ------- 125
94 ------- X
P80 = 70 + 10682 = 80682

MEDIDAS DE DISPERSIN
VARIANZA y DESVIACIN TPICA o ESTNDAR: La varianza, S2, se
define como la media de las diferencias cuadrticas de n puntuaciones con respecto
a la media.
n

1
S ( xi x) 2 ni
n i 1
2

Su unidad de medida queda elevada al cuadrado, por lo que se define la


desviacin tpica, S, como la raz cuadrada positiva de la varianza:

S S2
Caractersticas:
* Si se suma una constante a una variable, la varianza de la nueva variable no
cambia.
* Si se multiplica una variable por una constante, la varianza de la nueva
variable queda multiplicada por la constante al cuadrado.

MEDIDAS DE DISPERSIN
COEFICIENTE DE VARIACIN: El coeficiente de variacin, C.V., se
define como el cociente entre la desviacin tpica y la media:

S
C.V .
x

Caractersticas:
Es una medida adimensional.
Da informacin sobre la representatividad de la media
(C.V. <0.5).
Permite comparar la dispersin de varias distribuciones.
Es invariante frente a cambios de escala.
n

OTRA MEDIDA DE DISPERSION: DESVIACIN MEDIA

dm

xi X

i 1

MEDIDAS DE DISPERSIN
RANGO: Se define el rango, R, como la diferencia entre el mayor y el
menor de los valores de la distribucin.

R Valormax Valormin

Caractersticas:

Es fcil de calcular.
Tiene la misma unidad de medida que la variable.
No utiliza todas las observaciones.
Se puede ver afectado por observaciones extremas.

EJEMPLOS

x 2 '33

(1 233) 2 20 (2 233) 2 29 (5 233) 2 4


1 29
s
78
2

s 1 29 1 136

1 136
04875
C.V .
233

Rango 4

N
Visitas

F.A.

F.R.

F.A.A.

F.R.A

20

0.256

20

0.256

25.6

29

0.373

49

0.629

37.3

16

0.205

65

0.834

20.5

0.115

74

0.949

11.5

0.051

78

5.1

TOTAL

78

PESO

M.C.

F.A.

F.R.

F.A.A.

F.R.A.

20-32.5

26.25

0.0256

0.0256

2.56

32.5-45

38.75

18

0.2308

20

0.2564

23.08

45-57.5

51.25

21

0.2692

41

0.5256

26.92

57.5-70

63.75

12

0.1538

53

0.6795

15.38

70-82.5

76.25

11

0.1410

64

0.8205

14.1

82.5-95

88.75

0.1026

72

0.9231

10.26

95-107.5

101.25

0.0641

77

0.9872

6.41

107.5-120

113.75

0.0128

78

1.28

78

TOTAL

(2625 61 03) 2 2 (11375 61'03) 2 1


s
428415
78

100

x 61'03

s 428415 20698

Rango 87 '5

20698
0339
C.V .
61 03

TIPIFICACIN
Tipificar una variable cualquiera X consiste en realizar un cambio de origen y
escala de dicha variable con el fin de obtener una nueva variable Z que tendr
media 0 y desviacin tpica 1 y a la que denominaremos variable tipificada.
El procedimiento de tipificacin consiste en restar la media y dividir por la
desviacin tpica de la variable X a un valor cualquiera de la variable:
La variable tipificada carece de unidades, lo que
permite hacer comparables dos medidas
procedentes de dos distribuciones distintas.

xx
Z
s

Ejemplo:
Los alumnos de primero de grado en medicina han obtenido en bioestadstica una nota
media de 6.5 con desviacin tpica 2.3, y en otra asignatura una media de 7.1 con desviacin
tpica 3.4. Si un alumno ha obtenido un 6.8 en bioestadstica y un 7.2 en la otra asignatura,
en cul de ellas ha obtenido mejor puntuacin?

Z Bioestadstica

6.8 6.5

0.1304
2.3

Z?

7.2 7.1
0.0294
3.4

MEDIDAS DE FORMA
COEFICIENTE DE ASIMETRA: Mide el grado de asimetra de la
distribucin de frecuencias.

(x
i 1

X)

n
S3

(x

i 1

X ) 3 ni
n
S3

(x
i 1

X )3 fi
S3

Si el coeficiente es igual a 0, la distribucin es simtrica.


Si es < 0, la distribucin es asimtrica por la izquierda.
Si es > 0, la distribucin es asimtrica por la derecha.

MEDIDAS DE FORMA
COEFICIENTE DE APUNTAMIENTO O KURTOSIS: Mide
el grado de apuntamiento de la distribucin de frecuencias.
n

(x X )
i 1

(x X )

n
S4

i 1

n
S4

ni

(x X )
i 1

fi

Si el coeficiente es igual a 0, la distribucin es mesocrtica.


Si es < 0, la distribucin es platicrtica.
Si es > 0, la distribucin es leptocrtica.

EJEMPLOS

x 2 '33

s 1 136

(1 2 33) 3 20 (5 2 33) 3 4
78
1
0 671
3

1 136

(1 2 33) 20 (5 2 33) 4
78
2
3 0 265
4
1 136
4

N
Visitas

F.A.

F.R.

F.A.A.

F.R.A

20

0.256

20

0.256

25.6

29

0.373

49

0.629

37.3

16

0.205

65

0.834

20.5

0.115

74

0.949

11.5

0.051

78

5.1

TOTAL

78

PESO

M.C.

F.A.

F.R.

F.A.A.

F.R.A.

20-32.5

26.25

0.0256

0.0256

2.56

32.5-45

38.75

18

0.2308

20

0.2564

23.08

45-57.5

51.25

21

0.2692

41

0.5256

26.92

57.5-70

63.75

12

0.1538

53

0.6795

15.38

70-82.5

76.25

11

0.1410

64

0.8205

14.1

82.5-95

88.75

0.1026

72

0.9231

10.26

95-107.5

101.25

0.0641

77

0.9872

6.41

107.5-120

113.75

0.0128

78

1.28

78

TOTAL

(26 25 61 03) 3 2 (113 75 61 03) 3 1


78
1
0 552
3
20 698
(26 25 61 03) 4 2 (113 75 61 03) 4 1
78
2
3 0 586
4

20 698

100

x 61'03

s 20698

Grfico de Caja y Bigotes


PESO

M.C.

F.A.

F.R.

F.A.A.

F.R.A.

20-32.5

26.25

0.0256

0.0256

2.56

32.5-45

38.75

18

0.2308

20

0.2564

23.08

45-57.5

51.25

21

0.2692

41

0.5256

26.92

57.5-70

63.75

12

0.1538

53

0.6795

15.38

70-82.5

76.25

11

0.1410

64

0.8205

14.1

82.5-95

88.75

0.1026

72

0.9231

10.26

95-107.5

101.25

0.0641

77

0.9872

6.41

107.5-120

113.75

0.0128

78

1.28

78

TOTAL

Mximo

P75
Mnimo
P25

Mediana

Media

ESTADISTICADESCRIPTIVAUNIVARIANTE

Objetivos:
Organizar

un conjunto de datos de forma eficiente.


Realizar representaciones grficas que muestren la
disposicin de los mismos
Calcular y seleccionar valores que representen lo
suficientemente bien al colectivo de datos
Sistematizar estos clculos para otros conjuntos de
datos parecidos.

You might also like