You are on page 1of 34

Departamento de Ciencias Exactas

Trabajo de Estadı́stica I
Carrera: Ingenierı́a Mecánica
Alumno: Estuardo Robalino

Profesor: Ing. Carlos Balseca

NRC: 3284

Periodo: Octubre 2016-Febrero 2017


6 de marzo de 2017

1
ESTADÍSTICA I

PRIMER PARCIAL
TIPOS DE VARIABLES
Existen dos tipos básicos de variables:

1. Cualitativas

• Cuando la caracterı́stica que se estudia es de naturaleza no numérica, recibe el nom-


bre de variable cualitativa o atributo.

• Se miden en escala nominal (solo se nombra, no hay jerarquı́a) y ordinal (tienen


un orden prestablecido).

• Ejemplos de variables cualitativas en escala nominal son:

• El género de una persona (hombre o mujer)

• El estado civil de una persona (soltero, casado, divorciado, viudo)

• Religiosa prácticada (Islám, Budismo, Hinduismo, etc.)

• Paı́s de nacimiento (Ecuador, Perú, Canadá, etc.)

• Color de ojos (cafés, negros, verdes, azules)

• Ejemplos de variables cualitativas en escala ordinal son:

• Grado militar (Subteniente, Teniente, Capitán, Mayor, General)

• Clase social de una persona (clase baja, clase media, clase alta)

• Etapas de desarrollo de un ser vivo (nacer, crecer, reproducirse, morir)

• Niveles de urgencia médica (no urgente, poco urgente, urgente, muy urgente,
emergencia)

• Autoridades de una institución educativa (rector, vicerrector, inspector, docen-


tes)

• Importa la cantidad o proporción que caen dentro de cada categorı́a.

• Los datos cualitativos se resumen en tablas o gráficas de barras.

Estuardo Andrés Robalino Romero 2


ESTADÍSTICA I

2. Cuantitativas

• Cuado la variable que se estudia aparece en forma numérica, la variable se denomina


variable cuantitativa.

• Para establecer el conteo existe el intervalo y la razón

• Intervalo: los valores pueden ser negativos, positivos o cero (el cero no es absoluto
sino referencial). Los valores no pueden ser comparados.

• Razón: El cero es absoluto (solo existe el cero y los números positivos). Los valores
si pueden estar en razón.

• Las variables cuantitativas pueden ser discretas o continuas.

Variables discretas

• Generalmente son números enteros

• Se obtienen por un proceso de conteo

• La distancia entre valores es constante (0.1, 0.2, 0.3, 0.4 ...)

• Ejemplos de variables discretas son:

• Número de obreros que trabajan en una construcción

• Cantidad de barcos pequeños de un puerto

• Número de provincias que existen en en Ecuador

• Cantidad de estudiantes de un colegio

• Número de paı́ses de América del Sur

Estuardo Andrés Robalino Romero 3


ESTADÍSTICA I

Variables continuas

• Toman cualquier valor dentro de un intervalo especı́fico.

• Por lo general las variables continuas son el resultado de mediciones.

• Ejemplos de variables continuas son:

• La altura que tiene un edificio

• El diámetro de la cintura de una persona

• La ditancia en km que existe entre Quito y Sangolquı́

• La elongación de un resorte cuando se le aplica fuerza

• La presión del aire en una llanta

Tabla de distribución de Frecuencias


Tabla de Frecuencias: agrupación de datos cualitativos en clases mutuamente excluyentes
que muestra el número de observaciones en cada clase.
Ejemplo de construcción de una Tabla de Distribución de Frecuencias
Los datos utilizados son las estaturas correspondientes a los estudiantes de Estadı́stica I, NRC:
3284
Datos desagrupados
155 156 158 164 165 165 165 168 169 169 170 170 171 171 174 175 175 175 175 176 176 178 178
179 182

Estuardo Andrés Robalino Romero 4


ESTADÍSTICA I

x ni Ni fi ( %) Fi ( %)
1 1
155 1 1 25
= 4% 25
= 4%
1 2
156 1 2 25
= 4% 25
= 8%
1 3
158 1 3 25
= 4% 25
= 12 %
1 4
164 1 4 25
= 4% 25
= 16 %
3 7
164 3 7 25
= 12 % 25
= 28 %
1 8
168 1 8 25
= 4% 25
= 32 %
2 10
169 2 10 25
= 8% 25
= 40 %
2 12
170 2 12 25
= 8% 25
= 48 %
2 14
171 2 14 25
= 8% 25
= 56 %
1 15
174 1 15 25
= 4% 25
= 60 %
4 19
175 4 19 25
= 16 % 25
= 76 %
2 21
176 2 21 25
= 8% 25
= 84 %
2 23
178 2 23 25
= 8% 25
= 92 %
1 24
179 1 24 25
= 4% 25
= 95 %
1 25
182 1 25 25
= 4% 25
= 100 %

x=datos
ni =frecuencia absoluta (suma de las frecuencias)
Ni =frecuencia absoluta acumulada (suma de las frecuencias absolutas)
ni
fi = n
=frecuencia relativa
Ni
Fi = n
=frecuencia relativa acumulada
Tabla de distribución de frecuencia por clases
Pasos para la construcción de la tabla

Estuardo Andrés Robalino Romero 5


ESTADÍSTICA I

Método I
Para encontrar el número de clases.

Rango = xmax − xmin

2k ≥ n

Método II
Para encontrar el número de clases

log (n)
k= 1 +
log (2)

Para encontrar el intervalo


L·K ≥ Rango

L = amplitud del intervalo


k = número de clases

Ejemplo de construcción de una Tabla de Distribución de Frecuencias por cla-


ses
Los datos son del ejemplo anterior
Rango
n = 25

Rango = xmax − xmin

Rango = 182 − 155

Rango = 27cm

Número de Clases
2k ≥ n

2k ≥ 25

25 ≥ 25

k=5

Estuardo Andrés Robalino Romero 6


ESTADÍSTICA I

También de puede calcular el número de clases por el método de Sturges

log (n)
k =1+
log (2)

log (25)
k =1+
log (2)
k = 5, 64 ≈ 6

Intervalo
L · K ≥ Rango
Rango
L≥
K
27
L=
6
L = 4, 5cm

Exceso
Rango
L=
K
27
L=
6
L = 4, 5cm

4, 5 ∗ 6 ≥ 27

27 ≥ 27

No hay exceso

x xc nc Nc fc Fc
3 3
[155 - 159,5[ 157,25 3 3 25
= 12 % 25
= 12 %
0 3
[159,5 - 164[ 161,75 0 3 25
= 0% 25
= 12 %
5 8
[164 - 168,5[ 166,25 5 8 25
= 20 % 25
= 32 %
6 14
[168,5 - 173[ 170,75 6 14 25
= 24 % 25
= 56 %
7 21
[173 - 177,5[ 175,25 7 21 25
= 28 % 25
= 84 %
4 25
[177,5 - 182[ 179,75 4 25 25
= 16 % 25
= 100 %

x=intervalo de datos
xc =marca de clase (promedio entre los extremos del intervalo)
nc =frecuencia absoluta (suma de las frecuencias )

Estuardo Andrés Robalino Romero 7


ESTADÍSTICA I

Nc =frecuencia absoluta acumulada (suma de las frecuencias absolutas )


nc
fc = n
=frecuencia relativa
Nc
Fc = n
=frecuencia relativa acumulada
MEDIDAS DESCRIPTIVAS
Medidas de tendencia central
Media
Definición: la medida más común de localización o centro de un grupo de datos es el
promedio aritmético oridnario o media.
Para datos no agrupados Pn
i=1 xi
x=
n
Para datos agrupados Pm
i=1xi · ni
x=
n
Para datos agrupados por clases
Pk
c=1xc · n c
x
b=
n

La media es suceptible a los valores atı́picos

Ejemplo
Datos de una encuesta realizada sobre el mantenimiento de un vehı́culo, enfocado al kilometraje
necesario en el cual se efectúa el cambio del embrague del mismo.
Tabla de datos ordenada de menor a mayor en dirección de izquierda a derecha
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000 104000 105000
105000 105000 105000 105000 105000 105000 105000 105000 105000 105000 105000 105000
105000 105000 105000 105000 105000 106000 106000 107000 107000 108000 108000 108000
108000 108000 108000 108000 108000 109000 109000 109000 109000 109000 109000 109000
109000 109000 109000 109000 109000 109000 110000 110000 110000 110000 110000 110000
110000 110000 110000 112000 112000 112000 112000 112000 112000 112000 112000 112000
112000 112000 112000 112000 112000 112000 113000 113000 113000 113000 113000 113000
113000 113000 114000 114000 114000 114000 115000 115000 115000 115000 115000 115000
115000 115000 115000 115000
Tabla de distribución Frecuencias

Estuardo Andrés Robalino Romero 8


ESTADÍSTICA I

xi −x 3 xi −x 4
(xi − x)2 · ni
 
K(x) ni Ni fi Fi (xi − x) · ni S
· ni S
· ni
100000 10 10 10 % 10 % -88100 776161000 -111,395916 -4,6E12
104000 1 11 1% 11 % -4810 23136100 -1,81291221 -7,49E15
105000 18 29 18 % 29 % -68580 261289800 -16,2176894 -1,21E12
106000 2 31 2% 31 % -5620 715792200 -0,72292043 -5,97E15
107000 2 33 2% 33 % -3620 6552200 -0,19320006 -1,59E15
108000 8 41 8% 41 % -6480 5248800 -0,06926065 -2,28E15
109000 13 54 13 % 54 % 2470 469300 0,0014526 7,79E17
110000 9 63 9% 63 % 10710 12744900 0,2470728 9,18E15
112000 15 78 15 % 78 % 47850 152641500 7,93240453 4,91E13
113000 8 86 8% 86 % 33520 140448800 9,58679855 3,17E13
114000 4 90 4% 90 % 20760 2107744400 9,10969025 1,50E13
115000 10 100 10 % 100 % 61900 38316000 38,6378981 1,59E12
P
100 0 1540545E9 -64,89 -3,26E12

Tabla de distribución Frecuencias por clases


Para realizar la tabla de frecuencias por clases o intervalos se deben hacer los siguientes cálcu-
los.
Número de clases
log (n)
k =1+
log (2)
log (100)
k =1+
log (2)
k = 7, 64 ≈ 8

Rango
Rango = xmax − xmin

Rango = 115000 − 100000

Rango = 15000km

Intervalo
L · K ≥ Rango
Rango
L≥
k

Estuardo Andrés Robalino Romero 9


ESTADÍSTICA I

15000
L=
7, 64
L = 1963, 4

Exceso
L · K ≥ Rango

1963, 4 · 8 ≥ 15000

15707, 2 ≥ 15000
707, 2
Exceso = = 353, 6
2
xc −x 3 xc −x 4
(xc − x)2 · nc
 
K(x) xc nc Nc (xc − x) · nc S
· nc S
· ni
[99646,4 – 101609,8[ 100628,1 10 10 -81234 659896276 -71,2546375 137,114751
[101609,8 – 103573,2[ 102591,5 0 0 0 0 0 0
[103573,2 – 105536,6[ 104554,9 19 29 -79735,4 334617580 -18,6657717 18,5556739
[105536,6 - 107500[ 106518,3 4 33 -8932,8 19948729 -0,59216464 0,31325881
[107500 – 109463,4[ 108481,7 21 54 -5665,8 1528632,84 -0,00548207 0,00035036
[109463,4 – 111426,8[ 110445,1 9 63 15242,4 25814528,6 0,58113183 0,23314103
[111426,8 – 113390,2[ 112408,5 23 86 84111 307593927 14,9521049 12,9527058
[113390,2 - 115000[ 114195,1 14 100 76210,4 414858933 30,0183123 38,7084412
P
-4,2 1764258606 44,9665069 207,878322

Datos desagrupados Pn
i=1 xi
x=
n
10881000
x=
100
x = 108810[km]

Datos agrupados Pm
i=1 xi · n i
x=
n
10881000
x=
100
x = 108810[km]

Datos agrupados por clases Pk


c=1 xc · nc
x
b=
n

Estuardo Andrés Robalino Romero 10


ESTADÍSTICA I

10875145, 8
x
b=
100
x
b = 10871, 5[km]

Mediana
Definición: punto donde la muestra se divide en dos partes iguales. La palabra mediana
es sinónimo de parte media.
Datos desagrupados

x +x
 ( n2 ) ( n2 +1)

n → par
2
M ed =
x n → impar

( n+1
2 )

Datos agrupados por clases

n

2
− N(c−1)
[
M ed = li + ·L
nc

li =limite inferior
nc =clase modal que contiene a la mediana
N(c−1) =clase modal anterior que contiene a la mediana

La mediana no es suceptible a los valores atı́picos

Ejemplo
Se utilizan los datos con los que se contruyeron las tablas de frecuencia en la parte de la media
Datos desagrupados
n → par
x n2 + x n2 +1
M ed =
2
109000 + 109000
M ed =
2
M ed = 109000[km]

Datos agrupados por clases

n

2
− N(c−1)
[
M ed = li + ·L
nc

100

2
− 33
[
M ed = 107500 + · 1963, 4
21

Estuardo Andrés Robalino Romero 11


ESTADÍSTICA I

[
M ed = 109089, 419[km]

Moda
Definición: dato que se presenta con mayor frecuencia en la muestra. Se aceptan máximo
dos modas.
Para datos agrupados por clases
 
d1
[
M od = li + ·L
d1 + d2

d1 = nc − n(c−1)

d2 = nc − n(c+1)

li =limite inferior
n(c−1) =clase modal anterior que contiene a la mediana
n(c+1) =clase modal superior que contiene a la mediana

Ejemplo
Se utilizan los datos con los que se contruyeron las tablas de frecuencia en la parte de la media
Datos desagrupados y agrupados
Dato que más se repite:
M od = 105000[km]

Datos agrupados por clases


d1 = nc − n(c−1)

d1 = 4 − 19 = −15

d2 = nc − n(c+1)

d2 = 4 − 21 = −17
 
d1
[
M od = li + ·L
d1 + d2
 
−15
[
M od = 105536, 6 + · 1963, 4
−15 − 17
[
M od = 106456, 9[km]

Medidas de dispersión
Rango

Estuardo Andrés Robalino Romero 12


ESTADÍSTICA I

Definición: diferencia entre las observaciones más grande y más pequeña.

Rango = xmax − xmin

Ejemplo
Se utilizan los datos con los que se contruyeron las tablas de frecuencia en la parte de la media

Rango = xmax − xmin

Rango = 115000 − 100000

Rango = 15000km

Varianza
Definición: representa cuan distantes están los valores con respecto a la media.
 Pn
S 2 = x)2
(xi −b
i=1
M uestral

n−1
Datos no agrupados PN 2
σ 2 = i=1 (xi −u)
P oblacional

N
 Pm
S 2 = (xi −x)2 ·ni
i=1
M uestral

n−1
Datos agrupados PN
σ 2 = (xi −u)2 ·ni
P oblacional
 i=1
N
 Pk 2
S 2 = c=1 (xi −xb) ·nc
M uestral

n−1
Datos agrupados por clases Pk 2
σ 2 = c=1 (xi −xb) ·nc
P oblacional

N

Ejemplo
Se utilizan los datos con los que se contruyeron las tablas de frecuencia en la parte de la media
Datos desagrupados Pn
2 i=1 (xi − x)2 2
S = [u ]
n−1
221533200 2
S2 = [u ]
99
S 2 = 2237709, 1[u2 ]

Datos agrupados Pm
2 i=1 (xi − x)2 · ni 2
S = [u ]
n−1
1540545000 2
S2 = [u ]
99

Estuardo Andrés Robalino Romero 13


ESTADÍSTICA I

S 2 = 15561060, 6[u2 ]

Datos agrupados por clases


Pk
2 c=1 b)2 · nc 2
(xc − x
S = [u ]
n−1

1764258605 2
S2 = [u ]
99
S 2 = 17820793, 99[u2 ]

Coeficiente de Variación
Definición: expresión de la variación como una fracción de la media.

S
CV =
x
Es útil cuando se compara a variabilidad de dos o más conjuntos de datos que difieren
considerablemnte en la magnitud de las observaciones.

Ejemplo
Se utilizan los datos con los que se contruyeron las tablas de frecuencia en la parte de la media
Datos desagrupados
S
CV = ∗ 100 %
X
1495, 9
CV = ∗ 100 %
108810
CV = 1, 375 %

Datos agrupados
S
CV = ∗ 100 %
X
3944, 8
CV = ∗ 100 %
108810
CV = 3, 625 %

Datos agrupados por clases


S
CV = ∗ 100 %
X
4221, 5
CV = ∗ 100 %
108751, 5
CV = 3, 88 %

Estuardo Andrés Robalino Romero 14


ESTADÍSTICA I

Desviación estándar
Definición: es la raı́z cuadrada positiva de la varianza.


S= S2

Ejemplo
Se utilizan los datos con los que se contruyeron las tablas de frecuencia en la parte de la media
Datos desagrupados

S= S 2 [u]
p
S= 2237709, 1[u]

S = 1495, 9[u]

Datos agrupados

S= S 2 [u]
p
S= 15531060, 6[u]

S = 3944, 8[u]

Datos agrupados por clases



S= S 2 [u]
p
S= 17820793, 99[u]

S = 4221, 5[u]

Error Tı́pico
Definición: variación producida por factores distorsionantes tanto conocidos como
desconocidos, son a menudo inevitables.

S
et = √
n

Ejemplo
Se utilizan los datos con los que se contruyeron las tablas de frecuencia en la parte de la media
Datos desagrupados
S
et = √
n
1495, 9
et = √
100

Estuardo Andrés Robalino Romero 15


ESTADÍSTICA I

et = 149, 59

Datos agrupados
S
et = √
n
3944, 8
et = √
100
et = 394, 48

Datos agrupados por clases


S
et = √
n
4221, 5
et = √
100
et = 422, 15

Interpretación y uso de la desviación estándar


Se usa como una medida para comparar la dispersión de datos entre dos o más conjuntos.
Teorema de Chevyshev
Para un conjunto cualquiera de observaciones (muestral o poblaconal) el porcentaje mı́nimo de
los valores que se encuentran dentro de z desviaciones estándar desde la media debe ser por lo
menos 1 − z12 · 100 % ; z > 1

xi − x
z=
S
z=cantidad de desviaciones estándar que está un dato con respecto a la media.
S=desviación estándar.

el 75 % de los datos está a ±2S de la media


el 89 % de los datos está a ±3S de la media
el 96 % de los datos está a ±5S de la media
Para curvas asimétricas

Estuardo Andrés Robalino Romero 16


ESTADÍSTICA I

Ejemplo
Se ha estimado que los estudiantes de la ESPE gastan en promedio $51, 54 quincenalmente con
una desviación estándar de $7, 51. Determinar que porcentaje de estudiantes se encontrarán a
±3, 5 desviaciones estándar respecto de la media.

 
1
1 − 2 · 100 %
z
 
1
1− · 100 = 91, 84 %
(3, 5)2
x1 = x − (3, 5S)

x1 = 51, 54 − (26, 28)

x1 = $25, 25

x2 = x + (3, 5S)

x2 = 51, 54 + (26, 28)

x2 = $77, 82

Estuardo Andrés Robalino Romero 17


ESTADÍSTICA I

Medidas de posición
Cuartiles (Q)
La mediana divide los datos en dos partes iguales. También es posible dividir los datos en más
de dos partes. Cuando se divide un conjunto ordenado de datos en cuatro partes iguales, los
puntos de division se conocen como cuartiles. El primer cuartil, q1 , es un valor que tiene aproxi-
madamente la cuarta parte (25 %) de las observaciones por debajo de él, y el 75 % restante, por
encima de él. El segundo cuartil , q2 , tiene aproximadamente la mitad (50 %) de las observacio-
nes por debajo de él. El segundo cuartil es exactamente igual a la mediana. El tercer cuartil,
q3 , tiene aproximadamente las tres cuartas partes (75 %) de las observaciones por debajo de él.
Definición:Para datos desagrupados y agrupados

qn
P osQq =
4

Para datos agrupados por clases

n

q 4
− N(c−1)
Qq = li + ·L
nc

Ejemplo
Se utilizan los datos con los que se contruyeron las tablas de frecuencia en la parte de la media
Datos agrupados
n 100
P osQ1 = = = 25 → P os25 = 105000km
4 4
2n 200
P osQ2 = = = 50 → P os50 = 109000km
4 4
3n 300
P osQ3 = = = 75 → P os75 = 112000km
4 4
Datos agrupados por clases

100

1 4
−0
Q1 = 103573, 2 + ∗ 1963, 4 = 106156,62km
19

100

2 4
− 33
Q2 = 107500 + ∗ 1963, 4 = 109089, 42km
21

Estuardo Andrés Robalino Romero 18


ESTADÍSTICA I

100

3 4
− 63
Q3 = 111426, 8 + ∗ 1963, 4 = 112451, 18km
23
Deciles (D)
Cuando se divide un conjunto ordenado de datos en diez partes iguales, los puntos de division
se conocen como deciles. El primer decil, d1 , es un valor que tiene aproximadamente la decima
parte (10 %) de las observaciones por debajo de él, y el 90 % restante, por encima de él. El
segundo decil , d2 , tiene aproximadamente la vigésima parte (20 %) de las observaciones por
debajo de él, y asi hasta llegar al noveno decil.

Definición: Para datos desagrupados y agrupados

dn
P osDd =
10

Para datos agrupados por clases

n

q 4
− N(c−1)
Qq = li + ·L
nc

Datos agrupados

n 100
P osD1 = = = 10 → P os10 = 100000km
10 10

2n 200
P osD2 = = = 20 → P os20 = 105000km
10 10
3n 300
P osD3 = = = 30 → P os30 = 106000km
10 10
4n 400
P osD4 = = = 40 → P os40 = 108000km
10 10
5n 500
P osD5 = = = 50 → P os50 = 109000km
10 10
6n 600
P osD6 = = = 60 → P os60 = 110000km
10 10
7n 700
P osD7 = = = 70 → P os70 = 112000km
10 10

Estuardo Andrés Robalino Romero 19


ESTADÍSTICA I

8n 800
P osD8 = = = 80 → P os80 = 113000km
10 10
9n 900
P osD9 = = = 90 → P os90 = 114000km
10 10
Centiles (P)
Cuando un conjunto ordenado de datos se divide en cien partes iguales, los puntos de división
reciben el nombre de centiles. En términos més generales, el 100k-ésimo percentil pk se define
de la siguiente manera:
El 100k-ésimo percentil pk es un valor tal, que al menos el 100k % de las observaciones están
en el valor o por debajo de él, y al menos el 100(1 − k) % están en el valor o por encima de él.
Definición: Para datos desagrupados y agrupados

pn
P osPp =
100

Para datos agrupados por clases

n

q 4
− N(c−1)
Qq = li + ·L
nc

Datos agrupados
n 100
P osP1 = = = 1 → P os1 = 100000km
100 100
23n 2300
P osP23 = = = 23 → P os23 = 105000km
100 100
13n 1300
P osP13 = = = 13 → P os13 = 105000km
100 100
49n 4900
P osP49 = = = 49 → P os49 = 109000km
100 100
75n 7500
P osP75 = = = 75 → P os75 = 112000km
100 100
Medidas de forma
Coeficiente de Simetrı́a

Estuardo Andrés Robalino Romero 20


ESTADÍSTICA I

α3 = ±3 → asimetrı́a es considerable
α3 = ±1, 5 → asimetrı́a moderada
α3 = 0 → curva simétrica

Para datos desagrupados


" n  #
n X xi − x 3
Sesgo = CA = α3 = ·
(n − 1) (n − 2) i=1
S

Para datos agrupados


" m  #
n X x i − x 3
Sesgo = CA = α3 = · · ni
(n − 1) (n − 2) i=1
S

Para datos agrupados por clases


" k  #
n X xi − x 3
Sesgo = CA = α3 = · · nc
(n − 1) (n − 2) c=1
S

Ejemplo
Se utilizan los datos con los que se contruyeron las tablas de frecuencia en la parte de la media
Datos agrupados " #
m  3
n X xi − x
α3 = · · ni
(n − 1) (n − 2) i=1
S

100
α3 = · [−64, 8965824]
(100 − 1) (100 − 2)
α3 = −0, 668

Existe una ası́metrı́a moderada

Estuardo Andrés Robalino Romero 21


ESTADÍSTICA I

Datos agrupados por clases


" k  #
n X xi − x 3
α3 = · · nc
(n − 1) (n − 2) c=1
S

100
α3 = · [44, 9665069]
(100 − 1) (100 − 2)
α3 = 0, 463

Existe una ası́metrı́a moderada

Coeficiente de Curtosis

Para datos desagrupados


" n  #
n(n + 1) X xi − x 4 3(n − 1)2
α4 = · −
(n − 1)(n − 2)(n − 3) i=1
S (n − 2)(n − 3)

Para datos agrupados


" m  4 #
n(n + 1) X xi − x 3(n − 1)2
α4 = · · ni −
(n − 1)(n − 2)(n − 3) i=1
S (n − 2)(n − 3)

Para datos agrupados por clases


" k  #
n(n + 1) X xi − x 4 3(n − 1)2
α4 = · · nc −
(n − 1)(n − 2)(n − 3) c=1
S (n − 2)(n − 3)

Ejemplo
Se utilizan los datos con los que se contruyeron las tablas de frecuencia en la parte de la media
Datos agrupados
" m  #
n(n + 1) X xi − x 4 3(n − 1)2
α4 = · · ni −
(n − 1)(n − 2)(n − 3) i=1
S (n − 2)(n − 3)

Estuardo Andrés Robalino Romero 22


ESTADÍSTICA I

100(100 + 1) 3(100 − 1)2


· −3, 26 ∗ 1012 −
 
α4 =
(100 − 1)(100 − 2)(100 − 3) (100 − 2)(100 − 3)
α4 = −3, 49 ∗ 1010

La gráfica tiene forma platicúrtica

Datos agrupados por clases


" k  #
n(n + 1) X xi − x  4 3(n − 1)2
α4 = · · nc −
(n − 1)(n − 2)(n − 3) c=1
S (n − 2)(n − 3)

100(100 + 1) 3(100 − 1)2


α4 = · [207, 878322] −
(100 − 1)(100 − 2)(100 − 3) (10 − 2)(n − 3)
α4 = −0, 86

La gráfica tiene forma platicúrtica

PROBABILIDAD
Conceptos Básicos
Probabilidad: valor entre cero y uno, inclusive, que describe la posibilidad relativa (oportu-
nidad o casualidad) de que ocurra un evento.
Experimento: proceso que induce a que ocurra una y sólo una de varias posibles observacio-
nes.
Resultado: Un resultado particular de un experimento.
Evento: Conjunto de uno o más resultados de un experimento.
Probabilidad Clásica
Casosf avorables
P robabilidad =
Casostotales
Propiedades

i) 0 ≤ P (A) ≤ 1
Pn
ii) i=1 P (i) = 1

Técnicas de conteo
Experimentos de pasos múltiples
Un experimento que contenga un conjunto infinito de n resultados diferentes puede ser visto
como una sucesión de k pasos en los que hay n1 resultados posibles del primer paso, n2 resultados
posibles del segundo paso y ası́ sucesivamente hasta el último paso k.

n(Ω) = n1 ∗ n2 ∗ ... ∗ nk

Estuardo Andrés Robalino Romero 23


ESTADÍSTICA I

Para el lanzamiento de dos dados y dos monedas

n(Ω) = 2 ∗ 2 ∗ 6 ∗ 6 = 144

nr

r=nuestra
n=resultados posibles

Ejercicios

1. Se desea clasificar a un grupo de personas de acuerdo a su género, estado civil y nivel de


estudios. Determinar el tamaño del espacio muestral. 



 P rimaria
 


M
 Secundaria

Género G 2 Nivel de estudio N E 4
F
 

 Superior





P osgrado




 Casado



Divorciado

Estado Civil ES 4 n(Ω) = 2 ∗ 4 ∗ 4 = 32
Soltero








V iudo

2. ¿Cuántos resultados posibles puedo tener de lanzar 3 dados a la vez?

nr = 63 = 216

Estuardo Andrés Robalino Romero 24


ESTADÍSTICA I

3. ¿Cuántas claves diferentes se puede obtener para un candado que consta de 4 ruedas
numéricas del 0 al 9?

nr = 104 = 10000

4. Se desea escoger 5 números de 20 posibles para obtener el número ganador de una loterı́a
Permutación sin repetición r < n
r=5
n!
nP r =
(n − r)!
nP r = 1860480

5. En un curso de 30 estudiantes se desea elegir a su directiva (presidente, secretario, teso-


rero), todos pueden ser elegidos, pero ninguno puede ejercer más de un cargo. ¿Cuántos
resultados posibles podrı́a tener de esta elección?

r=3

n! 30!
nP r = =
(n − r)! (30 − 3)!
nP r = 24360

6. En una sala de espera hay 4 sillas, ¿cuáles y cuántas son las formas en que pueden colo-
carse en ellas 4 personas?

nP n = n!

nP n = 4! = 24

7. En una sala de espera hay 4 sillas, ¿cuáles y cuántas son las formas en que pueden colo-
carse en ellas 2 personas?

n! 4!
nP r = =
(n − r)! (4 − 2)!
nP r = 12

n(Ω) = 12

Estuardo Andrés Robalino Romero 25


ESTADÍSTICA I

Ω = {AB, AC, AD, BA, BC, BD, CA, CB, CD, DA, DB, DC}

8. Para el control de calidad, un superior debe seleccionar al azar 5 de cada 100 piezas, para
verificar que no tengan defectos,¿cuántos resultados diferentes se pueden obtener?

n! 100!
nCr = = = 75287520
(n − r)!r! (100 − 5)!5!

9. Al lanzar 3 dados, ¿cuántas formas se puede obtener en uno de ellos el número 1 y en los
restantes dados números diferentes entre si?

• En un dado debe salir 1, entonces el primer dado se elimina.

• En los otros dos dados se elimina el 1 porque ya salió en el primer dado y no deben
repetirse.

5C2 = 10

10. En el mismo ejemplo anterior se pide ahora calcular la probabilidad de obtener el número
1 en uno de los 3 dados.
A: Saalga el número 1 en uno de los 3 dados y números diferentes en los restantes 3 dados

Casosf avorables
P robabilidad =
Casostotales
10
P (A) = · 100 % = 4, 63 %
216
Adición de eventos
Regla de adición de eventos

P (A ∨ B) = P (A ∪ B) = P (B ∪ A) = P (A) + P (B) − P (A ∩ B)

Estuardo Andrés Robalino Romero 26


ESTADÍSTICA I

Mutuamente excluyentes

P (A ∪ B) = P (A) + P (B) − P (A ∩ B)

P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (A ∩ B) − P (A ∩ C) + P (A ∩ B ∩ C)

P (A ∪ B ∪ C) = P (A) + P (B) + P (C)

P (A)0 = 1 − P (A)

Reglas de la multiplicación
Probabilidad Condicional
Es la probabilidad de que ocurra un evento en particular dado que ocurrió otro previa-
mente
P (A|B) = P (A ∩ B)|P (B)

Estuardo Andrés Robalino Romero 27


ESTADÍSTICA I

Regla general de la multiplicación


Regla de la probabilidad conjunta
Se utiliza para determinar la probabilidad conjunta de que ocurra dos o más eventos
cualesquiera.

P (A ∧ B) = P (A ∩ B) = P (B ∩ A) = P (A) ∗ P (B|A)

Ejemplo
Una pareja de amigos deciden ir al cine. La probabilidad de que el chico llegue al cine es del 80 %
y la probabilidad de que la chica llegue al cine es del 60 % y si se considera que sus ausencias
son eventos independientes. Calcular la probabilidad de que:

a) Los dos lleguen al cine


A:chico llegue al cine
B:chica llegue al cine

P (A ∩ B) = P (A) ∗ P (B|A)

P (A ∩ B) = P (A) ∗ P (B)
8 6
P (A ∩ B) = ∗ = 48 %
10 10

b) Ninguno llegue el cine

P (A0 ∩ B 0 ) = P (A0 ) ∗ P (B 0 ) = 0, 2 ∗ 0, 4 = 8 %

c) Solo uno de los dos llegue al cine

P (A ∩ B 0 ) = P (A) ∗ P (B 0 ) = 0, 8 ∗ 0, 4 = 32 %

P (A0 ∩ B) = P (A0 ) ∗ P (B) = 0, 2 ∗ 0, 6 = 12 %

Existe el 44 %

Independencia de eventos
Dos eventos A y B serán independientes si la ocurrencia del uno no afecta a la ocurrencia del

Estuardo Andrés Robalino Romero 28


ESTADÍSTICA I

otro y se cumple que:


P (A ∩ B) = P (A) ∗ P (B)

Consideraciones

1. Nunca se debe asumir que dos eventos son indeoendientes hasta estar absolutamente
seguros.

2. Se puede pensar que son eventos independientes cuando los eventos son fı́sicamente inde-
pendientes.

3. Diferenciar entre eventos mutuamente excluentes y eventos independientes


Para demostrar la independencia de eventos se deben seguir los siguientes pasos:

a) P (A ∩ B) = P (A) ∗ P (B) demostrar esta igualdad

b) Evaluar el producto de P (A) ∗ P (B)

c) Determinar el valor de la probabilidad P (A ∩ B por otro método

d ) Evaluar si P (A ∩ B) es igual a P (A) ∗ P (B)

Ejemplo
Si se arrojan 2 dados, uno rojo y otro blanco, determinar si los eventos son independientes si
se definen los siguientes eventos. A: dado rojo muestra un número divisible para 3, B: dado
blanco muestra un número divisible para2.

2 1
P (A) = =
6 3

3 1
P (B) = =
6 2
1 1 1
P (A) · P (B) = ∗ =
3 2 6
A = {3, 6}

B = {2, 4, 6}
n(A ∩ B) 6 1
(A ∩ B) = {3 − 2, 3 − 4, 3 − 6, 6 − 2, 6 − 4, 6 − 6} = = =
n(Ω) 36 6
P (A ∩ B) = P (A) · P (B)
1 1
=
6 6
Los eventos son independientes

Estuardo Andrés Robalino Romero 29


ESTADÍSTICA I

Adición de eventos
Tablas de contingencia
Definición: tabla utilizada para clasificar observaciones de una muestra, de acuerdo con dos
o más caracterı́sticas identificables.
Ejemplo
Se sortea un viaje a Galápagos entre los 120 mejores estudiantes de la ESPE, de ellos 60 son
mujeres, 80 son solteros o solteras y 45 son mujeres solteras.

a) Elabore la tabla de contingencia y diagrama de árbol

b) Determine la probabilidad de que gane un hombre casado

25
P (H ∩ C) = = 20, 83 %
120

Estuardo Andrés Robalino Romero 30


ESTADÍSTICA I

c) Si se sabe que el afortunado/a es soltero/a.¿Cuál es la probabiliad de que sea mujer?

45
P (M |S) = = 56, 25 %
80

OJO
Cuando se tienen 2 ó más eventos mutuamente exluyentes y su unión(suma) genera el espacio
muestral, entonces se dice que los eventos son exaustivos

P (B) = P (B ∩ A) ∪ P (B ∩ A0 )

P (B) = P (A) · P (B|A) + P (A0 ) · P (B|A0 )

P (B) = P (B ∩ E1 ) ∪ P (B ∩ E2 ) ∪ ...P (B ∩ En )

P (B) = P (E1 ) · P (B|E1 ) + P (E2 ) · P (B|E2 ) + ... + P (En ) · P (B|En )


n
X
P (B) = P (Ei ) · P (B|Ei )
i=1

Ejemplos

1. Durante el proceso de fabricación de circuitos integrados, la probabilidad de que un cir-


cuito integrado qeu está sujeto a altos niveles de contaminación sea la causa de falla de
un equipo es de 0,10. Por otra parte la probabilidad de que un circuito que no está sujeto
a altos niveles de contaminación sea la causa de falla es de 0,005. En un dı́a de produc-
ción el 20 % de los circuitos están sujetos a altos niveles de contaminación. ¿Cuál es la
probabilidad de que un equipo que utilice alguno de estos circuitos integrados falle?
A :altos niveles de contaminación

Estuardo Andrés Robalino Romero 31


ESTADÍSTICA I

A0 :bajos niveles de contaminación


F :falla de equipo
P (A) = 0, 2

P (A0 ) = 0, 8

P (F |A) = 0, 10

P (F |A0 ) = 0, 005

P (F ) = P (F ∩ A) ∪ P (F ∩ A0 )

P (F ) = P (A) · P (F |A) + P (A0 ) · P (F |A0 )

P (F ) = (0, 2 ∗ 0, 10) + (0, 8 ∗ 0, 005)

P (F ) = 0, 024 = 2, 4 %

2. En el ejemplo anterior supongase que 0,01 es la probabilidad de que un circuito integrado


expuesto a niveles medios de contaminación sea la causa de falla de un equipo y que 0,001
es la probabilidad de que un circuito integrado expuesto a bajos niveles de contaminación
sea la cuasa de falla.
En un dı́a de producción el 20 % de los circuitos están expuestos a altos niveles de conta-
minación, el 30 % a niveles medios de contaminación y el resto a bajos.
¿Cuál es la probabilidad de que falle un equipo que use uno de estos circuitos?
A :altos niveles de contaminación
M :niveles medios de contaminación
B :bajos niveles de contaminación
F :falle el equipo

Estuardo Andrés Robalino Romero 32


ESTADÍSTICA I

P (A) = 0, 2 P (F |A) = 0, 10
P (M ) = 0, 3 P (F |M ) = 0, 01
P (B) = 0, 5 P (F |B) = 0, 001

P (F ) = P (F ∩ A) ∪ P (F ∩ M ) ∪ P (F ∩ B)

P (F ) = P (A) · P (F |A) + P (M ) · P (F |M ) + P (B) · P (F |B)

P (F ) = (0, 2 ∗ 0, 10) + (0, 3 ∗ 0, 01) + (0, 001 ∗ 0, 5)

P (F ) = 0, 0235 = 2, 35 %

Teorema de Bayes
Definición: Si A1 , A2 , AK son k eventos exhaustivos y mutuamente exclyentes, y B es
cualquier evento, entonces:
P (A ∩ B) = P (B ∩ A)

P (A) · P (B|A) = P (B) · P (A|B)


P (A) · P (B|A) P (A) · P (B|A)
P (A|B) = = PN
P (B) i=1 P (Ai )·P (B|Ai )

Ejemplo
Debido a que un nuevo procedimiento médico ha demostrado su eficacia en la detección tem-
prana de cierta enfermedad, se propone realizar un examen médico preventivo. La probabilidad
de que la prueba sea positiva e identifique de manera correcta a una persona que tiene la en-
fermedad es de 0,99 mientras que la probabilidad de que la prueba sea negativa e identifique
correctamente a una persona sin la enfermedad es 0,95. La incidencia de la enfermedad en la
población es de 0,0001. Se realiza una prueba y esta resulta positiva.
¿Cuál es la probabilidad de que esa persona tenga realmente la enfermedad?.
P (N ) = 0, 9999 P = pruebapositiva
P (P ) = 0, 001 N = pruebanegativa

Estuardo Andrés Robalino Romero 33


ESTADÍSTICA I

P (I|N ) = 0, 05 I = identif ique


P (I|P ) = 0, 99

P (N ) · P (P |N )
P (N |P ) =
(0, 001 ∗ 0, 99) + (0, 05 ∗ 0, 9999)
0, 0001 ∗ 0, 99
P (N |P ) =
(0, 001 ∗ 0, 99) + (0, 05 ∗ 0, 9999)
P (N |P ) = 1, 97 ∗ 10−3 = 0, 1976 %

Bibliografı́a

Lind, D., Marchal, W., Wathen, S. (s.f.). Estadı́stica aplicada a los negocios y la economı́a
. Mcgraw-Hill.

Montgomery, D. (s.f.). Probabilidad y Estadı́stica aplicadas a la ingenierı́a. Arizona:


Mcraw-Hill.

Estuardo Andrés Robalino Romero 34

You might also like