Professional Documents
Culture Documents
Al modelar un sistema, se debe diferenciar entre dos tipos de datos los primeros
permanecen sin cambio a través del tiempo y se conocen como “parámetros”; los segundos
presentan cambios a través del tiempo y se conocen como “variables”. Por ejemplo, el
modelado de un sistema mediante simulación es útil cuando la información del sistema
tiene carácter de dinámico y probabilístico, debido principalmente a que la interacción de
esa información es, por lo general, difícil de analizar.
La variabilidad que presenta el segundo tipo de datos debe modelarse de acuerdo con
ciertas ecuaciones matemáticas que son capaces de reproducirla; en la mayoría de los casos
dicha variabilidad puede clasificarse dentro de alguna distribución de probabilidad. Así
pues, uno de los pasos más importantes de todo el proceso de modelado estocástico es la
búsqueda de información y su análisis estadístico posterior basado principalmente en la
clasificación de cada serie de datos dentro de alguna distribución de probabilidad. Algunas
de las distribuciones más comunes se analizan a continuación.
Uniforme U(a, b)
Función de densidad 1
f ( x) = si a ≤ x ≤ b
b−a
Distribución acumulada x−a
F ( x) = si a ≤ x ≤ b
b−a
Parámetros A y b son números reales con a < b; a es un
parámetro de ubicación; b-a es un parámetro
de escala
Rango [a, b]
Media a+b
2
18
Variancia (b − a )2
12
Exponencial Expo(λ)
Función de densidad 1 −xλ
f ( x) = e si x ≥ 0
λ
Distribución acumulada −x
F ( x) = 1 − e λ si x ≥ 0
Parámetros Parámetro de escala λ > 0
Rango [0, ∞ )
Media λ
Variancia λ2
Weibull Weib(α, β)
Función de densidad −( x )
α
αβ −α x α −1e β si x > 0
f (x) =
0 de otra manera
Distribución acumulada − ( x β )α
1− e si x > 0
F (x) =
0 de otra manera
19
Triangular TR(a,b,c)
Función de densidad 2( x − a )
si a ≤ x ≤ b
(c − a )(c − b )
f (x) =
2(c − x )
si b ≤ x ≤ c
(c − a )(c − b )
Distribución acumulada ( x − a )2 si a ≤ x ≤ b
(c − a )(b − a )
F (x ) =
1−
(c − x)
2
si b ≤ x ≤ c
(c − a )(c − b )
Parámetros Parámetro de localización: µ
Parámetro de escala: α
Rango a, b
Media a+b+c
3
Variancia a + b 2 + c 2 + ac − ab − bc
2
18
20
Normal N(µ, σ)
Función de densidad 1 x−µ
2
1 −
f ( x) = e 2 σ −∞ ≤ x ≤ ∞
σ 2π
Distribución acumulada No existe ecuación
Parámetros Parámetro de localización: µ
Parámetro de escala: σ
Rango (− ∞, ∞ )
Media µ
Variancia σ2
Lognormal LOGN(µ, σ)
Función de densidad 1
− (ln x − µ )2
2σ 2
exp si x > 0
x 2πσ 2
f ( x) =
0 de otra manera
Distribución acumulada No existe ecuación
Parámetros Parámetro de escala: µ
Parámetro de forma: σ
Rango [0, ∞ )
21
Media e −µ+
σ
2
Variancia 2
(
e 2 µ +σ e −σ − 1
2
)
Este tipo de distribuciones sirven para modelar la aleatoriedad de una variable que sólo
puede tomar valores enteros. Las siguientes distribuciones son algunas de las más utilizadas
en el modelado de sistemas estocásticos.
Bernoulli Be(t, p)
Distribución de probabilidad 1− p si x = 0
p (x) =
p si x =1
Distribución acumulada 0 si x≤0
F ( x) = 1− p si 0 ≤ x ≤1
1 si x ≤1
Rango {0,1}
Media p
Variancia p(1 − p )
Binomial BI(n, p)
Distribución de probabilidad n x
p (1 − p ) ∀x ∈ {0,1, , n}
n− x
x
p( x) =
0 de otra manera
Distrubución acumulada 0 si x < 0
x n i
p (1 − p )
i
F ( x) = x si 0 ≤ x ≤ n
i =0 j
1 si x > n
Rango {0,1, , n}
Media np
Variancia np(1 − p )
23
Poisson PS(λ)
Distribución de probabilidad e λ −λ x
si x ∈ {0,1, }
x!
p( x) =
0 de otra manera
Distribución acumulada x
λ i
F ( x ) = e −λ si x ≥ 0
i =0 i!
Rango λ > 0, x entero
Media λ
Variancia λ
Geométrica GE(p)
Distribución de probabilidad p(1 − p ) si x ∈ (0,1, )
x
f ( x) =
0 de otra manera
1 − (1 − p )
Distribución acumulada [ x ]+1
si x ≥ 0
F ( x) =
0 de otra manera
Rango {0,1, , n}
Media 1− p
p
24
Variancia 1− p
p2
1. Se colocan los n datos históricos (al menos 30 datos) en una tabla de frecuencias de
m = n intervalos. Se obtiene la frecuencia observada en cada intervalo i, (FOi). Se
calcula la media y la variancia de los datos.
2. Se propone una distribución de probabilidad de acuerdo con la forma de la tabla de
frecuencias obtenida en el paso 1.
3. Con la distribución propuesta, se calcula la frecuencia esperada para cada uno de los
intervalos (FEi) mediante la integración de la distribución propuesta y su posterior
multiplicación por el número total de datos.
4. Se calcula el estimador:
m
(FEi − FOi )2
C=
i =1 FEi
25
Ejemplo:
Se desea obtener la distribución de probabilidad ideal, conque se reciben llamadas para
consulta en un servicio de biblioteca. La información histórica se resume en el siguiente
cuadro, en el cual se menciona la cantidad de llamadas que se recibieron en el intervalo de
una hora, esto es, el total de horas que se tomaron para información, fue de 509.
Tabla de frecuencias: Ya esta dada con la información. Así como la frecuencia observada.
n 509 n 509
400
315
300
FO
200 142
100 40
0 1 2 3 9 4 2 5 1
0
1 2 3 4 5 6
Llamadas
0.5147 + 0.5995
λ= = 0.5571
2
Se calcula el estimador:
27
m
(FEi − FOi )2
C=
i =1 FEi
No. de FO PO PE FE (FE-FO)2/FE
llamadas
0 315 0.6189 0.5729 291.6061 1.8768
1 142 0.2790 0.3191 162.4219 2.5677
2 40 0.0786 0.0889 45.2501 0.6091
3 9 0.0177 0.0165 8.3985 0.0431
4 2 0.0039 0.0023 1.1707 0.5875
5 1 0.0020 0.0003 0.1527 4.7015
Sumatoria 509 1.0000 1 509.0000
No. de PO
llamadas
3 0.0177
4 0.0039
5 0.002
Sumatoria 0.0236
C = 5.5874
5.5874 < 5.99. Entonces no se puede rechazar la hipótesis de que la información histórica
sigue una distribución Poisson con media = 0.5571 con un 95% de confianza.
Los primeros pasos ya se resolvieron en el ejemplo anterior y los últimos pueden resumirse
con la elaboración del siguiente cuadro.
DM = 0.0460
29
Límite correspondiente a la tabla con 509 datos y un nivel de confianza de 95%, igual a:
1.36 1.36
= = 0.0603
n 509
Son números con la misma probabilidad de ocurrencia. Serie de números cuya secuencia no
puede predecirse.
Generación de aleatorios entre 0 y 1.
U (0, 1)
Utilidad.
Se utilizan para generar el comportamiento de la información de entrada.
Existen un gran número de métodos para generar los números aleatorios entre 0 y 1. El
método a utilizar, en sí mismo, no tiene importancia; la importancia radica en los números
que genera, ya que estos números deben cumplir ciertas caractrísticas para que sean
válidos. Dichas características son:
1. Uniformemente distribuidos.
2. Estadísticamente independientes.
1
3. Su media debe ser estrictamente igual a .
2
1
4. Su variancia debe ser estadísticamente igual a .
12
5. Su período o ciclo de vida debe ser largo.
1 x
Figura 2.13. Función de densidad de probabilidad para el conjunto de los números
pseudoaleatorios
30
1 1
f ( x)dx = dx
0 0
1
2
µ=
1
xf ( x)dx =
x =
1
0 2
2 0
2 2
1 1 1 1 1
σ = 2
x− f ( x)dx = x− dx = 0.0833 =
0 2 0 2 12
Métodos congruenciales.
ri +1 = [(a ∗ c) + ri ]
donde:
r0 = semilla del generador
a, c.m = constantes
r0 = 5
r1 = (7 * 5 + 3) mod 9 = 2
r2 = (7 * 2 + 3) mod 9 = 8
r3 = (7 * 8 + 3) mod 9 = 5
r1 = 0.3721
r2 = 0.4060
r3 = 0.8473
r4 = 0.5757
r5 = 0.0496
De acuerdo con Holl y Dovell, los mejores resultados para un generador congruencial
mixto en una computadora binaria son:
• a = 8*c ± 3
• c = cualquier entero.
• r0 = cualquier entero impar.
• m = 2 b donde b >2 y que m sea aceptado por la computadora.
Una vez que se ha creado o se puede usar un generador es importante verificar sí los
números generados poseen las características mencionadas. La comprobación de tales
características se realiza mediante ciertas pruebas estadísticas, que son las siguientes:
Prueba de medias
Consiste en verificar que los números generados tengan una media estadísticamente igual a
2 , de esta manera, se analiza la siguiente hipótesis
1
H0 : media = 0.5
H1 : media ≠ 0.5
Paso 1.
Calcular la media de los n números generados.
1 n
x= ri
n i =1
Paso 2.
Calcular los límites superior e inferior de aceptación:
1 1
ls x = + zα 2
2 12 n
1 1
li x = − zα 2
2 12 n
Paso 3.
Si el valor de x se encuentra entre li x y ls x , aceptamos que los números tienen una media
estadísticamente igual a 12 con un nivel de aceptación de 1 - α.
1 1 1 1
ls x = + zα 2 = + 1.96 = 0.5298
2 12 n 2 12 30
1 1 1 1
li x = − zα 2 = − 1.96 = 0.4701
2 12 n 2 12 30
dado que el valor promedio se encuentra entre los límites, se acepta la hipótesis H0, es
decir, se puede afirmar que la media de los números es estadísticamente igual a 12 .
Prueba de Variancia.
Consiste en verificar si los números aleatorios generados tienen una variancia de 0.083, de
tal forma que la hipótesis queda expresada como:
H0 : Var = 1/12
H1 : Var ≠ 1/12
Paso 1.
Calcular la variancia de los n números generados V ( x) .
n
(r i − x)
2
V ( x) = i =1
n −1
Paso 2.
Calcular los límites superior e inferior de aceptación.
χ α2 ,n −1
ls v ( x ) = 2
12(n − 1)
χ 2α ,n −1
−
liv ( x ) = 2
12(n − 1)
Paso 3.
Si V ( x) se encuentra entre los valores de ls v ( x ) y liv ( x ) , aceptamos la hipótesis nula y los
números aleatorios tienen una variancia estadísticamente igual a 1
12 .
Al calcular V(x) se obtiene que es igual a 0.104. Al calcular los límites de aceptación para
muestras de tamaño 30.
χ α2 ,n −1 χ 02.025, 29 45.7
ls v ( x ) = 2
= = = 0.1313
12(n − 1) 12(n − 1) 12(29)
χ 2
−α
2 , n −1
χ 02.975, 29 16.04
liv ( x ) = = = = 0.046
12(n − 1) 12(n − 1) 12(29)
el valor se encuentra dentro de límites por lo que se acepta que la variancia de la muestra es
estadísticamente igual a 121 .
Prueba de Forma.
Para realizar esta prueba se utiliza la prueba de bondad de ajuste χ 2 , ya vista con
anterioridad. Esta prueba se empleará en el caso específico de los números aleatorios
uniformes entre 0 y 1, para probar que un conjunto de datos siga esta distribución. De esta
manera la hipótesis propuesta se resume como sigue
H0 : ri U ( 0,1 )
H1 : ri U ( 0,1 )
Ejemplo. Tomando los 30 números del ejemplo anterior, determine con un nivel de
confianza del 95% si pertenecen a una población uniforme.
Dividiendo el rango de 0 a 1 en 10 intervalos y clasificando los 30 números según su valor,
se obtiene la siguiente tabla.
Pruebas de independencia.
Las pruebas de independencia consisten en demostrar que los números generados son
estadísticamente independientes entre sí, esto es, que no dependen uno de otro. Para esto se
propone la siguiente hipótesis:
H0: ri ∼ Independiente
H1: ri ∼ Dependiente
Para realizar esta prueba de hipótesis existen varios métodos, puede seleccionarse
cualquiera de la siguiente lista:
− Pruebas de póker
− Prueba de corridas arriba y abajo.
− Prueba de corridas arriba y abajo de la media.
− Prueba de la longitud de las corridas.
− Prueba de distancia.
− Pruebas de series.
− Prueba de huecos.
Prueba de Póker :
Paso 1.
Calcular las probabilidades esperadas para un juego de póker con cinco cartas numeradas
del 0 al 9 con remplazo, se tienen siete eventos o intervalos, con las siguientes
probabilidades:
Paso 2.
Calcular la frecuencia esperada de cada uno de los eventos (FEi) multiplicando la
probabilidad de cada evento por el total de números aleatorios generados.
Paso 3.
Para cada número aleatorio generado verificar (imaginando que es una mano de póker) si es
pachuca, un par, dos pares, etcétera, tomando los primeros cinco dígitos a la derecha del
punto decimal. Por ejemplo 0.03408 es un par, 0.44343 es un full, 0.00121 dos pares,
36
etcétera. Con estos resultados se genera una tabla de frecuencia de estos eventos. La
frecuencia observada de cada uno de los eventos se conoce como (FOi).
Paso 4.
Calcular el estadístico C de χ 2 con m = 7 .
Paso 5.
Si el valor de C es menor o igual al estadístico de tablas χ 2 con 6 grados de libertad y una
probabilidad de rechazo α, entonces se acepta que los datos son estadísticamente
independientes entre sí.
Ejemplo. Realice la prueba de póker a los siguientes 30 números con un nivel de confianza
del 95%.
Agrupando los números de acuerdo con sus dígitos, como si fuera una mano de póker se
obtiene la siguiente tabla de frecuencias:
El cálculo de C es igual a 6.75 que comparado contra el valor de tablas χ 2 con 7-1 = 6
grados de libertad, y con un nivel de 5%, que es igual a 12.59, indica que los número
generados son estadísticamente independientes.
Prueba de corridas.
Paso 1.
Clasificar cada número aleatorio con respecto al anterior, de acuerdo con:
Si ri ≤ ri −1 ri = −
Si ri ≥ ri −1 ri = +
Paso 2.
37
Paso 3.
Calcular E (h) y V (h) de acuerdo con:
2n − 1
E ( h) =
3
16n − 29
V ( h) =
90
donde n es el número de datos generados.
Paso 4.
Calcular el estadístico z =
(h − E (h) ) , si es menor que el valor crítico Z α 2 se acepta la
V ( h)
hipótesis de independencia.