You are on page 1of 32

Instituto Tecnolgico

Superior de Lerdo

Temas: Inventarios, Lneas De Espera, Simulacin, Teora De Juegos,


Cadenas De Markov Y Programacin Dinmica.
Carrera: Informtica
Materia: Investigacin de operaciones II
Catedrtico:
4F4B I.S.C. E.D. M.E. Ricardo de Jess Bustamante Gonzlez

Alumnos del equipo:


Andrea Alejandra De La Cruz Ortiz (09231073)
Yulma Carolina Camacho Medrano (09231132)
Sheila Lizeth Contreras Torres (09231285)
Manuel de Jess Campos Snchez (09231148)
Jafet Rubn Carrillo Bustamante (09231286)

Pgina 1

Juan David Alvarado Balderas (09231214)

Instituto Tecnolgico
Superior de Lerdo

ndice
Contenido
1.

2.

INVENTARIOS................................................................................................ 3
1.1.

El costo total............................................................................................. 3

1.2.

FORMULARIO.......................................................................................... 4

LNEAS DE ESPERA....................................................................................... 8
2.1.

Modelos de una cola y un servidor...............................................................8

Nomenclatura de las frmulas:.....................................................................9


3.

SIMULACIN............................................................................................... 17

4.

TEORA DE JUEGOS..................................................................................... 18
4.1.

Qu es un juego?.................................................................................. 18

4.1.1. Estrategias........................................................................................ 18
4.1.2. Juegos de suma cero para dos personas: estrategias aleatorias,
dominacin y solucin grfica....................................................................18
4.1.3..............................................Estrategias aleatorias o combinados
20
4.1.4. Solucin grafica de pares y nones..............................................20
5.

CADENA DE MARKOV................................................................................... 22
5.1.1. Problema de la cadena de Markov:....................................................22
PROGRAMACIN DINMICA.........................................................................25
6.1.

7.

Problema de la diligencia:.........................................................................25

PROGRAMACIN DINMICA DETERMINSTICA.............................................28

Pgina 2

6.

Instituto Tecnolgico
Superior de Lerdo

1. INVENTARIOS
En este modelo se representan iguales el inventario mximo y la cantidad pedido.
Cabe mencionar que este no siempre es verdadero.

1.1.

El costo total

Para un periodo en este modelo est conformado por tres componentes de costo:
Costo unitario del producto (C1)
Costo de ordenar una compra (C2)
Costo de mantener un producto en almacn (C 3)

Pgina 3

Instituto Tecnolgico
Superior de Lerdo

1.2.

FORMULARIO

Este formulario es de gran utilidad a la hora de tratar con problemas empleados en


la teora de inventarios.
EOQ = Cantidad optima de periodo:
Q=

2 DC 2
C3

Costo total por ao:


TC( q)=(C 1)(D)+(C 2) D/Q+(C 3) Q/2

TC ( q )=

C 2D
C3q
+ ( C 1 ) ( D )+
q
2

El nmero de periodos por ao:


N=D /Q

Tiempo en pedidos (tiempo periodos)


T =Q/ D

Inventario promedio:
Q/ 2

Pgina 4

Costo de retencin anual si la cantidad de pedidos es:

HC ( q )=

C3q
2

Costo de prdida anual si la cantidad de pedido es:


q

Instituto Tecnolgico
Superior de Lerdo

OC ( q )=

C2 D
q

EOQ cuando costo de retencin se expresa en trminos del valor del


2 DC 2
q
C1C3

inventario en dlares:
Punto de reposicin = LD

Ejemplo 1: Inventario
La empresa servimedica vende agujas hipodrmicas a hospitales y desea reunir
el costo de su inventario determinado el costo ptimo de agujas hipodrmicas de
cada pedido. La demanda anual es de 1000 unidades, el costo de preparacin por
pedido es de $10 .00 y el costo de almacenamiento por unidad por ao es de
$0.50 cada aguja tiene un precio de $3.00.

Cantidad ptima:
Primero se reemplazan los datos en la primera frmula, sta es
utilizada para calcular la cantidad ptima de pedido:

Q=

( 2 DC 2 )
( c 3)

Q=

2(1000)(10)
.50

Despus se efectan cada una de las operaciones indicadas iniciando por las
Pgina 5

operaciones dentro del parntesis, despus la divisin y por ltimo la raz


cuadrada:

Q=

2000
.50

Q=200

Costo total por ao:


Ahora se reemplazaran los datos para calcular el costo total por ao:

Instituto Tecnolgico
Superior de Lerdo

CT= (C 1D ) + C

2D
3Q
+(C
)
Q
2

CT= (31000 ) +

.50200
+(
)
( 101000
)
200
2

CT= (3000 )+ (105 ) +(.50100)

CT=3100
CT= (3000 )+ (50 )+(50)
Nmero de pedidos por ao:
A continuacin calcularemos el nmero de pedidos por ao, de igual modo
remplazamos los datos en la frmula, y se efecta la operacin.

N=

D
Q

N=

N=5

1000
200

Tiempo entre pedidos:


Por ltimo reemplazamos los valores en la siguiente frmula, y se realiza la
operacin.

Q
D

t=

200
1000

t=0.2

Pgina 6

t=

Ejemplo 2: Inventario
Una empresa vende un artculo que tiene una demanda de 18,000 unidades por
ao, su costo de almacenamiento por unidad es de $1.20 y el costo de ordenar
una compra es de $400.00. El costo total unitario del artculo es de $1.00 no se
permite faltante de unidades y su tasa de reemplazo es instantneo.

Instituto Tecnolgico
Superior de Lerdo

Cantidad ptima:
Al igual que el problema anterior se reemplazan los datos en la
primera frmula y calcularemos la cantidad ptima de pedido:

Q=

(2 D C 2)

Q=

(iC 1)

2(18,000)(400)
(1.201)

Despus se efectan cada una de las operaciones indicadas.

Q=

14400000
1.20

Q=3,465 unidades

Costo total por ao:

2D
3Q
+(C
)
Q
2
Ahora se reemplazaran los datos para calcular el costo total por ao:

CT= (C 1D ) + C

CT = (1.0018,000 ) +

1.203,465
+(
)
( 40018,000
)
3,465
2

Y se efectan cada una de las operaciones indicadas, en orden jerrquico.

Pgina 7

CT= (18,000 )+ (2077.92 ) +(2079)


CT=22,156.92ao
Nmero de pedidos por ao:
A continuacin calcularemos el nmero de pedidos por ao, se sustituyen los
valores en la frmula, y se realiza la operacin.

N=

D
Q

N=

18,000
3,465
N=5.19

Instituto Tecnolgico
Superior de Lerdo

Tiempo entre pedidos:


Para concluir; se calcula el tiempo entre pedidos, de igual modo se sustituyen los
vales en la frmula, y se realiza la operacin correspondiente.

Q
D

t=

Pgina 8

t=

3,465
18,000

t=0.1925 aos

Instituto Tecnolgico
Superior de Lerdo

2. LNEAS DE ESPERA

Una cola es una lnea de espera.

La teora de colas es un conjunto de modelos matemticos que describen


sistemas de lneas de espera particulares.

El objetivo es encontrar el estado estable del sistema y determinar una


capacidad de servicio apropiada.

2.1.

M/M/1
M/G/1
M/D/1
M/Ek/1

Pgina 9

Modelos de una cola y un servidor

Instituto Tecnolgico
Superior de Lerdo

M/M/1:

Un servidor con llegadas de Poisson y tiempos de servicio


exponenciales.

Frmula M/M/1

Ls =

1
Ws=

( 1 p) t

2
( )

W q=

( )

P=( L S >n ) Pn+1

n
Pn=( 1P ) P

P ( W S >t ) e

Lq =

( 1 p ) t

P ( W q >t ) pe
t 0, p< 1

Nomenclatura de las frmulas:

: Tasa media de llegadas o probabilidad de llegadas.


: Es el nmero de clientes que puedo atender en un tiempo (n).
p: Tasa media de llegadas/ nmero de clientes que puedo atender en un
tiempo (n).
Ls: Nmero esperado de clientes en el sistema.
Lq: Nmero esperado de clientes en la cola.
Ws: Tiempo esperado de espera en el sistema.
Wq: Tiempo esperado de espera en la cola.
Pn: Probabilidad de tener X cantidad de clientes en el sistema.
Pn+1: Probabilidad de tener una cola de x.
P (Ws > t): Probabilidad de esperar ms de x tiempo en el sistema.
P (Wq > t9: Probabilidad de esperar ms de x tiempo en la cola.

Pgina 10

Instituto Tecnolgico
Superior de Lerdo

Ejemplo1. M/M/1
Un lavacar puede atender un auto cada 5 minutos y la tasa media de llegadas es
de 9 autos por hora. Obtenga las medidas de desempeo de acuerdo con el
modelo M/M/1. Adems la probabilidad de tener 0 clientes en el sistema, la
probabilidad de tener una cola de ms de 3 clientes y la probabilidad de esperar
ms de 30min. En la cola y en el sistema.

=9, =12, P=

Solucin:
Ls =

=3 clientes

W s=

Lq =

1
=0.33 hrs .=20 min .

P0=( 1P ) P0=0.25
( 1 p ) t

P ( W S >30 /60 ) e

9
=0.75
12
2
=2.25 clientes
( )

W q=

=0.25 hrs .=15 min .


( )

P=( L S >3 ) P3+1=0.32


=0.22

P ( W q >30 /60 ) Pe

( 1 p ) t

=0.17

Ejemplo 2. M/M/1

Pgina 11

A un supermercado llegan en promedio 80 clientes por hora que son atendidos


entre sus 5 cajas. Cada caja puede atender en promedio a un cliente cada 3
minutos. Obtenga las medidas de desempeo de acuerdo con el modelo M/M/1.
Adems la probabilidad de tener 2 clientes en el sistema, la probabilidad de tener
una cola de ms de 4 clientes y la probabilidad de esperar ms de 10 min. En la
cola.
80
1
1.33
= =1.33
= =1.66
P=
=0.801
60
3
1.66
1
ws=

ws=

1
1.33=0.72
1.66

1.33
Ls= =
1.66=4.03 clientes

1.33
M/G/1: Un servidor con tiempos entre llegadas exponenciales y una distribucin
general 2de tiempos
de servicio.
(1.33)
2
1.7689
Lq=
=
=
=0.665
( ) 1.66 ( 1.661.33 ) 1.66 (1)

Instituto Tecnolgico
Superior de Lerdo

Frmula M/G/1

2+ P

2 ( 1P )
Lq=
L
W q= q

Ls=Lq + P

W s =W q +

P0=1P

PW =P
P<1

Nomenclatura de las frmulas:


(): El tiempo esperado de servicio depende de la tasa media de servicio.

(): El nmero esperado de llegadas por unidad de tiempo se llama tasa


media de llegadas.

Lq: Nmero esperado de clientes en la cola.

Ls: Nmero esperado de clientes en el sistema.

Wq: Tiempo esperado de espera en la cola.

Ws: Tiempo esperado de espera en el sistema.

(=0): Tiempos de servicio constantes.

1/: El tiempo esperado de servicio.

(P0): Probabilidad de error.

Pgina 12

Probabilidad de tiempo de espera (PW).

Ejemplo1. M/G/1

Instituto Tecnolgico
Superior de Lerdo

Un lavacar puede atender un auto cada 5 min. y la tasa media de llegadas es de 9


autos/hora, = 2 min. Obtenga las medidas de desempeo de acuerdo con el
modelo M/G/1. Adems la probabilidad de tener 0 clientes en el sistema y la
probabilidad de que un cliente tenga que esperar por el servicio.
Solucin:

2+ P

=1.31 clientes
2 ( 1P )
Lq=
2

Ls=Lq + P=1.31+.75=2.06 clientes


1
W s =W q + =0.228 hrs .=13.7 min.

P0=1P=0.25

W q=
PW =P=0.75

Lq
=0.145hrs . 8.7 min .

P<1

Ejemplo1. M/G/1

Pgina 13

A un supermercado llegan en promedio 80 clientes por hora que son atendidos


entre sus 5 cajas. Cada caja puede atender en promedio a un cliente cada 3
minutos. Suponga = 5 min. Obtenga las medidas de desempeo de acuerdo con
el modelo M/G/1. Adems la probabilidad de tener 0 clientes en el sistema y la
probabilidad de que un cliente tenga que esperar por el servicio.
=1.33
Ls=Lq+ p

Ls=9.94+ 4.03=13.97

Lq= 2 2+

P2
2 (1P )

Lq= (1.76 )( 25 )+

16.24
6.06

=.05

P=26.6

=5

Instituto Tecnolgico
Superior de Lerdo

Lq=9.94

ws=wq+

1
=10.50
.33
M/D/1: Un servidor con tiempos entre llegadas exponenciales y una distribucin
degenerada de tiempos de servicio.
ws=7.47+

Frmula M/D/1
2

P
Lq =
2 (1P )

Ls= W s

W s =W q +

W q=

Lq

P<1

Nomenclatura de las frmulas:

(): El tiempo esperado de servicio depende de la tasa media de servicio.


Pgina 14

(): El nmero esperado de llegadas por unidad de tiempo se llama tasa


media de llegadas.
Ls: Nmero esperado de clientes en el sistema.

Lq: Nmero esperado de clientes en la cola.

Ws: Tiempo esperado de espera en el sistema.

Wq: Tiempo esperado de espera en la cola.

Instituto Tecnolgico
Superior de Lerdo

1/: El tiempo esperado de servicio.

(P0): Probabilidad de error.

Ejemplo1. M/D/1
Un lavacar puede atender un auto cada 5 min. La tasa media de llegadas es de 9
autos/hora. Obtenga las medidas de desempeo de acuerdo con el modelo M/D/1.

P2
=1.125 clientes
2 (1P )

Ls= W s=1.875 clientes

Lq =

1
W s =W q + =0.21hrs .=12.5 min .

W q=

Lq
=0.125hrs .=7.5 min .

Ejemplo1. M/D/1

Pgina 15

A un supermercado llegan en promedio 80 clientes por hora que son atendidos


entre sus 5 cajas. Cada caja puede atender en promedio a un cliente cada 3
minutos. Obtenga las medidas de desempeo de acuerdo con el modelo M/D/1.
Ls= W s

(1.33)(5.04)=6.70
Ls=6.70
2

P (k +1)
Lq=
=( 4.03 ) 2=8.06
2(14.03)
)
2 k ( 1P
16.2409

6.06

=1.33

=0.33

P=4.03

Instituto Tecnolgico
Superior de Lerdo

1
W s =W q + =2.01+ 1=.33=5.04

Lq 2.68
W
=
= Un servidor
=2.01 con tiempos entre llegadas exponenciales y una distribucin
q
M/Ek/1:
1.33
Erlang de tiempos de servicio.

Frmula M/Ek/1
k +1

P2
Lq=

Ls= W s

1
W s =W q +

W q=

Lq

P<1

Nomenclatura de las frmulas:

(): El tiempo esperado de servicio depende de la tasa media de servicio.


Pgina 16

(): El nmero esperado de llegadas por unidad de tiempo se llama tasa


media de llegadas.
Ls: Nmero esperado de clientes en el sistema.

Lq: Nmero esperado de clientes en la cola.

Ws: Tiempo esperado de espera en el sistema.

Wq: Tiempo esperado de espera en la cola.

Instituto Tecnolgico
Superior de Lerdo

1/: El tiempo esperado de servicio.

(P0): Probabilidad de error.

Ejemplo1. M/Ek/1
Un lavacar puede atender un auto cada 5 min. La tasa media de llegadas es de 9
autos/hora. Suponga = 3.5 min (aprox.) Obtenga las medidas de desempeo de
acuerdo con el modelo M/Ek/1

Ls= W s=2.437 clientes

1
W s =W q + =0.2708 hrs .=16.25min .

k +1

2
P
Lq=

W q=

Lq
=0.1875hrs .=11.25 min

Ejemplo1. M/Ek/1

Pgina 17

A un supermercado llegan en promedio 80 clientes por hora que son atendidos


entre sus 5 cajas. Cada caja puede atender en promedio a un cliente cada 3
minutos. Suponga que k= 4. Obtenga las medidas de desempeo de acuerdo con
el modelo M/Ek/1
=0.33
=1.33
Ls= W s

LS=1.33(5.54)
LS=7.36
1
W s =W q + = 2.51 + 1 / 0.33 = 2.51 + 3.03 = 5.54

Instituto Tecnolgico
Superior de Lerdo

k +1

P2
Lq=

Lq=

4.032

(4+1) = 16.24 (5) = 81.2 = -3.34 (-1) = 3.34

2(4) (1-4.03)

W q=

8(-3.03) -24.24

Lq 3.34
=
=2.51
1.33

3. SIMULACIN
La simulacin es indispensable para la descripcin y anlisis de una amplia
variedad de problemas reales. Proporciona considerables beneficios segn el
contexto en los que se use:
Ahorro de tiempo.

Ahorro de recursos econmicos.

Permite analizar la ocurrencia de ciertos fenmenos a travs de la


reconstruccin de escenas y un minsculo anlisis, que no podra llevarse a
cabo en una situacin real.

Pgina 18

Instituto Tecnolgico
Superior de Lerdo

4. TEORA DE JUEGOS
4.1.

Qu es un juego?

Un juego es una situacin competitiva entre N personas o grupos, denominados


jugadores, que se realiza bajo un conjunto de reglas previamente establecidas,
con consecuencias conocidas. Las reglas definen las actividades elementales, o
movimientos del juego. Pueden permitirse diferentes movimientos para los
distintos jugadores, pero, cada jugador conoce los movimientos de que dispone
los otros jugadores.
Si un jugador gana lo que otro jugador pierde , el juego se le denomina juego de
suma 0. Un juego de dos personas es un juego que tiene solo dos jugadores.

4.1.1.

Estrategias

Pgina 19

Una estrategia pura es un plan previamente determinado que establece la


secuencia de movimientos y contramovimientos que un jugador realizar durante
un juego completo.

4.1.2. Juegos de suma cero para dos


personas: estrategias aleatorias,
dominacin y solucin grfica.

En este tipo de juegos, lo que uno gana es igual a lo que otro pierde, entonces al
sumar la ganancia y la prdida de uno y otro, el resultado obtenido es
exactamente cero.

Instituto Tecnolgico
Superior de Lerdo

Se analiza cmo determinar el valor y la estrategia ptima para un juego de suma


cero para dos personas que no tiene un punto silla. Se inicia con el juego sencillo
de pares y nones.

Ejercicio 1
Dos jugadores (que se llaman Non y Par) escogen de manera simultnea el
nmero de dedos

(1 o 2) que deben mostrar. Si la suma de los dedos que

muestran los jugadores en non, entonces, Non gana 1 dlar a Par. Si la suma de
los dedos es par, entonces Par gana 1 dlar a Non. Consideramos que el jugador
de los renglones es Non y que el jugador de las columnas es Par. Determine si
este juego tiene un punto silla.
Solucin:
Este juego de suma cero cuya matriz de recompensas es la que se muestra en la
siguiente tabla. Puesto que Max (mnimo del rengln= =-1 y min (mximo de las
columnas)= +1, no se cumple la ecuacin (1), y este juego no tiene punto silla.
Pgina 20

Bueno todo lo que sabemos es que Non puede estar seguro de una recompensa
de por lo menos -1, y Par puede mantener a Non es una recompensa de cuando
mucho +1. Por lo tanto no es evidente como determinar el valor del juego y las
estrategias ptimas

Jugador de
Los renglones

Jugador de las columnas (Par)

Instituto Tecnolgico
Superior de Lerdo

(Non)

1 dedo

2 dedos

mnimo de los renglones

1 dedo

-1

+2

-1

2 dedos

+1

-1

-1

Mximo de columnas

+1

+1

4.1.3.

Estrategias aleatorias o combinados

Debemos ampliar el conjunto de estrategias admisibles para cada jugador con el


fin de incluir las estrategias aleatorias. Hemos supuesto que hasta ahora que cada
vez que un jugador juega, aplica la misma estrategia. Por qu no dejar que cada
jugador escoja una probabilidad de aplicar cada estrategia? Por ejemplo:
X1= probabilidad de que Non levante un dedo.
X2= probabilidad de que Non levante dos dedos.
y1= probabilidad de que Par levante un dedo.
y2= probabilidad de que Par levante dos dedos.
Por lo que se entendi si x10, x20 y x1+x2 = 1, entonces (x1, x2) es una
estrategia combinada

o aleatoria a Non. Por ejemplo, Non puede seguir la

Pgina 21

estrategia (1/2,1/2) si lanza una moneda antes de cada jugada del juego y levanta
un dedo si sale cara o dos dedos si sale cruz; de igual manera para Par.

4.1.4.

Solucin grafica de pares y nones

Con este es posible determinar la estrategia ptima de Non.


Como x1 + x2 = 1, sabemos que x2 = 1 x1. Por lo tanto, cualquier
estrategia combinada puede ser (x1, 1 - x1) y solo basta determinar el valor
de x. Supngase que Non selecciona una estrategia combinada [x1, (1

Instituto Tecnolgico
Superior de Lerdo

x1)]. Cul es la recompensa esperada de Non comparada con cada una


de las estrategias de Par? Si Par levanta un dedo, entonces Non recibir
una recompensa de -1 con probabilidad x1 y una recompensa de +1 con
probabilidad de x2 = 1 x1. Por lo tanto, si Par levanta un dedo y Non elige
la estrategia combinada (x1, 1 x1), entonces la recompensa esperada de
Non es:
(-1) x1 + (+1) (1 - x1) = 1 2x1
Como funcin de x1 esta recompensa esperada se traza como un
segmento de recta AC en que de igual manera, si Par muestra dos dedos y
Non elige la estrategia combinada (x1, 1 x1), la recompensa esperada de
Non es:
(+1) x1 + (-1) (1 - x1) = 2x1 1
Qu es el segmento de la recta DE?

E (1,1)
A

X1

Pgina 22

C (1,-1)

AC= recompensa de Non x1 si par escoge 1.


DE= recompensa de Non x1 si par escoge.
Cmo hacer que una estrategia no ptima recompense?
Estrategia de Non
X1<

Par puede escoger


2 dedos

Recompensa esperada
<0 (sobre BD)

Instituto Tecnolgico
Superior de Lerdo

X1 >
Y1<

1 dedo
1 dedo

Y2>

2 dedos

<0 (sobre BC)


>0 (sobre AB)
> 0 (sobre BE)

5. CADENA DE MARKOV
Es una serie de eventos, en la cual la probabilidad de que ocurra un evento
depende del evento inmediato anterior. En efecto, las cadenas de este tipo tienen
memoria. Recuerdan el ltimo evento y esto condiciona las posibilidades de los
eventos futuros. Esta dependencia del evento anterior distingue a las cadenas de
Markov de las series de eventos independientes, como tirar una moneda al aire o
un dado.
Una cadena de Markov es una secuencia X1, X2, X3, de variables aleatorias. El
rango de estas variables, es llamado espacio estado, el valor de Xn es el estado
del proceso en el tiempo n. Si la distribucin de probabilidad condicional de Xn+1
en estados pasados es una funcin de Xn por s sola, entonces:
Donde xi es el estado del proceso en el instante i. La identidad mostrada es la
Propiedad de Markov.

5.1.1.

Problema de la cadena de Markov:

Si hoy est nublado, para que pasado maana est nublado, podramos tener un
da de maana soleado o nublado. As tenemos las siguientes secuencias en
orden de (hoy, maana y pasado maana):
Pgina 23

(Nublado, soleado, nublado) o (nublado, nublado, nublado) donde pasado maana


es nublado.
Estas secuencias son mutuamente excluyentes, corresponden a caminos distintos
en el rbol, as tenemos que:
= P (pasado maana nublado | hoy nublado)
= P ((nublado, soleado, nublado) o (nublado, nublado, nublado))
=P (nublado,soleado,nublado)+P(nublado, nublado, nublado)=(.6 .3)+(.4.4) =.34

Nublado

Nublado

Instituto Tecnolgico
Superior de Lerdo

Nublado

Este resultado se obtuvo multiplicando las probabilidades condicionales a lo largo


Soleado
de los caminos
desde hoy nublado hasta pasado maana nublado.
No es necesario que seamos tan especficos en trminos de hoy, maana o
pasado maana, podemos darnos cuenta que lo realmente importante es el
nmero de das que pasa entre una prediccin y otra.
Pasado maana

Maana

Tiempo de hoy
Nublado

EJERCICIO #1

Pgina 24

El ascensor de un edificio con bajo y 2 pisos ms realiza viajes de uno a otro piso.
El piso en el que finaliza el viaje ensimo del ascensor, sigue una cadena de
markov.

Se sabe que la mitad de los viajes que parten del bajo se dirigen a los otros 2
pisos, mientras que si un viaje comienza en el primer piso, slo el 25% de las
veces finaliza en el segundo.

Por ltimo, si un trayecto comienza en el segundo piso, siempre finaliza en el bajo


calcula la raz de probabilidades de transicin segn la cadena de markov.
***
0
1
2

0
0
75
100

1
50
0
0

2
50
25
0

Instituto Tecnolgico
Superior de Lerdo

Pb

1
0

50

50

1
0
2

B
75
50%

Pm

1
0

Pa

Pgina 25

Pa

2
1

25

0
2

100

75
%
25%

Pb
50%

0
Pb

2
100%

Pm
1

1
0%

0
Pa

Instituto Tecnolgico
Superior de Lerdo

6. PROGRAMACIN DINMICA
Es un enfoque general para la solucin de problemas en los que es necesario
tomar decisiones en etapas sucesivas. Las decisiones tomadas en una etapa
condicionan la evolucin futura del sistema, afectando a las situaciones en las que
el sistema se encontrar en el futuro (denominadas estados), y a las decisiones
que se plantearn en el futuro.
La programacin dinmica no tiene formulacin matemtica estndar. Se trata de
un enfoque de tipo general para la solucin de problemas, y las ecuaciones se
derivan de las condiciones individuales de los mismos.

El procedimiento general de resolucin de estas situaciones se divide en el


anlisis recursivo de cada una de las etapas del problema, en orden
inverso, es decir comenzando por la ltima y pasando en cada iteracin a la
etapa antecesora. El anlisis de la primera etapa finaliza con la obtencin
del ptimo del problema.

6.1.

Problema de la diligencia:

Es una manera de reconocer una situacin que se puede formular como un


problema de programacin dinmica. Es encontrar la ruta que minimiza el costo
total de un nodo especfico.

6.1.1.

Terminologa y notacin bsica

Perodos o etapas: Sea N= {1, 2,....., n} un conjunto finito de elementos.


Mediante el ndice, representamos cada uno de ellos. N es el conjunto de perodos
o etapas del proceso.
Pgina 26

Espacio de estados: { } es una familia de conjuntos, uno para cada perodo n. S se


denomina espacio de estados en el perodo n. Cada uno de sus elementos, que se
representa mediante Sn, es un estado, que describe una posible situacin del
proceso en ese perodo.

Sea s: El estado de inicio; j: estado destino.

n: La fase, normalmente representa el nmero de arcos hasta el destino.

C(s, j): Costo o distancia de ir desde s hasta j.

Instituto Tecnolgico
Superior de Lerdo

f(n, s): La poltica de costo mnimo cuando se encuentra en el estado s de


la etapa n.

Ejemplo1. Programacin dinmica


Un cazafortunas desea ir de Missouri a California en una diligencia, y quiere viajar
de la forma ms segura posible. Tiene los puntos de salida y destino conocidos,
pero tiene mltiples opciones para viajar a travs del territorio.
Se entera de la posibilidad de adquirir un seguro de vida como pasajero de la
diligencia.
El costo de la pliza estndar (cij) se muestra en la tabla siguiente:

El objetivo es hallar
y su ruta correspondiente. Cuando el cazafortunas
f 1( A)
tiene slo una etapa por recorrer (n=4) su ruta de ah en adelante, estar
determinada por el estado actual (H o I) y su destino final X4 = J.

Pgina 27

Luego f 4( S )=C sj + f 5( J )=c sj


f 4( H ) =c sj =3
f 4( H ) =c sj =4

Etapa n=3
El cazafortunas tiene 2 etapas por recorrer (n=3). Suponga que sale de E.
C E, H =1

E
C E, I =4

+f 4( H )=f 3 ( E ) =C E , H +f 4( H ) =4

+f 4( I )=f 3 ( E )=C E ,I + f 4( I )=8

Pgina 28

Instituto Tecnolgico
Superior de Lerdo

Instituto Tecnolgico
Superior de Lerdo

Etapa n=2
En la segunda etapa, el cazafortunas tiene 3 jornadas por recorrer (n=2). Suponga
que sale de C.
C, C E =3
C

C, C F =2
C, C G =4

+f 3( E ) =f 2 ( C ) =CC , E + f 3( E )=7

+f 3( F )=f 2 ( C )=CC ,F +f 3( F ) =9

+f 3( G )=f 2 (C )=C C ,G + f 3( G )=10

Etapa n=1
En la primera etapa, el cazafortunas tiene todas las jornadas por recorrer (n=1).
Necesariamente debe salir de A.
C A, B =2
C A, C =4
C A, D =3

+f 2( B )=f 1 ( A ) =C A , B+ f 2( B )=13

+f 2( C )=f 1 ( A )=C A ,C +f 2( C ) =11

+f 2( D )=f 1 ( A )=C A , D + f 2( D )=11

Caractersticas de la P.D

Pgina 29

1. El problema se puede
dividir
por
etapas,
que
requieren una poltica de
decisin en cada una de ellas.
2. Cada etapa tiene un cierto
nmero de estados asociados
a su inicio. (Estados son las
diferentes
condiciones
posibles en las que se puede
encontrar el sistema en cada
etapa del problema).

Instituto Tecnolgico
Superior de Lerdo

7. PROGRAMACIN DINMICA DETERMINSTICA


Una ruta crtica es la secuencia de los elementos terminales de la red de
proyectos con la mayor duracin entre ellos, determinando el tiempo ms corto en
el que es posible completar el proyecto.
La duracin de la ruta crtica determina la duracin del proyecto entero. Cualquier
retraso en un elemento de la ruta crtica afecta a la fecha de trmino planeada del
proyecto, y se dice que no hay holgura en la ruta crtica.
Un proyecto puede tener varias rutas crticas paralelas. El mtodo de la ruta crtica
usa ciertos tiempos (reales o determinsticos).
El mtodo de la ruta crtica se basa en 2 procedimientos que recorren la red de las
actividades de un proyecto: La pasada hacia atrs y la pasada hacia adelante,
cada actividad de la red se representa con el diagrama siguiente:

Inicio ms cercano IC: Es el tiempo ms cercano en el que puede empezar


una actividad, suponiendo que todas las actividades precedentes han
concluido.
Tiempo ms cercano TC: El tiempo ms cercano en que una actividad
puede terminar.
Inicio ms lejano IL: Tiempo ms lejano en que una actividad puede
comenzar sin retrasar el tiempo de terminacin del todo el proyecto.
Tiempo ms lejano TL: El tiempo ms lejano en que una actividad puede
terminar sin retrasar el tiempo de terminacin de todo el proyecto.

Pgina 30

Instituto Tecnolgico
Superior de Lerdo

Pgina 31

Ejemplo1. Programacin dinmica determinstica.

Instituto Tecnolgico
Superior de Lerdo

Personas que no trabajaron:

Pgina 32

Jos de Jess Castillo Molina

You might also like