Professional Documents
Culture Documents
UNIDAD 3
SERIES DE TIEMPO
3.6 Tendencias irregular. ……………………………………………………………
3.7 Pronostico basado en factores de tendencia y estacionales. ……………..
3.8 Pronósticos, ciclos e indicadores económicos. ……………………………..
3.9 Técnica y uso de promedios móviles y suavización exponencial en las
organizaciones. ……………………………………………………………………..
3.10 Ventajas y desventajas del análisis de las series de tiempo. …………….
UNIDAD 4
ESTADÍSTICA NO PARAMETRICA
4.1 Escalas de medición. …………………………………………………………….
4.2 Métodos estadísticos paramétricos contra no paramétricos. ……………….
4.3 Pruebas de rachas para aleatoriedad. …………………………………………
4.4 Una muestra: prueba de signos. ………………………………………………..
4.5 Una muestra: prueba de Wilcoxon. …………………………………………….
UNIDAD 2
ANALISIS DE REGRESION LINEAL Y MULTIPLE.
Al trabajar con dos variables cuantitativas podemos estudiar la relación que existe
entre ellas mediante la correlación y la regresión. Aunque los cálculos de
ambas técnicas pueden ser similares en algunos aspectos e incluso dar resultados
parecidos, no deben confundirse. En la correlación tan solo medimos la dirección y
la fuerza de la asociación de una variable frente a la otra, pero nunca una relación
de causalidad. Solo cuando tenemos una variable que es causa o depende de otra,
podremos realizar entonces una regresión. En este capítulo estudiaremos dos de
los coeficientes de correlación más utilizados, como el coeficiente de Pearson y el
coeficiente no paramétrico de Spearman. También veremos un ejemplo
de regresión lineal simple y cómo se deben interpretar sus resultados.
Ejemplo:
10 agentes de computadoras 60 Usuarios Llamadas Ventas 50 Usuario1 20 30
Usuario2 40 60 40 Ventas Usuario3 20 40 Usuario4 30 60 30 Usuario5 10 30
Diagrama de dispersión Usuario6 10 40 20 Usuario7 20 40 Usuario8 20 50 10
Usuario9 20 30 Usuario10 30 70 10 20 30 40 50 60 70Hipótesis: A mayor llamadas
mayores ventas tendrá en el mes llamadas
Retroalimentación
• Variable dependiente:: Es la que se predice o calcula.• Variable independiente: La
variable que proporciona las bases para el cálculo. Es el valor de predicción.• Las
llamadas será la variable independiente
• Las ventas será la variable dependiente• A mayor número de llamadas
mayores ventas.
Correlación
• Describe la intensidad de la relación entre dos conjuntos de variables de nivel de
intervalo. r = -1 r = +1
Regresión invariada• Y´ = a + bx - regresión lineal.
o en forma matricial
= - = -H = =
= X + -HX -H = ,
Donde se utilizó que HX = X. Se calcula la matriz de varianzas de los residuos,
(9.9)
Como los residuos tienen varianza variable y son dimensionados (tienen las
unidades de la variable Y ), normalmente se tipifican
(9.10)
Los residuos tipificados siguen una distribución normal estándar, pero como 2 es
desconocido, se sustituye por su estimador, la varianza residual R2 y se obtienen
los residuos estandarizados, definidos como
(9.11)
(9.12)
Figura 9.2. Gráfico matricial con los datos del Ejemplo 7.1.
Gráficos de este tipo son los representados en las Figuras 9.3 y 9.4. En la primera
de ellas se observa que la relación con la variable xj no es lineal y, probablemente,
un ajuste cuadrático sea adecuado, también se tendrían dudas acerca de la
homocedasticidad del modelo.
Tipo 1.
Tipo 2.
*
k = + k k = + k k
= -
Se obtiene un nuevo gráfico parcial representando los residuos
“parciales” k* frente a la variable xk.
Gráficos parciales son representados en las Figuras 9.8 y 9.9. En ambos casos se
observa que existe una relación lineal entre las variables regresoras y la variable de
interés.
Figura 9.8. Gráfico parcial con los datos del Ejemplo 7.1. (altura)
Figura 9.9. Gráfico parcial con los datos del Ejemplo 7.1. (diámetro)
Ahora se representa el gráfico de residuos de ek* frente a los residuos e ,k. Esto es,
el gráfico de los pares . Este gráfico da una idea de la relación entre la
variable Y y la variable xk una vez que se ha eliminado la influencia de las otras
variables regresoras.
Utilizando los datos del ejemplo 7.1. se obtienen los siguientes gráficos parciales:
En este gráfico también se puede observar si existe una relación lineal con el índice
y éste debe de incluirse en el modelo de regresión como variable explicativa.
Intervalos de confianza Sin importar que tan bien diseñado esté un estudio, el hecho
de realizar un muestreo hace susceptible al ensayo a ciertos grados de imprecisión
y azar. Lo que somos capaces de apreciar en una muestra o al comparar dos grupos
puede no necesariamente representar al universo o población de donde la muestra
proviene.
Los intervalos de confianza ofrecen una manera de estimar, con alta probabilidad,
un rango de valores en el que se encuentra el valor poblacional (o parámetro) de
una determinada variable. Esta probabilidad ha sido fijada por consenso en un 95%
en base a supuestos de normalidad, pero rangos entre el 90% y 99% son
comúnmente utilizados en la literatura científica. En términos simples, un intervalo
de confianza del 95% indica que el valor poblacional se encuentra en un
determinado rango de valores con un 95% de certeza. Como regla general, mientras
mayor es el tamaño de la muestra, menor es la variabilidad para hacer la estimación
del intervalo, lo que lleva a estimadores más precisos . Por el contrario, mientras
más certeza se desee respecto a la extrapolación poblacional (por ejemplo, 99%),
más amplio será el intervalo.
Estas herramientas también permiten hacer inferencia estadística al excluir un valor
crítico que indique la falta de asociación del intervalo. Una interpretación coloquial
de esto último es decir que los hallazgos son estadísticamente significativos porque
el intervalo “no pasa por el 1”. Efectivamente, de tratarse de un indicador cuya
fórmula es un cuociente, como el riesgo relativo (RR) o el Odds Ratio (OR), un valor
1 indica que la frecuencia de un determinado evento fue igualmente presentado
tanto en el grupo expuesto como en el que no, por lo que sería el “valor crítico” que
debe excluirse para denotar significancia estadística9-11. Cuando lo expresado es
una resta en el riesgo entre dos grupos (como con la reducción del riesgo absoluto),
un valor de 0 pasa a ser el límite para denotar hallazgos significativos, puesto que
representaría el punto en que el evento es igualmente probable en ambos grupos.
Supongamos que existe un estudio que detectó que la fibrilación auricular en el
postoperatorio se asociaba a mayor mortalidad entre pacientes operados con un RR
de 3 (IC 95%: 2-4). Esto significa que en la muestra, la presencia de la arritmia
triplicó la probabilidad de morir en relación a quienes no la tuvieron. Si bien no
podemos trabajar con la población, la estimación del intervalo indica que podemos
estar 95% seguros que el valor poblacional del riesgo relativo estará entre 2 y 4.
Como el valor 1 está excluido del rango del intervalo, podemos decir que los
hallazgos son estadísticamente significativos.
Intervalo de confianza
Supongamos que tenemos una moneda, la cual puede o no estar balanceada. Así,
después de varios lanzamientos, la probabilidad que el resultado sea sello variará
desde 0 (todas las veces cara, es decir, una moneda balanceada) hasta 1 (todas
las veces sello, nuevamente balanceada), pasando por 0,5 (la mitad de las veces
sello y las otras cara, lo que equivale a una moneda no balanceada). Como no
conocemos la verdadera naturaleza de la moneda, vamos a experimentar con ella.
Realizamos 1.000 lanzamientos, resultando 500 sellos y 500 caras, con lo que
estamos aún más seguros que nuestra moneda no está balanceada (nuestro rango
puede ser 0,45 a 0,55 o menor).
El ejemplo anterior nos permite aclarar varios conceptos:
• El valor real más probable corresponde al estimador puntual del estudio, en este
caso 0,5.
Donde:
Interpretación de un IC
Figura 1. Estudio hipotético cuyo estimador puntual informa un RRA 2,8%, pero cuyo
IC sobrepasa la línea del no efecto, por lo tanto es posible que el valor real sea
daño. No existe diferencia estadística significativa en este estudio.
Así, para evaluar beneficio clínico, primero debemos establecer un umbral mínimo
de beneficio, el que depende del tipo de evento a prevenir o favorecer los efectos
adversos, costos, etc. de la nueva droga, y luego observar el beneficio mínimo
probable que muestra el estudio, que corresponde al extremo del IC más cercano a
la línea del no efecto. Si el extremo del IC no sobrepasa el umbral se asume que el
beneficio mínimo probable es suficiente para recomendar la nueva terapia.
Existe la posibilidad que la nueva droga hiciese daño (RRA negativo). El proceso es
similar al anterior, estableciendo un umbral máximo de daño tolerable, y observando
el extremo del IC que más se acerca a la línea del no efecto. Si la nueva droga
genera más daño con una diferencia estadísticamente significativa, debemos
observar si el extremo del IC sobrepasa ese umbral. Si no lo hace se asume que el
daño mínimo probable es más alto que lo tolerable, por lo tanto se está en
condiciones de rechazar la nueva terapia (Figura 4).
De esta forma, aunque el valor P mide la fuerza de una asociación, siempre es útil
el intervalo de confianza para complementar la evaluación de la magnitud del efecto
de una intervención y poder realizar una interpretación adecuada de los resultados
de un estudio.
CONCLUSIONES
Ejemplo
Uno de los usos más habituales de las series de datos temporales es su análisis
para predicción y pronóstico (así se hace por ejemplo con los datos climáticos, las
acciones de bolsa, o las series de datos demográficos). Resulta difícil imaginar una
rama de las ciencias en la que no aparezcan datos que puedan ser considerados
como series temporales.
Las series temporales se estudian en estadística, procesamiento de
señales, econometría y muchas otras áreas.
COMPONENTE TENDENCIA
La determinación de la tendencia secular solamente se debe realizar cuando se
disponga de una larga serie de observaciones, en otro caso podrían obtenerse
conclusiones erróneas. Los métodos más utilizados para aislar la tendencia secular
son:
Método gráfico.
Método de las medias móviles.
Método de los mínimos cuadrados.
Para hacer predicciones se debe estimar la tendencia por el método de los mínimos
cuadrados.
a) MÉTODO GRÁFICO
Se trata de un método muy sencillo, ya que permite obtener una línea de tendencia
sin necesidad de realizar ningún cálculo.
Los dos años siguientes son 2008 y 2009, que en términos de los cálculos que
estamos haciendo son 6 y 7, respectivamente. Pues bien,
Los valores de tendencia se asocian con periodos y no con puntos temporales, por
lo que deben reducirse los tres elementos de la ecuación de tendencia anual. (b0,
b1 y X) Para efecto de la transformación a datos mensuales, el punto base del año
anteriormente codificado como X = O, se ubicaría en el punto medio del año (01/07)
PRONOSTICOS CICLICOS E INDICADORES ECONOMICOS • Los pronósticos
basados en los componentes de tendencia y estacional de una serie de tiempo son
apenas el punto de partida de los pronósticos económicos. • La primera razón es la
necesidad de considerar el probable efecto del componente cíclico durante el
periodo de pronóstico. • La segunda es la importancia de identificar los factores
causales específicos que han influido en las variables de series de tiempo.
Pronósticos a corto plazo. • Suele suponerse que el efecto del componente cíclico
es el mismo que se ha incluido en los valores recientes de la serie de tiempo. •
cuando se trata de periodo más prolongados, o incluso de periodos cortos en
épocas de inestabilidad económica, es importante identificar los puntos de cambio
de ciclo de la economía nacional. • Las variaciones cíclicas asociadas con un
producto en particular pueden coincidir o no con el ciclo económico general.
• EJEMPLO . Históricamente, las ventas industriales de automóviles han coincidido
estrechamente con el ciclo económico general de las economías nacionales. Por el
contrario, las ventas de autopartes han sido comúnmente opuestas, en cuanto al
factor cíclico, respecto del ciclo económico general. • El Instituto Nacional de
Investigación Económica (NBER) de Estados Unidos ha identificado y dado a
conocer series de tiempo históricamente indicadoras de expansiones y recesiones
Bibliografía
http://www.monografias.com/trabajos96/analisis-regresion-y-correlacion/analisis-
regresion-y-correlacion.shtml#ixzz4s0nkKanl
http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0034-98872005000900017