You are on page 1of 15

Probabilidad y Estadstica

Probabilidad y Estadstica
Electrnica 2do Semestre

Karina Nathaly Nava Gutirrez Vctor Arturo Guzmn Gutirrez Vicente Guillermo Prez Al atrache Roberto Alonso Tabares Luis Arturo Morales Win7 [Seleccionar fecha]

ndice 0. Introduccin 1. Estadstica Descriptiva 1.1. Poblacin y muestra aleatoria 1.2. Obtencin de datos estadsticos 1.3. Medidas de tendencia central 1.4. Medidas de dispersin 1.5. Tabla de distribucin de datos

0.

Introduccin

La Estadstica es una ciencia formal que estudia la recoleccin, anlisis e interpretacin de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algn fenmeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadstica es ms que eso, es decir, es el vehculo que permite llevar a cabo el proceso relacionado con la investigacin cientfica. Es transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en reas de negocios o instituciones gubernamentales. El estudio de la estadstica se divide en dos tipos: Estadstica descriptiva y estadstica inferencial En esta unidad estudiaremos la estadstica descriptiva y para analizarla mejor es necesario establecer los conceptos bsicos que estn relacionados con el tema

1. Estadstica Descriptiva
La estadstica descriptiva es una gran parte de la estadstica que se dedica a recolectar, ordenar, analizar y representar un conjunto de datos, con el fin de describir apropiadamente las caractersticas de ese conjunto. Este anlisis es muy bsico. Aunque hay tendencia a generalizar a toda la poblacin, las primeras conclusiones obtenidas tras un anlisis descriptivo, es un estudio calculando una serie de medidas de tendencia central, para ver en qu medida los datos se agrupan o dispersan en torno a un valor central. Esto es lo que podra ser un concepto aproximado.

1.1. Poblacin Y Muestra Aleatoria


En la estadstica existen 2 conceptos de gran importancia que son la Poblacin y la Muestra. A partir de estos dos elementos se establecern los datos necesarios para un anlisis probabilstico.

Poblacin
La poblacin, en estadstica, se define como un conjunto de personas u objetos que poseen caractersticas comunes. Este conjunto es sobre el que se est interesado en obtener conclusiones y normalmente es demasiado grande como para poder abarcarlo. El tamao que tiene una poblacin es muy importante cuando se va a llevar a cabo una investigacin, cuando una poblacin es muy grande aumenta mucho el trabajo, tiempo y costos necesarios para llevar a cabo una investigacin. Para dar una solucin a este inconveniente se utiliza una muestra estadstica.

Muestra Aleatoria
Una muestra estadstica es utilizada cuando es imposible o poco prctico examinar a todos los individuos y en cambio se examina una pequea parte del grupo. La muestra debe ser una representacin de las caractersticas de una poblacin con la que se estudian las caractersticas de un conjunto menor al de la poblacin total. Por ejemplo, si se estudia la opinin de una poblacin de 5000 habitantes se sabe que se tiene una gran dificultad poder analizar las opiniones de todos ellos, para eso se utiliza la muestra representativa que contiene las caractersticas relevantes de la poblacin en una cantidad proporcional.

1.2. Obtencin De Datos Estadsticos


La forma de obtener la informacin original de las unidades de anlisis que componen el universo por investigar puede ser efectuada a travs de un censo, una encuesta, un registro administrativo y de otras medios que se ofrece como libros, revistas, internet etc.,. Pero en la mayora de los casos se obtienen de encuestas y registros como por ejemplo en u censo en donde se obtienen datos de la poblacin para conocer cmo vive la poblacin y en que porcentajes se dividen segn la condicin. Hay otros casos en donde la informacin se consigue atreves de estudios y anlisis dados por personas doctoradas en los temas que dan a conocer varias aproximaciones acerca de los datos y las estadsticas. Y como tal el objetivo primordial es obtener una informacin clara y precisa que permita que permita obtener los siguientes datos:

TASAS Las tasas se refieren a la frecuencia relativa con que se producen ciertos acontecimientos en relacin a la poblacin media existente durante el tiempo en que se han registrado tales acontecimientos. RAZN Es aquel valor que indica la relacin cuantitativa existente entre dos cantidades. R= Nmero de individuos que no poseen dicha caracterstica Nmero de individuos que poseen cierta caracterstica PROPORCIN Es una razn, en la cual el denominador es el nmero total de unidades enunciadas. PORCENTAJE Se llama tanto por ciento de un nmero a una o varias de las 100 partes iguales en que se puede dividir dicho nmero. Por ejemplo, el 4% de 80, significa que el 80 se divide en 100 partes iguales y de ellas se toman 4. Tambin es una medida que se obtiene al multiplicar por 100 a las proporciones LA SUMATORIA Se emplea para representar la suma de muchos o infinitos sumandos.

1.3. Medidas de tendencia central ( Media, Mediana, Moda)


Las medidas de tendencia central (media, mediana y moda) sirven como puntos de referencia para interpretar las calificaciones que se obtienen en una prueba Las medidas de tendencia central ms comunes son: La media aritmtica: comnmente conocida como media o promedio. Se representa por medio de una letra M o por una X con una lnea en la parte superior. La mediana: la cual es el puntaje que se ubica en el centro de una distribucin. Se representa como Md. La moda: que es el puntaje que se presenta con mayor frecuencia en una distribucin. Se representa Mo.

De estas tres medidas de tendencia central, la media es reconocida como la mejor y ms til. Sin embargo, cuando en una distribucin se presentan casos cuyos puntajes son muy bajos o muy altos respecto al resto del grupo, es recomendable utilizar la mediana o la moda. (Porque dadas las caractersticas de la media, esta es afectada por los valores extremos). La media es considerada como la mejor medida de tendencia central, por las siguientes razones: Los puntajes contribuyen de manera proporcional al hacer el cmputo de la media. Es la medida de tendencia central ms conocida y utilizada. Las medias de dos o ms distribuciones pueden ser fcilmente promediadas mientras que las medianas y las modas de las distribuciones no se promedian. La media se utiliza en procesos y tcnicas estadsticas ms complejas mientras que la mediana y la moda en muy pocos casos. En estadstica, la media aritmtica (tambin llamada promedio o simplemente media) de un conjunto finito de nmeros es el valor caracterstico de una serie de datos cuantitativos objeto de estudio que parte del principio de la esperanza matemtica o valor esperado, se obtiene a partir de la suma de todos sus valores dividida entre el nmero de sumandos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media maestral siendo uno de los principales estadsticos muestrales. En el mbito de la estadstica, la mediana, representa el valor de la variable de posicin central en un conjunto de datos ordenados. De acuerdo con esta definicin el conjunto de datos menores o iguales que la mediana representarn el 50% de los datos, y los que sean mayores que la mediana representarn el otro 50% del total de datos de la muestra En estadstica, la moda es el valor con una mayor frecuencia en una distribucin de datos.

1.4. Medidas De Dispersin


Las Medidas de Dispersin nos resumen la informacin de la muestra o serie de datos, dndonos as informacin acerca de la magnitud del alejamiento de la distribucin de datos en relacin a un valor central o de concentracin de los datos.

Utilidad de las medidas de dispersin Las estadsticas bsicas nos permiten tener una visin del comportamiento de una serie de sucesos o eventos a los que denominamos "variables", as tenemos varias herramientas estadsticas como lo son la Media, la Mediana y la Moda. Pero estas Medidas no son suficientes, necesitamos conocer la variabilidad de los datos, es decir, cun parecidos son los datos reales en comparacin a las Medidas de Tendencia Central, para esto contamos con esta nueva herramienta: las Medidas de Dispersin, que no son otra cosa que indicadores de variabilidad y cuya importancia reside en la necesidad de tomar decisiones, basadas en estadsticas bsicas

Cules son las medidas de dispersin 1.- Medidas de dispersin absoluta Medidas de dispersin absolutas Se tomar como punto central de referencia la media aritmtica, aunque de forma anloga podra utilizarse la mediana Rango Rango no es ms que la diferencia entre el mximo y mnimo valor de una serie de datos y nos da una vaga referencia a la posible dispersin que se puede tener de los datos. Frmula de Rango: Dato ms alto - Dato ms pequeo. (X2 X1 ) Interpretacin de Rango: El Rango lo podremos interpretar como la amplitud existente entre una serie de datos, es decir, mide cun lejos est el valor ms pequeo y el valor ms grande de la muestra o poblacin. Ejemplo de Rango: Si tenemos una produccin de franelas y sabemos que diariamente se producen un promedio de 500 franelas, y si un da se produce un mnimo de 415 franelas y otro da se produce un mximo de 573 franelas entonces si vemos el RANGO de produccin estar entre 158 franelas, es decir, podemos tener una produccin de 158 franelas a partir del valor mnimo.

Medio rango o Rango medio


El medio rango o rango medio de un conjunto de valores numricos es la media del menor y mayor valor, o la mitad del camino entre el dato de menor valor y el dato de mayor valor. En consecuencia, el medio rango es:

Ejemplo Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de mayor valor Max= 8. El medio rango resolvindolo mediante la correspondiente frmula sera:

Representacin del medio rango: Varianza Varianza es la Medida de Dispersin de los valores alrededor de la Media. Caracterstica de una muestra o poblacin que cuantifica su dispersin o variabilidad. La Varianza tiene unidades al cuadrado de la variable. Su raz cuadrada positiva es la Desviacin Tpica. Equivale a la dispersin respecto de la Media en una serie de datos continuos. Interpretacin de la Varianza: Esta medida carece de interpretacin.

La varianza es una medida estadstica que mide la dispersin de los valores respecto a un valor central (media), es decir, es el cuadrado de las desviaciones:

Propiedades

La varianza es siempre positiva o 0: Si a los datos de la distribucin les sumamos una cantidad constante la varianza no se modifica.
2

Si a los dato de la distribucin los multiplicamos una constante, la varianza queda multiplicada por el cuadrado de esa constante.

Propiedad distributiva:

cov

FORBES Varianza
Es la media de las puntaciones de desviacin al cuadrado o, dicho de otra forma, la media de las diferencias (al cuadrado) de n puntaciones con respecto a su media aritmtica.

En realidad todas las calculadoras y programas informticos de anlisis de datos utilizan una variante de la formula anterior dado el carcter de sesgo que tiene la varianza muestral.

Desviacin tpica (tambin llamada desviacin estndar) Desviacin Tpica es la Medida de Dispersin ms importante y de mayor utilidad prctica, se representa normalmente por el smbolo (sigma) y es la que mejor nos da una idea de la variacin de los datos respecto a algunas de las medidas de tendencia central o posicin. En otras palabras, es el nmero que nos dice cun alejado estn los datos del valor de centraje o posicin previamente obtenido. Frmula de Desviacin Tpica:

Interpretacin de la Desviacin Tpica: Es una medida de distancia promedio de los valores observados a su media. La distancia de cada valor a la media se mide tomando el valor absoluto de la diferencia entre ese valor y la media, es decir, es la distancia de cada dato respecto a su promedio. Ejemplo de la Desviacin Tpica: Por ejemplo, si tenemos una produccin de franelas y sabemos que diariamente se producen un promedio de 500 franelas, adicionalmente tenemos tambin que la desviacin es de 25 franelas, tendremos entonces una mejor comprensin del proceso pues este ltimo nmero nos indica que diariamente se producen entre 475 y 525 franelas.

Desviacin tpica La desviacin tpica no es ms que la raz cuadrada de la varianza.

Una ventaja obvia de la desviacin tpica sobre la varianza es que la desviacin tpica viene dada en las mismas unidades de medida que los datos originales (en la varianza las unidades estn al cuadrado).

Error estndar El Error estndar es el trmino utilizado para referirse a una estimacin de la desviacin estndar, derivado de una muestra especial utilizada para calcular la estimacin en las estadsticas. En la ms comn, error estndar es un proceso de estimacin de la desviacin estndar de la distribucin de muestreo asociada con el mtodo de estimacin Cada estadstica tiene un error estndar asociado. Una medida de la precisin de la estadstica puede deducir que el error estndar de 0 representa que la estadstica tiene ningn error aleatorio y el ms grande representa menos preciso de las estadsticas. Error estndar no es constantemente informado y no siempre fcil de calcular. Tiempos de espera es uno de los ejemplo bien para Frmula de error estndar El error estndar de la media (SEM) es la desviacin estndar de la estimacin promedio de muestra de una media de la poblacin. La calculadora de Error estndar utiliza la frmula para calcular que el error estndar de la media es , i.e., la desviacin estndar dividida por la raz cuadrada del tamao de la muestra Donde SE = Error estndar de la media s = Desviacin estndar de la media n = Nmero de observaciones de la muestra La coleccin de herramientas emplea el estudio de mtodos y procedimientos utilizados para que recopilar, organizar y analizar datos para comprender la teora de la probabilidad y estadstica. El conjunto de ideas que pretende ofrecer la manera de hacer la implicacin cientfica de tales como resultado datos resumidos. En muchas aplicaciones es necesario calcular el error estndar para un conjunto de datos con cantidades variables.

Medidas de dispersin relativas


A la hora de establecer comparaciones no es aconsejable manejar magnitudes absolutas, ya que las unidades no son siempre comparables. Cuando se pretende comparar la dispersin de variables medidas en distintas unidades o variables con distinto orden de magnitud, es necesario relativizar.

Coeficiente de variacin Medida de Dispersin relativa, pero de gran importancia, y de gran versatilidad, ya que su interpretacin est basada en porcentajes, y nos da la relacin existente entre la medida de posicin o centraje y su precisin. Se suele expresar en "tanto" por ciento. Frmula del Coeficiente de Variacin:

Interpretacin del Coeficiente de Variacin: El Coeficiente de Variacin, mide la variabilidad relativa a la Media. Expresa la proporcin de variabilidad de una caracterstica por cada unidad de la Media.

Ejemplo del Coeficiente de Variacin: Sabemos que la fbrica de textiles produce 500 franelas diarias con una desviacin tpica de ms o menos () 25 franelas, entonces, el Coeficiente de Variacin ser 500/25 = 0,05, es decir, tenemos una variacin de 5% en la produccin diaria de franelas.

1.5. Tabla de Distribucin de Frecuencias


Una distribucin de frecuencias es un formato tabular en la que se organizan los datos en clases, es decir, en grupos de valores que describen una caracterstica de los [datos] y muestra el nmero de observaciones del conjunto de datos que caen en cada una de las clases. La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numrico. En principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el nmero de veces que aparece, es decir, su Frecuencia. Se puede complementar la frecuencia absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos. En variables cuantitativas se distinguen por otra parte la frecuencia simple y la frecuencia acumulada.

La tabla de frecuencias puede representarse grficamente en un histograma (Diagrama De Barras). Normalmente en el eje vertical se coloca las frecuencias y en el horizontal los intervalos de valores. La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente.

Tipos de frecuencias
Frecuencia absoluta La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por ni. La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N. Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria. Frecuencia relativa La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por fi. La suma de las frecuencias relativas es igual a 1. Frecuencia acumulada La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por Fa. Frecuencia relativa acumulada La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento. Ejemplo: Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.

En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta. xi 27 28 29 30 31 32 33 34 fa 1 2 6 7 8 3 3 1 FA Fr FR 1 0.032 0.032 3 0.065 0.097 9 0.194 0.290 16 0.226 0.516 24 0.258 0.774 27 0.097 0.871 30 0.097 0.968 31 0.032 1

Este tipo de tablas de frecuencias se utiliza con variables discretas.

Distribucin de frecuencias agrupadas


La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un nmero grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Lmites de la clase. Cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la clase. La amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase. La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros.

Construccin de una tabla de datos agrupados: 3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. 1. Se localizan los valores menor y mayor de la distribucin. En este caso son 3 y 48. 2. Se restan y se busca un nmero entero un poco mayor que la diferencia y que sea divisible por el nmero de intervalos queramos establecer. Es conveniente que el nmero de intervalos oscile entre 6 y 15.

En este caso, 48 - 3 = 45, incrementamos el nmero hasta 50 : 5 = 10 intervalos. Se forman los intervalos teniendo presente que el lmite inferior de una clase pertenece al intervalo, pero el lmite superior no no pertenece intervalo, se cuenta en el siguiente intervalo. ci [0, 5) 2.5 [5, 10) [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) [35, 40) [40, 45) [45, 50) Total: fi Fi ni Ni 1 1 0.025 0.025 7.5 1 2 0.025 0.050 12.5 3 5 0.075 0.125 17.5 3 8 0.075 0.200 22.5 3 11 0.075 0.2775 27.5 6 17 0.150 0.425 32.5 7 24 0.175 0.600 37.5 10 34 0.250 0.850 42.5 4 38 0.100 0.950 47.5 2 40 0.050 1 1

You might also like