Professional Documents
Culture Documents
Retomado por:
Bucaramanga
2013
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
INDICE DE CONTENIDO
INTRODUCCIÓN ..................................................................................................... 5
UNIDAD 1. BIOMETRIA......................................................................................... 9
CAPITULO 1: LA BIOESTADÍSTICA EN LA INVESTIGACIÓN PECUARIA......... 9
LECCIÓN 1: HISTORIA DE LA BIOESTADÍSTICA ............................................................ 9
LECCIÓN 2: USOS E IMPORTANCIA DE LA BIOMETRÍA EN EL SECTOR AGROPECUARIO ... 10
LECCIÓN 3: MÉTODO CIENTÍFICO ........................................................................... 11
LECCIÓN 4: CONCEPTOS ....................................................................................... 12
LECCIÓN 5: INVESTIGACIÓN CIENTÍFICA................................................................... 16
CAPITULO 2: ESTADÍSTICA DESCRIPTIVA ...................................................... 17
LECCIÓN 6: MEDIDAS DE TENDENCIA CENTRAL ........................................................ 17
LECCIÓN 7: DISTRIBUCIÓN DE FRECUENCIAS .......................................................... 33
LECCIÓN 8: GRÁFICAS .......................................................................................... 46
LECCIÓN 9: PRINCIPIOS DE PROBABILIDAD .............................................................. 51
LECCIÓN 10: MUESTREO ....................................................................................... 55
CAPITULO 3: INFERENCIA ESTADÍSTICA ........................................................ 67
LECCIÓN 11: INFERENCIA PUNTUAL ........................................................................ 67
LECCIÓN 12: PRUEBAS DE HIPÓTESIS ..................................................................... 82
LECCIÓN 13: COMPARACIÓN DE DOS MEDIAS MUESTRALES ...................................... 91
LECCIÓN 14: ANÁLISIS DE VARIANZA....................................................................... 98
LECCIÓN 15: ANÁLISIS DE COVARIANZA ................................................................ 100
UNIDAD 2. DISEÑO DE EXPERIMENTOS........................................................ 102
CAPITULO 4: DISEÑO DE EXPERIMENTOS .................................................... 102
LECCIÓN 16: EL EXPERIMENTO Y SUS ELEMENTOS................................................. 102
LECCIÓN 17: ORIENTACIONES GENERALES EN LA EXPERIMENTACION
AGRICOLA ...................................................................................................... 105
LECCIÓN 18: DISEÑO EXPERIMENTAL. .................................................................. 107
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
INTRODUCCIÓN
En el mundo se está tomando conciencia que todas las producciones, sin importar
su naturaleza y en especial las de principios biológicos o ambientales deben ser
analizadas numéricamente, no solo para determinar el estado de desarrollo, sino
las proyecciones o correcciones que se puedan hacer tanto para lograr beneficios
económicos como sociales o ambientales. La bioestadística como rama de la
estadística, es una herramienta que se puede usar de manera sencilla sin
necesidad de profundizar en ella, ni de dedicar toda una carrera profesional al
estudio de esta, no queriendo decir que no se deben conocer algunos principios y
procedimientos básicos.
UNIDAD 1
sector agropecuario
UNIDAD 2
UNIDAD 1. BIOMETRIA
La estadística que muchos creen como algo nuevo, es tan antigua como la misma
humanidad, ya que hay vestigios de su inicio antes de Cristo, como en China
donde el emperador Yao (2.238 a.c) dispuso la realización de un censo en su
imperio. Algo similar ocurrió en la época del Rey Herodes, relacionado con un
empadronamiento cuando nació Cristo.
Es así como se debe tener mucho cuidado en el uso de esta herramienta, la cual
es base para el entendimiento de procesos biológicos y que si es usada
correctamente se vuelve indispensable para formular y comprobar hipótesis,
teorías, modelos e incluso leyes, que conlleven a ampliar otras ciencias como la
nutrición, alimentación, genética, fisiología, ecología, geología, botánica, y muchas
otras más relacionadas con la naturaleza del hombre, los animales, las plantas,
microorganismos y en general con el medio ambiente.
1. Planeamiento o preparación.
2. Recolección.
3. Crítica y codificación.
4. Procesamiento.
5. Análisis e interpretación.
6. Publicación.
a. El objeto de la investigación
b. La finalidad
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
c. La fuente de información
d. Los procedimientos
e. El material
f. El costo y financiación.
Claridad. Toda investigación en todos sus pormenores, debe ser clara y conocida
por todos los que en ella vayan a intervenir. La claridad está ligada directamente
con la comprensión. La estadística en el periodo de investigación, en el de
elaboración en la presentación y análisis, debe ser entendida por todo el mundo:
investigador(es), lectores, quienes vayan a utilizar los resultados, etc.
Utilidad. Toda estadística que se inicie debe tener alguna aplicación práctica de
interés. De otro modo nos hallaremos ante una acumulación molesta de datos que
perjudicarán por muchos motivos, a la información realmente aprovechable.
Lección 4: Conceptos
Variables cualitativas. Son las que se expresan mediante palabras por no ser
mensurables, pero si cuantificables, tales como raza, marca, posición
socioeconómica, clima, etc.
Variable Discreta. Se refiere a aquellas que solo pueden tomar unos determinados
valores, siendo imposible que lleguen a tomar valores intermedios entre dos
consecutivos, es decir toma únicamente valores enteros: 1, 2, 3,V, tal es el caso
del número de lechones por camada, cantidad de colonias de bacterias en un
cultivos de agar, número de peces muertos por contaminación del agua, número
de huevos viables para incubar, etc.
tomado de forma aleatoria. Los valores que resultan de los procesos de medición
suelen conocerse como observaciones o simplemente como medidas. Todos los
procesos investigativos en variables biológicas deben garantizar que las
observaciones o mediciones que se hayan tomado en individuos, zonas, lotes,
plantas, etc., sean el producto de una selección aleatoria.
Si se lleva a cabo una medición de alguna variable sobre cada uno de los
elementos de una población, se obtiene una población de valores definida como el
mayor grupo de valores de una variable aleatoria, por los cuales se tiene un cierto
interés en un momento dado. (Daniel, 1990).
Las poblaciones pueden ser finitas o infinitas. Si una población de valores consta
de un número fijo de estos valores, se dice que la población es finita. Por otra
parte si una población consta de una sucesión sin fin de valores, dicha población
es infinita. Por ejemplo: si se desea hacer un estudio sobre la población bovina de
un país, se sabe por censo o registros, un número determinado de la población y
se convierte en una población finita. Por el contrario, si se desea estudiar la
presencia de un hongo en las mazorcas que se producen en un cultivo de maíz,
no se sabe el número determinado de mazorcas producidas y por tanto es una
población infinita, o mejor aún, si el estudio pretende determinar la presencia de
hongo en una bodega de granos, no se sabe cuántos granos están almacenados
en la bodega.
MUESTRA. Una muestra puede definirse como una parte de una población. La
muestra es un subconjunto de la población. Cuando la población es relativamente
pequeña, es posible estudiar a todos los individuos que la integran, pero cuando la
muestra corresponde o representa a una población grande o infinita, normalmente
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
Tienen mayor posibilidad que otras de ser seleccionadas; por tal razón no se
puede determinar la validez, ni la confiabilidad que merecen dichos resultados.
Casi por lo general, las unidades se seleccionan de forma caprichosa.
Una unidad experimental puede estar compuesta por un individuo o por un grupo
de individuos, es decir; individuales o grupales. Las unidades experimentales
individuales, como su nombre los indica son aquellas que están compuestas por
cada uno de los individuos de la muestra o de la población. Las unidades
experimentales grupales son las que por facilidad de trabajo o conveniencia del
estudio se trabajan en grupo. Por ejemplo: en un estudio de incidencia y
prevalencia de Influenza Equina, se toma como unidad experimental cada uno de
los equinos a los que se estén haciendo las pruebas, entonces se estaría
hablando de unidades experimentales individuales. Mientras que en un estudio
para determinar la ganancia de peso de caracoles bajo ciertas dietas, para facilitar
el trabajo se pesan los caracoles en grupos de 10, lo cual cada grupo corresponde
a una unidad experimental grupal y los resultados se presentan para grupos de 10
caracoles.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
Esta última forma de definir las unidades experimentales puede provocar un error
si los individuos que la conforman no son lo suficientemente homogéneos y
causan diferencia con otras unidades experimentales grupales.
Medias
descriptivas
Población Muestra
Parámetros Estimadores
• Debe ser descriptiva de los datos en forma que su significancia sea fácil de
entender.
• No debe ser una abstracción matemática, que únicamente pueda ser
entendida por personas muy versadas en esta ciencia, ya que una de las
funciones de la estadística es simplificar los datos y no hacerlos más
complejos.
• Debe ser fácil de calcular.
• Debe ser calculada con todos los elementos del grupo de datos.
• Debe depender de todo el grupo de datos, de tal manera que si se altera uno
de estos, consecuentemente se altera el valor obtenido.
• A pesar de que cada uno de los valores del grupo de datos, debe tener
influencia sobre la medida obtenida, ésta debe ser de tal calidad que no vea
influenciada en gran medida por el cambio de algunos pocos datos.
• Debe ser de uso fácil para cálculos matemáticos posteriores.
De otra forma, dependiendo su naturaleza y función, las medidas descriptivas se
pueden clasificar en:
Notación Sigma.
∑ (sigma); significa sumatoria, es decir; que se debe sumar el grupo de datos con
el que se cuenta.
n
Si se tiene la notación: ∑ yi = y
i =1
1 + y2 + ... + yn ; donde:
∑ Es el operador de la suma.
i Es el índice de la suma
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
∑ yi
i =1
Indica; “súmese todos los valores observados de una variable cuyos
5 5
• ∑ yi = y
i=2
2 + y3 + y4 + y5 ∑ yi = 2 + 3 + 4 + 5 = 9
i=2
5 5
• ∑y
i =1
2
i = y 12 + y 22 + y 23 + y42 + y 25 ∑y
i =1
2
i = 12 + 2 2 + 32 + 4 2 + 52 = 55
2 2
5 5
• ∑ yi = ( y1 + y2 + y3 + y4 + y5 ) ∑ yi = (1 + 2 + 3 + 4 + 5) = (15) 2 = 225
2 2
i =1 i =1
5
• ∑ ( yi − 3) = (1 − 3) + (2 − 3) + (3 − 3) + (4 − 3) + (5 − 3)
i =1
5
• ∑ ( yi − 3)
i =1
2
= (1 − 3) 2 + (2 − 3) 2 + (3 − 3) 2 + (4 − 3) 2 + (5 − 3) 2
5
• ∑ 3 yi = 3(1) + 3(2) + 3(3) + 3(4) + 3(5)
i =1
Media Aritmética.
Media Ponderada.
Media Geométrica.
Mediana.
Moda.
∑ xi ∑x i
Para una población: µ = i =1
Para una muestra: xˆ = i =1
n n
x1 + x2 + x3 + ... + xn
En forma aplicable µ =
n
2 + 5 + 7 + 6 + 4 + 8 32
µ= = = 5.33
6 6
CONJUNTO DE DATOS
• Es sensible a valores extremos (muy altos o muy bajos) en los cuales un solo
valor puede causar una media aritmética no representativa para un grupo de
datos. Ejemplo. Si se tienen los valores 5, 4, 7, 5, 18. la media aritmética sería
7,8; lo cual indica un valor muy alto para el grupo de datos y que está
influencias por el dato extremo 18.
• Por la forma como se distribuyen los datos de una variable, no es
representativa para resumirlos y se puede concluir mal sobre dicho dato. En
este caso, depende de la habilidad del investigador para dar la validez al valor
de la media.
Cuando las observaciones se han presentado en una tabla de frecuencias, el valor
aproximado de la media aritmética, que se llamaría media aritmética de datos
agrupados, se puede obtener mediante la siguiente ecuación:
)
x=
∑xn i i
=
x1n1 + x2 n2 + ... + xn nn
n n1 + n2 + ...nn
87.5 x9 + 95.5 x11 + 97.5 x14 + 102.5 x 20 + 107.5 x 27 + 112.5 x 22 + 117.5 x19
)
x=
∑xn i i
=
+ 122.5 x16 + 127.5 x12
n 9 + 11 + 14 + 20 + 27 + 22 + 19 + 16 + 12
) 16353
x= = 109.02
150
)
xw =
∑wn i i
∑n i
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
Precio Producción
Clasificación (Kg) (Kg) wi x ni
WI ni
A 3.000 1.200 3.600.000
B 2.800 2.500 7.000.000
C 2.500 3.450 8.625.000
D 1.800 6.420 11.556.000
13.570 30.781.000
∑n i ∑n × w
i i
)
xw =
∑wn
i i )
xw =
30.781.000
= 2.268,31 Kg de mango.
∑n i
13.570
Esto indica que en promedio, el kilogramo de mango a esos precios (de acuerdo a
las clasificaciones) se venderá a 2.268,31 pesos.
Propiedades de la mediana:
n 1
Me = Y +
2 2
Para un conjunto de elementos donde se tienen 8 datos, 4, 5, 7, 9, 10, 11, 12, 14;
la mediana estaría ubicada en:
8 1 9
Me = Y + = = 4,5 Indicando que la mediana se ubicaría entre el 4 y 5
2 2 2
dato.
2, 4, 7, 11, 14
(Me=7)
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
Ejemplo. En el caso de los datos (1, 4, 3, 1, 2, 5,), la moda sería 1; es el dato que
más se repite en el conjunto y en este caso es una distribución unimodal. Para el
conjunto (2, 4, 2, 3, 1, 5, 1), los números 1 y 2 ocurren con la misma frecuencia y
por tanto la distribución es bimodal.
Medidas de dispersión
Las medidas que se han visto anteriormente carecen de validez para indicar si son
representativas para un conjunto de dato o no. Tal es el siguiente ejemplo, donde
se tiene el conjunto de datos (3, 6, 3, 45, 32, 80, 20, 5,), donde el promedio es
24,5, el cual no es representativo por la variabilidad de los datos por esta razón se
han diseñando los cálculos de las medidas de dispersión. Estas medidas indican
el grado de variabilidad entre las observaciones, las más comunes son:
• Amplitud.
• Varianza
• Desviación estándar.
• Coeficiente de varianza.
Al calcular un promedio, por ejemplo la media aritmética, no sabemos su
representatividad para ese conjunto de datos. Por esto se hace necesario
determinar si hay concentración de datos alrededor del promedio, lo cual nos
indicaría una buena aplicación en su uso, por el contrario una gran dispersión
estaría indicando poca representatividad, reduciendo la confiabilidad. El estudio de
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
R = XL − XS
R = 129– 85
R = 44
La utilidad del recorrido es limitada. El hecho de que sólo tome en cuenta dos
valores, hace que sea una medida pobre en cuanto a dispersión. La ventaja
principal de utilizarla es su sencillez de cálculo.
( ∑ xI − X ) 2
Para una muestra S2 =
n −1
∑x
2
i −X
Para una población σ =2
Procedimiento de cálculo.
DATOS DE VARIANZA
Diferencias
Valores Diferencias
al
cuadrado
Xi d
d2
3 -2,3 5,4
6 6,0 36,0
7 7,0 49,0
8 8,0 64,0
2 2,0 4,0
6 6,0 36,0
n 194,4
∑x
i =1
i 32
Suma de
5,3 d2
Promedio (∑ xI − X ) 2
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
( ∑ xI − X ) 2
194,4
Entonces; S 2 = S2 = S 2 = 5,46
n −1 6 −1
Propiedades de la varianza.
( ∑ xI − X ) 2
Para una muestra s= en forma resumida s = S 2
n −1
( ∑ xI − X ) 2
Para una población σ = en forma resumida σ = σ 2
N
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
s = S2 s = 5,46 s = 2,33
Aún cuando se utilice la misma unidad de medición, las dos medias pueden ser
distintas. Si se compara la desviación estándar de la ganancia de peso de terneros
destetos (kg) con la desviación estándar de la ganancia de peso de terneros al
año, puede encontrarse en éstos últimos, un valor de desviación numéricamente
mayor que la de los primeros debido a que lo propios pesos son mayores y no
porque la dispersión sea mayor.
s
CV = (100)
X
s 5,46
CV = (100) CV = (100) CV = 1,025
X 5,33
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
s 2950
CV = (100) Lote A: CV = (100) CV = 20,41%
X 14.450
3.120
Lote B: CV = (100) CV = 16,64%
18.750
Medidas de posición
1(n + 1)
Para datos no agrupados Q1 =
n
n
4 − N k −1
Para datos agrupados Q1 = L1 + ×C
nk
2(n + 1)
Para datos no agrupados Q1 =
n
2n
4 − N k −1
Para datos agrupados Q2 = L1 + ×C
nk
3(n + 1)
Para datos no agrupados Q1 =
n
3n
4 − N k −1
Para datos agrupados Q3 = L1 + ×C
nk
Ejemplo para datos no agrupados. Si se tiene los siguientes valores 16, 10, 4, 8,
12, 10, 8, 20, 4, 13, 12, 22, 16, 26, 20, calcular el primero, segundo y tercer cuartil.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
1(n + 1) 1(15 + 1) 16
Q1 = Q1 = Q1 = Q1 = 4
n 4 4
El primer cuartil está ubicado en el cuarto lugar y por tanto corresponde al valor 8.
1(n + 1) 2(15 + 1) 32
Q2 = Q2 = Q2 = Q2 = 8
n 4 4
El segundo cuartil está ubicado en el octavo lugar y por tanto corresponde al valor
12
1(n + 1) 3(15 + 1) 48
Q3 = Q3 = Q3 =
n 4 4
Q3 = 12
Estadígrafo de forma
Con estos estadígrafos se pretende determinar si una distribución es simétrica o
asimétrica. Si la distribución es simétrica se dice que corresponde a una
distribución normal cuya curva representativa es la campana de Gauss.
media − mod a X − Mo
S´= S´=
desviación típica s
3(media - mediana) X − Me
S´= S´=
desviación típica s
Ejemplo: si se tiene el siguiente conjunto de datos. 74, 71, 65, 72, 67, 79, 88, 66,
99, 40, 52.
R = 94 – 40
R = 50
2. Estimación del número de clases (m). Para elaborar una tabla de frecuencias,
se establece cierto número de clases (denotada con la letra m) en los valores
observados. Dicho número por lo general varía entre 5 y 15 a mayor número de
datos, debe disponerse de mayor número de clases. Se debe tener en cuenta que
si el número de clases es muy pequeño, se podría estar encubriendo
características importantes de los datos debidos al agrupamiento; si se tienen
demasiadas clases, pueden aparecer clases vacías y la información no se resume
de forma clara.
m=1+3,322(log n)
m=1+3,322(log 758)
m=1+3,322(2,8796)
m=1+9,5662
m=10,5662
m=11 clases.
Para justificar cualquiera de los dos métodos siendo más usado el primero, es
preciso que la decisión sea tomada por una persona que conozca muy bien los
datos y el uso que se les va a dar.
3. Estimación del ancho de cada clase (amplitud de intervalo, C). Es el valor que
va a tener como amplitud en cada una de las clases que se han establecido. Es
recomendable estimar un solo valor de amplitud para todas las clases que se
pretendan manejar en la tabla de frecuencias, esto le da más confiabilidad y
presentación al resumen de datos que se pretende hacer. El ancho de la clase se
obtiene dividiendo el rango entre el número de clases.
R 176
C= ; C= ; C = 22
m 8
Esto implica que cada una de las 8 clases tendrá un ancho o amplitud de 12
unidades.
a. Cambiar número de clases por uno que permita obtener valores enteros.
b. Aproximar el ancho de clase a un valor por encima del valor que se obtiene
para evitar que en momento de agrupar los datos se queden datos sin
representar.
Ejemplo: si se tiene un rango de 425 y se pretende dividir en 6 clases, el
ancho de las clases quedaría así:
R 425
C= ; C= ; C = 70,8
m 6
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
R 254
C= ; C= ; C = 28,22
m 9
Por otro lado, si se aproxima el 28,22 a 29, se estaría aumentando por cada
clase (29-28,22) = 0,78 unidades, que en las 9 clases sería (0,78 x 9)=7,02
unidades. Esto implica que en la última clase del cuadro se tenga un
espacio perdido que está por encima del dato mayor con el que se sacó el
rango.
4. Estimar límite inferior y límite superior de cada clase (xi-1 – xi). Una vez
determinado el ancho de cada clase, se puede estimar el límite inferior y el límite
superior en cada una de las clases. Este se obtiene tomando el dato menor del
conjunto de datos (que sería el límite inferior de la primera clase) y sumándole el
ancho de clase, este resultado sería el límite superior de dicha clase.
Este último valor obtenido sería el punto de partida (límite inferior) de la siguiente
clase, el cual, al sumarle el ancho de clase marcaría el límite superior de la clase
correspondiente. En forma sucesiva se sigue haciendo esta operación hasta
calcular los límites para todas las clases propuestas, teniendo en cuenta que la
última clase debe contener el valor máximo del conjunto de datos.
Dato menor 25
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
Rango 100
Número de clases 5
Ancho de clase 20
Clase limites
1 25 - 45
2 45 - 65
3 65 - 85
4 85 - 105
5 105 - 125
Clase limites
1 25 - 45
2 45.1 - 65
3 65.1 - 85
4 85.1 - 105
5 105.1 - 125
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
b. Que los límites en cada una de las clases se clasifique como intervalos cerrados
[ ] o intervalo abierto ( ), o sus combinaciones [ ) ó ( ] , esto implica que cada en
cada intervalo se coloque el signo respectivo. En el caso de ser un intervalo
cerrado en el límite inferior [ indica que si se tiene el número igual al límite inferior,
este se ubica en dicho intervalo; pero si el intervalo es abierto ( , no se tiene en
cuenta.
Clase limites
1 [25 - 45)
2 [45 - 65)
3 [65 - 85)
4 [85 - 105)
5 [105 - 125]
Se puede observar que en la última clase, el límite superior están como intervalos
cerrado, ya que se está seguro que no existen datos por encima de este dato.
5. Marcas de clase. Corresponden al punto central en cada una de las clases que
se han tomado. Se obtiene sumando en cada clase el límite inferior y el superior
para luego dividirlo en dos.
1 25 - 45 35 = ((25+45)/2)
2 45 - 65 55
3 65 - 85 75
4 85 - 105 95
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
∑n
i =1
i = n1 + n2 + n3 + ... + nm = n
N i = n1 + n2 + n3 + ... + nm
Las frecuencias relativas sin haberse multiplicado por cien, siempre dan un valor
decimal y la suma de todas estas debe dar 1.
ni
hi =
n
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
∑h
i =1
i = h1 + h2 + h3 + ... + hm = 1
H i = h1 + h2 + h3 + ... + hm
100 111 125 119 91 106 120 129 120 109 104 112
108 118 118 113 114 109 91 104 109 110 113 119
99 108 114 121 107 122 100 116 111 109 104 113
114 106 105 115 98 112 103 92 125 107 115 118
El examen de los datos revela que los puntajes, más bajos y más altos son 85 y
129 kilos, respectivamente. Entonces, el intervalo inferior de clase debe empezar
desde 85 y el intervalo mayor debe tener un límite no menor a 129.
R = 129– 85
R = 44
m=1+3,322(log 150)
m=1+3,322(2,17609)
m=1+7,2289
m=8,22
m=9. Clases.
LÍMITES DE CONFIANZA
Clase limites
1 [85 - 90)
2 [90 - 95)
3 [95 - 100)
4 [100 - 105)
5 [105 - 110)
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
6 [110 - 115)
7 [115 - 120)
8 [120 - 125)
9 [125 - 130]
∑n
i =1
i = n1 + n2 + n3 + ... + nm = n
n = 150
∑h
i =1
i = h1 + h2 + h3 + ... + hm = 1
Con esta última tabla se puede iniciar un análisis que permita determinar lo
siguiente:
Lección 8: Gráficas
• Histogramas
• Polígonos de frecuencias
• Ojivas
• Diagrama circular o pastel
• Pictogramas
Martínez 2005, presenta como recomendaciones para la elaboración de gráficas
lo siguiente:
El histograma.
30
25
20
15
10
0
85 90 95 100 105 110 115 120 125 130
Polígono de frecuencias.
Ejemplo.
cantidad de cerdos 30
25
20
15
10
0
87,5 92,5 97,5 102,5 107,5 112,5 117,5 122,5 127,5
peso de los ceredos (kg)
Ojiva:
Ejemplo.
Diagrama circular, de pastel o torta: en este tipo de gráficas los datos viene
sustituidos por superficies de áreas proporcionales al número a representar. Las
gráficas son particularmente útiles para visualizar las diferencias en frecuencias
entre algunas teorías del nivel nominal. Como ejemplo se puede tomar la siguiente
tabla donde se catalogan los cerdos según el peso.
S = {V , N }
S = {1,2,3,4,5,6,7,8}
S = {X / 0 ≤ X ≤ 100}
S = {X / X > 0}
S = {1,2,3,4,5,6,7,8}
E1 Semilla viable
E2 Semilla no viable
E1 VVV E5 VNN
E2 NVV E6 NVN
E3 VNV E7 NNV
E4 VVN E8 NNN
m
P( E ) =
N
m
P( E ) = .
n
55
P (E ) = = 0,68.
80
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
Este punto de vista sostiene que la probabilidad mide la confianza que tiene un
determinado individuo en la veracidad de una proposición particular.
1. Todos los eventos deben tener una probabilidad mayor o igual a cero, lo
cual es un argumento razonable en vista de la dificultad de obtener una
probabilidad negativa. Dicha probabilidad del evento tampoco puede ser
mayor a 1.
P ( E ) =≥ O 0 ≤ P( E ) ≤ 1
P(S ) = 1
Existe, adicionalmente, otra razón de peso para hacer uso del muestreo
estadístico y es el estricto control que se puede ejercer sobre la recolección de la
información, muy superior al que se lograría en el caso de un censo (toda la
población). Los errores en el estudio, especialmente aquellos conocidos como
errores muestrales (no respuesta, inconsistencia, codificación errada, etc.)
disminuyen considerablemente cuando se realiza un muestreo en vez de un
censo.
Forma de muestreo:
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
De esta forma, se definen las medidas de una población como parámetros y las de
una muestra como estimadores, teniendo para cada una y de acuerdo al tipo de
medida una simbología.
Muestreo probabilístico.
Existen condiciones que deben cumplirse para poder hablar de una muestra
probabilística. Ellas son:
3. Muestreo autoritario. Exige que una persona, bien familiarizada con el material
que va a muestrearse, extraiga la muestra sin tener en cuenta la aleatorización.
Tal procedimiento depende completamente del conocimiento y pericia de la
persona que hace el muestreo. Puede producir buenos resultados en algunos
casos, pero rara vez se recomienda.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
Una manera de seleccionar una muestra aleatoria simple es utilizar una tabla de
números aleatorios simples.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
aleatorio en la tabla. Esto puede hacerse de varias formas; una de las cuales es
quitar la vista de la página, mientras que se toca con la punta de un lápiz. El punto
de partida aleatorio es el dígito más próximo al punto donde el lápiz tocó la página.
Supóngase que, siguiendo este procedimiento, se llegó a un punto de partida
aleatorio en la intersección de renglón 15 con la columna 20. El dígito en este
punto es 3. Dado el número N de valores, sólo se puede elegir este número en
aleatorios (de 1 a N); en ocasiones es necesario elegir número de dos, tres o más
dígitos. Para el caso de tres dígitos se buscarían números de 0001 a N que no
sería mayor a 999. El primer valor aleatorio inicia en el punto de partida,
seleccionándose para la muestra los que correspondan de 001 a N, recorriendo la
columna hacia abajo. Cuando se termia la columna de selección y no se ha
completado el tamaño de la muestra, se puede continuar en la siguiente columna
de abajo hacia arriba o de arriba hacia abajo; hasta completar el n, en esta caso
15.
s2
sx =
n
s2 n
sx = 1 −
n N
n
En donde el término 1 − constituye un factor de corrección por finitud. Cuando
N
N→α o la fracción n/N es menor que 0,05, se ignora el factor por finitud.
Pq n
s 2p = 1 −
n N
X −µ
~N
sx
E E s 2 tα / 2
= tα / 2 ⇒ = tα / 2 por lo cual: n =
sx s E2
n
n0
n=
n
1+ 0
N
Datos obtenidos.
E = 0,5
1 − α = 0,95
s 2 = 5,32
tα / 2 = 2
s 2 (tα / 2 ) 2
n1 =
E2
5,32 2 (2) 2
n1 =
0,5 2
28,3024(4)
n1 =
0,25
113,2096
n1 =
0,25
n1 = 452,83 ≈ 453
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
5,32 2 (2,24) 2
n=
0,5 2
28,3024(5,01)
n=
0,25
142 , 01
n =
0 , 25
n = 568,04 ≈ 568
n0
n=
n
1+ 0
N
568
n=
568
1+
10000
n = 537,507 ≈ 538
De esta forma, para que la muestra sea confiable en una población de 10000
árboles, es necesario tomar una muestra de 538 árboles.
Otra expresión para estimar el tamaño del a muestra puede obtenerse cuando se
fija la precisión de P (probabilidad de éxito) deseada como un proporción de la
media y se utiliza el coeficiente de variación en lugar de la varianza.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
E
P= ⇒ E = PX
X
s
CV = ⇒ s = CVX
X
s 2 t 2 (CV ) X 2 t 2 (CV ) t 2
2 2
n= = =
E2 p2 X 2 p2
Se tiene que:
CV = 42,5%
P = 0,2
T0,05/2 = 2
Entonces:
n=
(CV )2 t 2
p2
n=
(0,425)2 2 2
0,2 2
n=
(0,1806 )4
0,04
0,7225
n=
0,04
n = 18,06 ≈ 19
n0
n=
n
1+ 0
N
18,06
n=
18,06
1+
30000
n = 18,05 ≈ 19
Z α2 / 2 pˆ qˆ
n=
E2
La inferencia puede ser de dos tipos: pruebas de hipótesis sobre los parámetros y
estimaciones sobre el valor de los mismos. La clase de inferencia depende de los
objetivos que tenga el investigador con respecto a las poblaciones de estudio.
Partiendo de esto, en inferencia se pueden considerar dos formas de estimación:
puntual y por intervalos. La estimación puntual utiliza la información contenida en
la muestra para llegar a un solo número o punto que estima el parámetro de
interés. La estimación por intervalo determina el rango en el que se encuentra el
parámetro con cierta probabilidad.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
E (a) = A
Sesgo de a = E (a-A).
Esquemáticamente sería:
N
⇓
n1 ⇒ X 1
n2 ⇒ X 2
n3 ⇒ X 3
.
.
.
nn ⇒ X n
∑X
Xn
N⇒ µ
DATOS OBTENIDOS.
s 2
=
∑xi
2
−X
n −1
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
Cualquier inferencia que se haga sobre una población siempre tiene un error, de lo
contrario, la varianza del dato que se obtiene debería ser 0 lo cual nunca sucede.
Por tal razón, y para asegurar la validez del estimador sobre el parámetro, en
muchas ocasiones si no son todas, es preciso hacer inferencia por intervalos, en
los cuales se calculen un límite superior y un límite inferior que enmarcan el
parámetro esperado que representa la población. Sin embargo, esto límites
siempre siguen guardando un error sin importar si son para promedio, varianza o
proporciones.
P (L1 ≤ A L2 ) = 1 - α
Donde:
X −µ
Z= ~ N(0,1)
σX
Si se indica como zα/2 el valor de la tabla Z tal que el área de la derecha zα/2 es
igual a α/2, entonces P(Z< -zα/2) = α/2 por la simetría de la curva.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
En donde:
σ
L1 = X − σ X z α / 2 = X − × zα / 2
n
σ
L2 = X + σ X z α / 2 = X + × zα / 2
n
Con las ecuaciones L1 y L2 se han obtienido los intervalos con una confianza de 1-
α para el parámetroµ. Los estadísticos L1 y L2 se denominan intervalos de
confianza inferior y superior.
entre cuanto está el promedio de altura de todo el cultivo con una confiabilidad del
95%, es decir 1-α =. 1-0.95= 0.05.
σ
L1 = X − × zα / 2
n
σ
L2 = X + × zα / 2
n
Como es claro que la confiabilidad es del 95% y el error del 5%, para cumplir con
el α/2, el error se debe dividir en dos colas, lo que quiere decir que el error en
cada punta o cola de la gráfica de la distribución estándar es de 0,025 o lo mismos
que 2,5%.
X = 135
σ = 15
α = 0.05/2 =0.025
1-α = 0,95
n = 250
σ 15
L1 = X − × zα / 2 L1 = 135 − × 1,96
n 250 L1 = 133,14
σ 15 L2 = 136,85
L2 = X + × zα / 2 L2 = 135 + × 1,96
n 250
Con este resultado, se estima que la altura promedio de todo el cultivo de sorgo
está entre 133,4 y 136,85 centímetros, con un coeficiente de confianza de 0.95.
Este coeficiente de confianza explica que al repetirse el muestreo se espera que el
95% de los intervalos obtenidos en esta forma contengan a µ.
De esta forma se pude resumir que la ecuación para hallar límites de confianza
cuando se tienen muestras grandes corresponde a:
σ
LC = X ± × zα / 2
n
Se debe notar que uno de los principales factores que afecta la amplitud de los
límites es la variabilidad de los datos expresada en la desviación estándar, la cual,
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
Por ejemplo. Si se quiere tener una confiabilidad del 95% (0,95) donde 1-α
corresponde al 5% (0,05) y zα/2 sería 2,5% (0,025) no es lo mismo que si exige
una confiabilidad del 99% (0.99) donde 1-α corresponde al 1% (0,01) y zα/2 sería
0,005% (0,005). En el primer caso se deja un mayor espacio o para el error que en
el segundo y por eso, en el segundo, por ser más preciso implica que el intervalo
sea más amplio.
Es posible que aún se tenga duda sobre el valor de zα/2 utilizado para calcular los
límites de confianza. Este valor se toma como una constante calculada con la
distribución Z, y los cuales se expresan en la siguiente tabla.
Coeficiente de Error
Confianza α
(1-α) a una cola a dos colas zα/2
Porcentaj Probabilida Porcentaj Probabilida Porcentaj Probabilida
e d e d e d
90 0,90 10 0,10 5 0,05 1,6
4
95 0,95 5 0,05 2,5 0,025 1,9
6
99 0,99 1 0,01 0,5 0,005 2,5
8
Para aclarar de donde salen los valores de zα/2; se estima que en la distribución
normal, para que se incluyan el 90% de los datos de una muestra o población, se
le debe restar o sumar 1,64 desviaciones estándar y crear un intervalo. Si el
requerimiento es tener el 95% de los datos, al promedio se le debe sumar y restar
1,96 desviaciones estándar y si se quiere tener el 99% de los datos dentro de un
intervalo, se debe sumar y restar 2,58 desviaciones estándar.
∑(X
2
i − X)
Para una muestra s 2
=
n −1
∑(X
2
− X)
Para una población σ
i
2
=
n
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
x−µ
z=
σ
Cada valor de z puede elevarse al cuadrado para obtener z2. Cuando se estudia la
distribución muestral de z2, se encuentra que sigue una distribución χ2 con un
grado de libertad. Es decir:
2
x−µ
χ 2
= =z
2
σ
(1)
σ σ
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
1 1
f (u ) = × u ( k / 2) −1 × e − (u / 2)
k 2 k/2
− 1 !
2
En esta gráfica se observa que las formas para k = 1 y k = 2 son bastante distintas
a la forma cuando k>2. También se observa que la distribución toma valores
desde cero hasta el infinito. No puede tomar valores negativos ya que es la suma
de los valores de z elevados al cuadrado.
(n − 1) s 2
~ χ 2 ( n −1)
σ
p ( χ 12 ≤ χ 2 ≤ χ 22 ) = 1 − α
χ2 = χ2
1 α
(1 − )( n −1)
2
χ 22 = χ 2 (
α
)( n −1)
2
Por lo cual
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
(n − 1) s 2
p χ 12 ≤ ≤ χ 22 = 1 − α
σ 2
(n − 1) s 2 (n − 1) s 2
p ≤ σ 2
≤ = 1 − α
χ2 χ 12
2
De donde:
(n − 1) s 2
L1 =
χ 22
(n − 1) s 2
L2 =
χ 12
χ2 = χ2
1
( 1−
α
)( n −1) χ 2 = χ 2 0,95( 9) χ 2 = 3,32
2 1 1
χ 22 = χ 2 (
α
)( n −1)
χ 22 = χ 2 0,05(9 ) χ 22 = 16,92
2
De esta forma, se puede aclarar que los investigadores tratan con dos tipos de
hipótesis: la hipótesis de investigación y la hipótesis estadística. La hipótesis de
investigación es la conjetura o suposición que motiva la investigación. Puede ser
el resultado de años de observación por parte del investigador. Un Médico
Veterinario por ejemplo, puede haber notado que ciertos equinos respondieron
más rápidamente a un tratamiento para cólico. Los proyectos de investigación
suelen resultar del deseo de los profesionales para determinar si sus teorías o sus
sospechas pueden ser apoyadas o no cuando se someten a los rigores de la
investigación científica.
Es importante, sin decir que es camisa de fuerza, tener en cuenta algunos pasos o
aspectos para poder aplicar pruebas de hipótesis estadísticas.
X −µ
z=
σ
n
µ Es el supuesto
σ
Es el error estándar de la X
n
Ho: µ = µ0
o bien: Ho: µ = µ0
HA: µ < µ0
X − µ0
t= Para muestras pequeñas,
SX
X − µ0
z= Para muestras grandes o con σ conocida.
σX
HA: µ > µ0
HA: µ < µ0
SX
{
R = t / t ≥ tα (n −1) }
Si t ∈ R entonces se rechaza Ho
Si t ∈ R entonces se acepta Ho
Ejemplo. El contenido de proteína cruda (PC) del pasto estrella morado (Cynodon
nlefluencis) es de 8% en prefloración. Por procesos de fertilización en el suelo de
acuerdo los requerimientos se supone que aumenta el nivel de proteína
comparado con el cultivo tradicional. Se toman aleatoriamente 15 muestras y se
determina el contenido de PC para cada una. De los valores encontrados se tiene
que el promedio nuevo de proteína es de 12%, con una varianza de 48.
X = 12%
s 2 = 48
Ho: µ = µ0
HA: µ > µ0
Se puede notar que se usa la prueba unilateral a la derecha por que se pretende
probar si el nuevo valor promedio encontrado de proteína cruda (PC) es mayor
que el obtenido bajo condiciones normales o no.
s2 48
sx = = = 1,78
n 15
X − µ 0 12 − 8
tc = = = 2.24
SX 1.78
t 0.05(14 gl ) = 1.7613
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
Es importante tener en cuenta que en la tabla se busca a una sola cola (unilateral);
para el ejemplo del 0.05 como α, se busca al 95% de confiabilidad.
** Probabilidad
En vista de que |tc| > t0.05(14), entonces se rechaza Ho con un nivel de significancia
del 0.05 y se puede afirmar que con un nivel de confiabilidad del 95%, el nivel de
proteína de pasto estrella morado (Cynodon nlefluencis) fertilizado de acuerdo a
los requerimientos del suelo es mayor que cuando se tiene como un cultivo
convencional sin fertilización.
Ho: µ = µ0
X − µ0
t= Para muestras pequeñas,
SX
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
X − µ0
z= Para muestras grandes o con σ conocida.
σX
Es importante tener en cuenta que, en este caso, como se tienen dos posibles
respuestas simbolizadas en la hipótesis al decir que es diferente sin saber si es
mayor o menor que el parámetro de comparación, se debe trabajar la distribución
de forma bilateral; donde el nivel de significancia α es divido en dos partes (α/2)
que indican la porción de rechazo en la distribución de los datos; tal como se
muestra en la siguiente gráfica.
En este caso la región crítica R está formada por dos partes: R1 y R2,
donde;
R1 = {t / t ≤ −tα / 2}
R1 = {t / t ≥ tα / 2}
Ejemplo. El historial de una finca ganadera muestra que los animales que se
encuentran en ceba tienen como promedio de ganancia de peso 930 g/día/animal.
Para evaluar un lote que está en esta etapa de producción y saber si se encuentra
dentro de los parámetros de producción de la finca, se hace un muestreo aleatorio
de 15 animales, obteniéndose los siguiente valores como ganancia diaria de peso:
740, 890, 910, 915, 1000, 980, 960, 870, 856, 798, 979, 863, 982, 791, 916.
Ho: µ = 930
Para hacer los cálculos con la distribución t se deben hallar los valores de
promedio y error estándar de la media sx .
X = 896,67
s 2 = 6112,09
X − µ0 s2 16112,09
t= donde; sx = = = 20,18 entonces;
SX n 15
X − µ 0 896,67 − 930
tc = = = −1,65
SX 20,18
Teniendo en cuenta que |t| < tα/2 entonces, se acepta la hipótesis nula (Ho) con una
confiabilidad del 95% y se puede concluir que: Estadísticamente al 95% de
confiabilidad, la ganancia de peso del lote de ceba en la finca está acorde con el
promedio que se tiene como registro.
H 0 : µ1 − µ 2 = 0, H A : µ1 − µ 2 ≠ 0
H 0 : µ1 − µ 2 ≥ 0, H A : µ1 − µ 2 < 0
H 0 : µ1 − µ 2 ≤ 0, H A : µ1 − µ 2 > 0
Así como se muestra, es posible probar que la diferencia es igual a, mayor que, o
menor o igual que algún valor distinto a cero.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
H 0 : µ1 = µ 2 0, H A : µ1 ≠ µ 2
4. Estadístico
Z=
(x1 − x2 ) − (µ1 − µ 2 )
σ 12 σ 22
+
n1 n2
Z=
(4,5 − 3,4) − (0) = 1,1
= 2,82
1 1 0,39
+
15 15
Cuando se desconocen las varianzas de las poblaciones, pero se supone que son
iguales, éstas se pueden hallar de la siguiente forma:
s 2p =
(n1 − 1)s12 + (n2 − 1)s 22
n1 + n 2 − 2
Una vez halladas las varianzas, se puede proceder como en el caso anterior,
utilizando el valor hallado para reemplazar en la ecuación de la distribución Z.
Z=
(x1 − x2 ) − (µ1 − µ 2 )
σ 12 σ 22
+
n1 n2
Ho: µi = µj.
Muestras apareadas.
• Puede contener igual o diferente número de datos entre las dos muestras.
• Siempre se refiere a la aplicación de tratamientos o medidas en dos grupos
diferentes.
Sucede con frecuencia que no hay diferencias reales entre las poblaciones en lo
que respecta a la variable de interés, pero la presencia de fuentes extrañas de
variación provocan el rechazo de la hipótesis nula de no diferencia. Por otra parte,
las diferencias reales pueden también ser enmascaradas por la presencia de
factores extraños.
Ho: µi = µj
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
Ha: µi ≠ µj
Ha=µi ≠ µj
∑d
2
i −
n
n(n − 1)
2. Cálculos estadísticos.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
∑ yi = 1885
1= n
∑ yj = 1781
1= n
∑ d i = 104
1= n
∑d
1= n
i
2
= 2538
Ho=µi = µj.
d
tc = tα (n-1gl)
(∑ d i ) 2
∑d
2
i −
n
n(n − 1)
5,47
tc = t0.05(18)=2.10
104 2
2538 −
19
19(19 − 1)
5,47
tc =
10816
2538 −
19
19(19 − 1)
5,47
tc =
1968,73
342
5,47
tc =
5,756
5,47
tc =
2,39
tc = 2,27
6. Análisis y Conclusiones.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
El análisis de varianza fue ideado por Sir Ronald Fisher en 1925. Esta técnica
estadística ha resultado de gran aplicación en aquellas investigaciones que tienen
como propósito analizar los efectos de uno o más factores sobre el
comportamiento de una cierta característica. En sus inicios se aplico básicamente
en el campo de la experimentación biológica, y muy especialmente en la
agricultura; pero hoy en día es utilizada con éxito en diferentes ramas del trabajo
experimental. Puede considerarse además, que esta técnica ha contribuido al
desarrollo de algunos métodos estadísticos, entre ellos, en los llamados métodos
de regresión, y que una de sus más frecuentes aplicaciones se encuentra en el
propio diseño de experimentos.
• Aditividad.
¿Qué es un experimento?
Experimento, tiene dos acepciones, una general y una particular. La regla general
se refiere a "tomar una acción" y después observar las consecuencias. Se
requiere la manipulación intencional de una acción para analizar sus posibles
efectos y la aceptación particular (sentido científico). "Un estudio de investigación
en el que se manipulan deliberadamente una o más variables independientes
(supuestas efectos), dentro de una situación de control para el investigador".
Experimento aleatorio.
Esta clase de experimento, con tres características esenciales: repetición bajo las
mismas condiciones, desconocimiento del “resultado final” y conocimiento de
todos los posibles resultados antes de la ejecución del experimento, se conoce
como experimento aleatorio.
c. Reducir las fuentes de error, tanto del experimento como de aquellos errores o
equivocaciones operacionales. Es muy importante que en la selección de datos,
muestreo, etc., el personal responsable esté constituido por técnicos o personas
con entrenamiento.
1- Establecer el problema.
4- Examinar los posibles resultados y revisar las razones del problema, para
asegurarse de que el experimento le provee de la información adecuada a sus
interrogantes.
6- Realizar el experimento.
La unidad experimental puede ser un animal (vaca, novilla, pollo, árbol, muestra
de agua, muestra de suelo, etc.) o grupo de las anteriores especies, una parcela,
plantas de maíz, fríjol, naranja, etc. Al seleccionar un conjunto de tratamientos es
importante definirlos clara y precisamente con cada uno de ellos y considerarlos
uno con respecto a los demás y así dar una respuesta eficiente a los objetivos de
experimentación.
Error experimental
Replicación y su función
1. Diseño experimental.
El control del error por medio del diseño consiste en planear de tal forma que la
variación natural en las unidades experimentales no contribuyan a falsear la
diferencia debido a tratamientos cuando, por ejemplo, las unidades experimentales
se agrupan en bloques (un bloque que posea todos los tratamientos), de tal forma
que la variación entre las unidades del bloque sea menor que entre bloques, la
precisión del error experimental incrementa. Tales bloques se denominan
replicaciones. El error experimental se basa el la variación de las variación de las
unidades dentro del bloque, puesto que la variación entre bloques puede ser
eliminada.
Ciertos diseños permiten dividir los bloques en sub-bloques los cuales poseen una
porción total de tratamientos. Tales diseños se denominan diseños de bloques
incompletos donde la precisión de ciertas comparaciones se incrementa a
expensas de otras
Selección de tratamientos
Una técnica cuidadosa en la conducción física del ensayo es básica para las
conclusiones y recomendaciones finales del mismo. Es la responsabilidad del
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
Aleatorización
Hay que tener en cuenta que cada tratamiento debe tener igual oportunidad de ser
asignado a cualquier unidad experimental, sea ella favorable o no. Cochran y Cox
señalan: “la aleatorización es análoga a un seguro, en el sentido de que es una
precaución contra eventualidades que pueden o no ocurrir y que pueden ser o no
serias si ocurren”.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
Por otra parte, cabe anotar que la selección que haga el investigador dependerá
de la naturaleza de los tratamientos y de sus conocimientos. Así por ejemplo
suponga que a un grupo de plantas se les ha humedecido un tratamiento y que
estas produjeron más que el grupo control. Si dicho tratamiento hubiese sido una
invocación y una danza ritual a la diosa luna un investigador podría en algún
momento pensar en la invocación y danza ritual a la diosa luna como explicación
al mayor rendimiento.
a. Transformación logarítmica
El modelo lineal (por ejemplo Yij = µ + i + j + eij) indica que el efecto del bloque ,
el efecto del tratamiento y el error experimental, son todos ellos aditivos. Si los
bloques y los tratamientos aumentan o disminuyen las mediciones en un
determinado porcentaje en lugar de una determinada cantidad, entonces se dice
que los efectos son multiplicativos y no aditivos. En estos casos, una
transformación logarítmica transformará en aditiva la relación multiplicativa y en
consecuencia el modelo lineal podrá ser aplicado a los nuevos datos.
Cuando los datos están dados por números enteros procedentes del conteo de
objetos, como por ejemplo el número de manchas en una hoja o el número de
bacterias en una placa, los números observados tienden a presentar una
distribución de Poisson más que una distribución normal. Las consideraciones
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
Este diseño se llama completamente al azar por que todas las corridas
experimentales se realizan en orden aleatorio completo, ya que al no haber
bloques (generados por otro factor adicional al factor de interés), no existe ninguna
restricción a la aleatorización. Más específicamente, si durante el estudio se
hacen en total N pruebas estas se corren al azar, de manera que los posibles
efectos ambientales y temporales se vayan repartiendo equitativamente entre los
tratamientos.
Este tipo de diseño es el más simple de todos y también se le conoce con los
nombres de diseño completamente randonizado o diseño completamente aleatorio
o diseño de una sola vía. En él se asignan al azar los tratamientos a un grupo de
unidades experimentales previamente determinadas. Asimismo todas las
variables, excepto las que están en estudio, se mantienen constantes. Sin
embargo R. A. Fisher señala que claramente que este tipo de diseño es
inadecuado para muchos problemas de investigación, en virtud de que las leyes
naturales de hecho son controladas e influenciadas por causas (variable)
Ventajas
Desventajas
Modelo estadístico
Para este tipo de diseño (con igual o diferente número de repeticiones) se plantea
estadísticamente el siguiente modelo matemático:
i =1,2,..,r repeticiones y
j = 1,2, Vt tratamientos.
Análisis de varianza.
FV 1-α
GL SC CM FC 0,05 0,01
Tratamientos t-1 t
yi
2
y 2 ... SCttos CMttos
Entre, factor A
∑
i =1 r
−
tr
t −1 CMee
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
Total n- r k
y 2 ...
∑∑ Yij −
2
1 i =1 j =1 n
Es preciso recalcar que estos pasos se aplican una vez se hayan tomado los
datos para aplicar los cálculos, aceptar o rechazar hipótesis y presentar
resultados. A media que el investigador se vuelve experto en el manejo de datos,
planteamiento y desarrollo de diseños, se pueden obviar pasos de los que se
proponen a continuación:
1. Arreglo de campo.
2. Planteamiento de Hipótesis.
4. Regla de decisión.
5. Comparación.
6. Conclusión.
8. Cuadro de promedios.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
9. Gráficas.
del animal puede utilizarse como factor para formar bloques. Las camadas pueden
utilizarse también como bloques, caso en el cual un animal de cada camada recibe
un tratamiento. En experimentos en los que intervienen seres humanos, si se
desean eliminar las diferencias que resultan de la edad, pueden agruparse
entonces los individuos de acuerdo con su edad, de modo que una persona de
cada edad reciba cada tratamiento. El diseño en bloques completos aleatorizados
puede utilizarse también convenientemente cuando un experimento debe llevarse
a cabo en más de un laboratorio (bloque), fincas, zonas, o cuando se requieren
varios días (bloques) para concluirlo.
Ventajas
Desventajas
Modelo estadístico.
i =1,2,..,n repeticiones
j = 1,2Vk tratamientos.
Como hipótesis alterna, se tendría que por lo menos el promedio obtenido por un
tratamiento es diferente a los demás o de otra forma se podría afirmar que por lo
menos el promedio de un tratamiento e diferente al promedio de toda la población.
Como el diseño implica el análisis de un factor más que influye sobre los
resultados de la experimentación, es necesario plantear hipótesis para este factor.
Por lo tanto las hipótesis para los bloques, siendo similares las de tratamientos
serían:
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
Análisis de varianza.
1-α
FV GL SC CM FC 0,05 0,01
Tratamientos, t-1 t
yi
2
y 2 ... SCttos CMttos
factor A ∑
i =1 b
−
tb
t −1 CMEE
n-1 r k
y 2 ...
∑∑Yij −
2
i =1 j =1 n
Total
Notación y definiciones
Arreglos Factoriales
Donde:
x = la observación faltante.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
b = número de bloques.
t = número de tratamientos.
Cuando son dos las observaciones que faltan, estas pueden ser del mismo
tratamiento, del mismo bloque o de diferente bloque y diferente tratamiento.
En este caso se debe definir si los dos datos corresponden a un solo tratamiento,
a un solo bloque o a un tratamiento y un bloque diferentes. Los datos faltantes se
catalogan como x1 y x2; para lo cual:
Donde:
Donde:
Donde:
Este método se puede efectuar aplicando varias pruebas realizadas por algunos
estadísticos. Se debe buscar la más adecuada para cada uno de los casos. Las
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
a (a − 1)
n°compraciones =
2
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
w = T αs x
CMEE
sx =
r
5. Representación de resultados.
Promedios X1 X2 X3 X4
X4 0
X3 0
X2 0
X1 0
b. Con líneas.
c. Con letras.
Medias Xn Xn Xn Xn Xn
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
% relativo % % % % %
El último valor o menor, se toma como 100% y luego se saca por regla de tres el
valor en % para los demás.
EDAD
MESES TESTIGO UREA AMONIACO GALLINAZA
8....12 605 720 740 740
12....16 630 750 760 780
16.....20 650 790 800 815
20....24 670 800 805 832
24......26 615 750 790 790
Estadísticos para la ganancia de peso (g/día/animal) de terneros Suplementados
con NNP de acuerdo a la edad.
Grado
s de Suma de Promedio de
Origen de las liberta cuadrado los Probabilida Valor crítico
variaciones d s cuadrados F d para F
39,104502 3,2591600
Edad 4 14069,8 3517,45 5 8,598E-07 5
Tratamiento 26454,533
s 3 79363,6 3 294,10265 1,708E-11 3,4902996
Error 12 1079,4 89,95
Total 19 94512,8
a (a − 1)
n°compraciones =
2
4(4 − 1)
n°compraciones = =6
2
2. Gallinaza-urea 5.Amoniaco-testigo
3. Gallinaza-testigo
w = T αs x
CMEE
sx =
r
89,95
sx =
5
w = (3,80)(4,24)
w = 16,11
5. Representación de resultados.
c. Con letras.
a b c d
900
791,4 a 779 a
800 762 b
700 634 c
600
500
400
300
200
100
0
GALLINAZA AMONIACO UREA TESTIGO
CME
Sx =
r
2. Con los grados de libertad del error se consultan las tablas de Amplitudes
Estudiantizadas Significativas de Duncan ó A.E.S. escogiendo el nivel de
significancia deseado (α = 0,05 ó 0,01) y se buscan los valores de hilera
correspondiente hasta un "p" (grado de separación entre los promedios que se
comparan) igual al número de tratamientos.
P2: tDuncan, P3: tDuncan, P4: tDuncan, V Pn: tDuncan,
Estos valores son multiplicados por el error estándar de los promedios S x con el
fin de obtener los valores de amplitudes límites de significación de Duncan ó
A.L.S.; tal como se presenta en la siguiente tabla.
Valores de P. 2 3 4
A.E.S. tDuncan tDuncan tDuncan
A.L.S. = A.E.S x S x Duncan Duncan Duncan
y así sucesivamente.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
Para indicar todas las comparaciones entre los promedios se puede utilizar una
notación resumida a base de líneas o letras, así:
Tratamientos
A B C D V
_________________________
A B C D
x. prom 1. Prom 2. prom 3. prom
4.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
a a A b
El uso de letras para resumir las comparaciones tiene la ventaja de que los
tratamientos pueden presentarse en el orden que interese al investigador, en
cambio para "la notación con líneas se requiere ordenar los promedios por
magnitud.
C. cuadro de diferencias de medias.
Promedios X1 X2 X3 X4
X4 0
X3 0
X2 0
X1 0
Comparación de medias en forma decreciente.
Medias Xn Xn Xn Xn Xn
% relativo % % % % %
TRATAMIENTOS
A B C D E F G
75,18 63,75 60,18 64,18 92,1 67,68 80,0
Los valores de A.L.S. obtenidos en la prueba de Duncan con α= 0.05
fueron:
P 2 3 4 5 6 7
C B D F A G E
______________________
_________
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
_________
C B D F A G E
A a a ab bc c d
TIPOS DE REGRESIÓN:
Graficas:
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
Característica:
Sólo se maneja una variable independiente, por lo que sólo cuenta con dos
parámetros.
Ecuación: y = a + bx
Donde:
y = valor esperado
Grafica:
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
El análisis de varianza nos permite conocer las diferencias, si las hay, entre dos o
más tratamientos y así estaremos en capacidad de seleccionar la mejor
metodología bajo estudio. Si no hay diferencia entre los tratamientos la técnica
estatifica nos está indicando que es indiferente utilizar cualquiera de ellos.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
X X¥ = X- 4.0 Y Y¥ = Y- 80
Vemos que hay una relación bastante definida entre las dos variables. Como
observamos antes, de los datos de la tabla 6.1 podemos obtener diagrama de
dispersión, recta de mínimos cuadrados, coeficientes de regresión, e
determinación, y también realizar una análisis de varianza a la regresión.
Las fuentes de variación que afectan una variable no siempre son controlables
mediante un plan experimental. Cuando el plan no puede efectuar el control, es
posible medir algunas características de la fuente de variación. Por ejemplo, la
cantidad de alimento consumido por las gallinas es una variable de importancia
económica. Sería de esperar que se viera afectada por otras variables
medibles, tales como el peso del cuerpo y el número y peso de los huevos
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente
Contenido didáctico del curso BIOMETRIA Y DISEÑO DE EXPERIMENTOS
puestos. Para los datos de la tabla anterior, el peso del cuerpo fácilmente
explica la mayor variabilidad en el alimento consumido. La importancia
económica es obvia.
Ahora usamos la tabla anterior para ilustrar el control estadístico de una fuente de
variabilidad mediante el uso de una observación concomitante. La
desviación estándar de Y antes de la variación en X es √Σ(Y-Y)2 /(n-1)
=√135.604/9 =3.88 lbs. Hemos visto que luego de ajustarla es Sy.x = 2.37 lbs.
Para nuestro ejemplo, tiene un grado de libertad. También podemos observar que
la proporción de la suma de cuadrados de Y atribuible a la variación en Y es
FUENTES BIBLIOGRAFICAS
http://www.project2061.org/esp/publications/sfaa/online/chap1.htm. Accesado
Junio 2005.
Box, G.E.P., Hunter, W.G.S., y Hunter, J.S. 1993. Estadística para investigadores:
Introducción al diseño de experimentos, análisis de datos y construcción de
modelos. Edit. Reverte, España. 422 p.
Chou, Ya-Lun. An•lisis estadÌstico. Edit. Mc Graw Hill, MÈxico. 1992. 808 p.