You are on page 1of 40

46 Pruebas psicolgicas.

Una introduccin prctica

sen al lector, tomar nota de la longitud y el


estilo de las revisiones.
c. Suponiendo que se encontr con una de las
listas completas (TIP V, Test Critiques, etc.),
anotar la informacin que contienen varias
entradas. Luego, seleccionar un tema como
autoconcepto o razonamiento crtico y utili
zar el ndice temtico para buscar pruebas
sobre ese tema.
3. Suponiendo que se tiene acceso a la base de
datos, en CD o en Internet, del Mental Measu
rements Yearbook de SilverPlatter:

a. Buscar el ttulo de una determinada prueba y


acceder al texto completo de una de las revi
siones.
b. Realizar una bsqueda basada en palabras cla
ve -por ejemplo, self-concept (autoconcepto),
attention deficit disorder (trastorno por dfi
cit de atencin) o mathematics achievement
(desempeo en matemticas). Luego, exami
nar los registros obtenidos (al desarrollar este
ejercicio, activar Display Options para que no
se recupere el Full Text (Texto completo de
las revisiones.)

4. Para asegurarse de que ya sabe cmo utili


zar ciertas fuentes, buscar las entradas si
guientes:

(Captulo 2)

c. Una de las publicaciones expuestas en las p


ginas 41 y 42.
6. Con ayuda de las direcciones electrnicas de
las editoriales que aparecen en el Apndice C,
trate de acceder al catlogo de una de las edito
riales. Se presenta todo el catlogo? De ser as,
qu informacin proporciona?
7. Si dispone del catlogo impreso de una de las
editoriales, examine las entradas. Qu tan pa
recidas son a la entrada que aparece en la figura
2-5?
8. Determinar si la biblioteca local cuenta con
alguna de las colecciones para fines especia
les que se plantean en las pginas 39 y 40.
Anotar los nmeros de acceso pues se usarn
ms adelante.
9. Elija alguna de las tres publicaciones peridi
cas que aparecen en las pginas 41 y 42 y deter
mine si la biblioteca local est suscrita a ellas.
Explore los nmeros recientes de las publica
ciones para averiguar qu temas y pruebas se
tratan. Se recomienda tomar en cuenta que al
gunos de los artculos sern muy tcnicos y qui
z no los comprenda hasta haber estudiado los
captulos 3 a 6.
10. Pregunte a un psiclogo clnico, un asesor psico
lgico, un psiclogo escolar o algn otro profe
sional de una disciplina afn qu pruebas utiliza
normalmente; pida su opinin sobre los instru
mentos y averige por qu utiliza esa y no otra.

a. Stanford Achievement Test (Prueba de Apro


vechamiento Stanford) en TIP V.

b. W oodcock-Johnson PsychoEducational
Battery (Batera Psicoeducativa WoodcockJohnson) en Tests.
c. La Dysfunctional Attitude Survey (Encuesta
de Actitudes Disfuncionales) en el Directory
o f U n p u b lished E xperim ental M ental
Measures, Volume 7.
Para cada uno de estos tres ejercicios, anotar el
tipo de informacin que dan las fuentes.
5. Para cada una de las fuentes de informacin si
guientes, revisar uno de los libros o publicacio
nes no los lea de modo detallado y har
anotaciones sobre el tipo de informacin que
ofrece la fuente.

a. Una de las colecciones para fines especiales


abordada en las pginas 39 y 40.

b. Uno de los libros sobre una sola prueba trata


dos en las pginas 40 y 41.

Nota: Los dos siguientes ejercicios son proyectos muy


sustanciales, tal vez convengan como proyectos de
final de curso. A diferencia de los ejercicios anterio
res, no constituyen algo que pueda completarse en
unos cuantos minutos.

11. Utilizando el formato propuesto en el Apndice


A: Revisin y seleccin de pruebas, hacer la re
visin formal de una prueba; para este ejercicio,
se requiere tener la prueba fsicamente. Tambin
convendra contar con la entrada del catlogo de
la editorial de la prueba.
12. Utilizando el formato propuesto en el Apndice
A para la seleccin de pruebas, elija una prueba
a manera de ejercicio. Entre los ejemplos de reas
en las que podra hacerse este ejercicio se en
cuentran: pruebas de diagnstico de lectura para
estudiantes de enseanza elemental, pruebas de
pensamiento creativo para estudiantes universi
tarios, exmenes de admisin a la universidad,
pruebas de depresin, ansiedad o trastornos de
la conducta alimentaria.

ix u b o i

p & iQ O gtC O S

T ho i^q j P. -fj-c-Qd>0
fF

'J3 F
Q

Captulo O
Normas de las pruebas

Objetivos
1 . D efinir la finalidad de las norm as de las pruebas.
2. Actualizar los conocim ientos del lector sobre estadstica descriptiva: tipos de escalas, distribuciones de
frecuencia, trm inos para d e scrib ir las formas de las distribuciones, m ediciones de tendencia central,
m ediciones de variabilidad y puntuaciones 1.
3 . Identificar los diversos tipos de puntuaciones naturales de las pruebas.
4 . Reconocer el significado de theta.

ao
o
o
tjo
S
C
i
Uj
/a
o

5. D efinir cada uno de estos tipos de norm as: percentiles y rangos percentilares, puntuaciones estndar,
norm as de desarrollo.
6. Resumir las fortalezas y debilidades de cada tipo de norm a.
7. Precisar las caractersticas de cada tipo de grupos de norm as: nacional, conveniente, de usuarios, subgrupo,
local e institucional.
8. D iferenciar entre las interpretaciones referidas al criterio y a la norm a.
9 . Explicar cm o se determ ina la utilidad de un grupo norm ativo.
47

48 Pruebas psicolgicas. Una introduccin prctica

FINALIDAD DE LAS NORMAS

Matt realiz correctamente 36 reactivos en la prueba


de vocabulario, eso es bueno o malo? Meg respon
di s a 14 de los 30 reactivos en un indicador de
ansiedad en la prueba, significa eso que es inusual
mente ansiosa o tranquila al someterse a una evalua
cin? Dan respondi correctamente a 52 de los 80
reactivos en una prueba de lectura y a 24 de 40 en una
prueba de ciencias, es relativamente mejoren lectu
ra o en ciencias? Esta clase de preguntas se abordan
bajo el tema de normas de las pruebas. La idea fun
damental consiste en traducir lo que se denomina pun
tuacin natural en algn tipo de puntuacin nor
malizada. La puntuacin natural es el resultado ms
o menos inmediato de las respuestas de un individuo
a una prueba. En el sistema de puntuacin normali
zada, la puntuacin natural del individuo se compara

con las puntuaciones de los individuos que forman


parte del grupo normativo; estas puntuaciones se
conocen tambin como derivadas o escalares. Este ca
ptulo aborda dos preguntas cmciales sobre las normas
de las pruebas, a saber: cules son los tipos de nor
mas que suelen ser utilizadas?, y qu son los grupos
normativos, es decir, de dnde provienen las normas?
A las p untuaciones n atu ra le s las determ inan, e n p ar
te, ca racte rsticas co m o la lo ng itu d de la prueba, la
eleccin del lm ite d e tie m p o, la s dificultades de los
reactivos y las circu n sta n cia s en las que se aplica el
In stru m e n to . E sto d ific u lta la in te rp re ta ci n de las
puntuaciones n aturales en ausen cia de m s inform a
cin. La in te rp re ta ci n y el an lisis estadstico puede
facilitarse al c o n ve rtir la s p un tua cio n es naturales en
un co n jun to co m p letam e n te d istin to de valores llam a
d o s p u n t u a c io n e s d e r iv a d a s o p u n tu a c io n e s
e s c a la re s . E stndares...
(AE R A /A PA /N C M E , 1999, p .4 9 )1

Las nociones fundamentales sobre las normas no son


exclusivas del campo de las pruebas psicolgicas, las

1 En el captulo 1, se describe la importante funcin que


desempean los Standards for Educational and Psycho
logical Testing (Estndares para las Pruebas Educativas y
Psicolgicas), publicados en forma conjunta por la
American Educational Research Association, la American
Psychological Association y el National Council on Measu
rement n Education (AERA, APA, NCME, 1999). Los
captulos 3 a 6 contienen extractos breves de este docu
mento, abreviado, ya que suele figurar en la bibliografa,
sencillamente como Estndares para ayudar a ilustrar
los aspectos planteados en el texto.

(Captulo 3)

nociones de puntuacin natural y posicin relativa


dentro de un grupo se utilizan en diversas circunstan
cias cotidianas. Considere estos ejemplos, Resulta
alto la estatura de 1.94 metros?, no para un rbol, pero
s para un humano e incluso entre los humanos, no es
muy impresionante en el caso de un jugador de la
National Basketbal! Association, aunque s impresio
nante para un estudiante de sexto grado. Qu pasa
con un pulso de 100?, no sorprende en un beb recin
nacido o en un adulto que acaba de realizar un ejerci
cio vigoroso, pero sera un signo de peligro para un
adulto en estado de reposo. Qu opina usted de co
rrer los 100 metros planos en 24.01 segundos?, para
un equipo de atletismo de bachillerato o universitario
es un tiempo malsimo, pero Erwin Jaskulski hizo ese
tiempo en mayo de 1999 y estableci una marca mun
dial en la categora de mayores de 95 aos de edad
(.Runner's World, 1999). Estos ejemplos ilustran la
tendencia de los seres humanos a valerse de las com
paraciones dentro de un grupo para diversos tipos de
interpretaciones en la vida cotidiana. En psicometra,
estas comparaciones se vuelven operativas, a manera
de normas.
Algunos ejemplos adicionales de puntuaciones
naturales ofrecen un adecuado contexto para el anli
sis de las normas que se har ms adelante en el cap
tulo.
Matt resolvi de manera correcta 36 reactivos en la
prueba de memoria de corto plazo. Qu tan buena
es su memoria?
Meg respondi s a 14 preguntas en el indicador
de ansiedad en la prueba. Se le facilita someterse a
exmenes o es un caso perdido?
Dan realiz correctamente 32 reactivos en la prue
ba de lectura y 24 en la de matemticas. Es relati
vamente mejor en lectura o en matemticas?
Sheri mide 1.57 metros. Es especialmente alta, baja
o como el promedio?
El pulso de Tom es de 71 latidos por minuto. Es
normal?
La pequea Abigail obtuvo una calificacin de 7 en
la escala de 10 puntos sobre afabilidad. Es un en
canto o una fiera?

REVISIN DE ESTADSTICA:
PRIMERA PARTE

Las normas de las pruebas se basan en nociones ele


mentales de la estadstica descriptiva. Se da por hecho
que el lector realiz ya un curso de introduccin a la

Normas de las pruebas 49

estadstica, aunque se supone que tal vez necesite ha


cer un repaso de los temas cubiertos en ese curso. Tal
es el objetivo de esta seccin, no pretende repetir todo
un curso de estadstica o ensearle cmo calcular estas o
dsticas, sino revisar brevemente algunos temas y plan
tear las ideas clave de la estadstica univariada. El
captulo 4 incluye un repaso de la estadstica bivariada,
es decir, la correlacin y la regresin.

En los ejemplos de esta seccin se emplean algu


nos conjuntos pequeos de datos para lustrar diversas
estadsticas. En la prctica, por lo general se cuenta con
conjuntos de datos mucho ms grandes, a menudo mi
les de casos; para aplicar la estadstica a estos grandes
conjuntos de datos se utiliza paquetera computacional.
Entre los paquetes ms empleados se encuentran el
SPSS, el SAS, Minitab y SYSTAT; el programa Excel
de Microsoft, orientado ms hacia otras aplicaciones,
tambin elabora estadsticas. En el Apndice D apare
cen varios conjuntos de datos que el lector puede utili
zar para calcular cualquiera de las estadsticas revisadas
en esta seccin. Entender el material de este captulo
no exige estar familiarizado con ninguno de esos pa
quetes estadsticos; sin embargo, a algunos lectores tal
vez les resulte til aplicar alguno de estos paquetes a
los conjuntos de datos del Apndice D.

INTNTELO!.......................................................
Si no est familiarizado con algunos de los programas esta
dsticos presentados en el prrafo anterior, averige cul de
ellos est disponible. Los ejercicios al final de los dos si
guientes captulos le permitirn aplicar el paquete.

la evidencia objetiva de dificultades significativas para


realizar actividades de la vida cotidiana.
En un segundo nivel, la variable es medida; se
trate de su definicin operacional. La psicometra
aborda estas mediciones, estudia sus caractersticas y
cataloga las mediciones existentes. En el tercer nivel,
se obtienen datos naturales, es decir, los nmeros
que resultan de la aplicacin de las mediciones.
Las estadsticas operan sobre datos naturales, el
nivel ms especfico de una variable. Dado que los
datos naturales provienen de las mediciones que los
investigadores obtienen, la estadstica ofrece los re
smenes y tratamientos de las mediciones (pruebas)
de mayor inters para los profesionistas. Por supues
to. desde el principio hay mayor motivacin al nivel
de constructo de la variable.
Las dos principales divisiones de la estadstica son
la descriptiva y la inferencial. En la mayor parte de los
estudios se obtienen muchos datos naturales; por ejem
plo, es posible contar con varias puntuaciones de prue
bas de cientos de individuos. La estadstica descrip
tiva ayuda a resumir o describir estos datos naturales
para que los datos se entiendan mejor. Con mucha fre
cuencia, stos provienen de una muestra de individuos
y al especialista le interesa principalmente conocer la
poblacin de la cual se extrajo esta muestra. La esta
dstica inferencial ayuda a sacar conclusiones
inferencias sobre lo que tiene probabilidades de ser
verdadero en una poblacin, sobre la base de lo que se
descubri acerca de la muestra.

TIPOS DE ESCALAS
Las variables se miden en escalas, Stevcns (1951) las
clasific en cuatro clases, a las que se alude mucho en
estadstica y psicometra. Las distinciones entre estos

E d it o ria l E l m a n u a l m o d e r n o F o to c o p ia r s in a i

VARIABLES
Cmo se relaciona el campo de la estadstica con el de
las pruebas psicolgicas? Para responder a esta pre
gunta, es imprescindible entender los matices del tr
mino variable. Una ciencia se constituye en torno a las
variables que estudia; algunos ejemplos de stas en
psicologa son inteligencia, extraversin, desadaptacin
y agudeza visual. Los objetos de estudio (humanos,
ratas, etc.) varan a lo largo de cada una de estas cate
goras de arriba hacia abajo, de ms a menos o algn
conjunto similar de calificativos. Las variables pueden
describirse en tres niveles de generalidad. En el nivel
ms general, una variable es un constructo, aqu, se
hacen descripciones verbales y definiciones de ella. Por
ejemplo, es posible definir inteligencia como la capa
cidad para manipular smbolos abstractos; desadap
tacin puede describirse ya sea como el sentimiento o

Resumen de puntos clave 3-1


Tres niveles para definir una variable
C onstru cto

D efinicin general de la variable

i
M edicin

D efinicin operacional, a m enudo


una prueba

I
Datos
naturales

N m eros que resultan de


la m edicin

(Captulo 3)

50 Pruebas psicolgicas. Una introduccin prctica

tipos de escalas son importantes porque permiten rea


lizar ciertas operaciones aritmticas y estadsticas con
algunas escalas, pero no con otras.
Las escalas se tipifican en orden de complejidad
creciente. En el nivel menos complejo o ms primitivo
se encuentra la escala nominal, que distingue los obje
tos codificando a cada uno con un nmero; los nme
ros no significan ms o menos, ms grande o ms
pequeo o alguna otra distincin cuantitativa. Ejem
plos de esto son los numerales en las camisetas de ba
loncesto, los nmeros del Seguro Social o los cdigos
0 y 1 que se asignan a varones y mujeres, respectiva
mente, para fines de codificacin de cmputo.
En una escala ordinal, a los objetos se les asig
nan numerales que indican un ordenamiento, como
sera ms o menos de un rasgo, sin especificar nada
sobre las distancias entre los objetos en la escala. Es
tos ordenamientos de rango ilustran un escalamiento
ordinal, por ejemplo, las reservas del ftbol america
no colegial ofrecen una clasificacin de los equipos:
1, 2, 3, 4 ... 25. Como se entiende, estos nmeros es
tn en una escala ordinal, no puede inferirse que el
equipo 2 sea mucho mejor que el 3, pues el equipo 1
es mejor que el 2. De hecho, los equipos 1 y 2 tal vez
slo sean ligeramente distintos, mientras que el equi
po 3 puede ser muy inferior al equipo 2.
La escala de intervalo ubica los objetos en or
den y lo hace a intervalos iguales. Por tanto, en una
escala de intervalo, la distancia entre 2 y 4 es la mis
ma que la distancia entre 6 y 8 o entre 2Q y 22. No
obstante, la escala de intervalo carece de un punto cero
verdadero, por lo comn cuenta con un punto cero,
pero ste no indica la ausencia completa de la varia
ble medida. El ejemplo clsico de una escala de inter
valo es el termmetro Fahrenheit, donde cero no indica
la ausencia completa de calor. La suma y la resta son
operaciones legtimas en una escala de intervalo, as,
la diferencia entre 30 y 40 significa lo mismo que la

diferencia entre 50 y 60. No obstante, no son legti


mas la multiplicacin y la divisin: 60F no represen
ta el doble de calor que 30F o la mitad que 120F.
Para hacer tales afirmaciones, se necesitara utilizar
la escala Kelvin, que cuenta con un punto cero verda
dero, punto en el que no hay calor en absoluto.
La escala de razn, la ms compleja, ubica los
objetos en orden y lo hace a intervalos iguales; adems
posee un punto cero verdadero. Casi todas las medi
ciones fsicas cotidianas que se realizan, como las de
longitud y peso, son sobre escalas de razn. En con
traste, la mayor parte de las mediciones psicolgicas
hechas son sobre escalas ordinales o de intervalo.
Cul es la importancia de estas distinciones al
parecer crpticas para quien se interesa en las medi
ciones psicolgicas? Considrese el caso de la escala
de Cl, que es tan familiar; no se trata de una escala de
razn carece de un punto cero verdadero , por
tanto, no es legtimo decir que una persona con un CI
de 150 es el doble de inteligente que alguien que tie
ne un CI de 75; adems, si la escala de CI es slo
ordinal, no se puede afirmar que la diferencia entre
los CI 80 y 100 signifique lo mismo que la diferencia
entre los CI 120 y 140. Es necesario que los profe
sionistas se interesen en la naturaleza de sus escalas
para hacer afirmaciones fundadas sobre sus propias
mediciones o, en todo caso, para no decir cosas ab
surdas sobre ellas. El mtodo de clasificacin de es
calas de Stevens (1951), aunque muy citado, no es la
nica forma de pensar en las escalas, pero es un re
curso muy til para considerarlas.

ORGANIZACIN DE DATOS NATURALES


Al enfrentar una masa de datos naturales, normalmente
se quiere organizarlos; la manera ms comn de ha
cerlo es con una distribucin de frecuencia, la cual

Resumen de puntos clave 3 -2

Resumen de tipos de escalas


E sca la
Nom inal
O rdinal

P ro p ie d a d e s
C la sifica, asig na num erales
+ U bica en orden de m a gn itu d

D e in tervalo
D e razn

i
f

" 1" " 1" " 1'

+ P unto ce ro ve rda d e ro

Normas de las pruebas 51

o
ai
c
s

ordena los datos por grupos de puntuaciones adya


centes. La figura 3-1 presenta un conjunto de datos
naturales y una distribucin de frecuencia de stos; si
bien es difcil dar sentido a una serie de este tipo de
datos, la distribucin de frecuencia revela con facili
dad caractersticas como el rango de las puntuaciones
y el rea en la que stas se concentran. La distribu
cin de frecuencia de la figura 3-1 muestra los inter
valos de las puntuaciones en los que stas se
encuentran categorizados, la frecuencia o el conteo
de las puntuaciones que caen en cada intervalo y la
frecuencia acumulativa (f acum), es decir, la frecuen
cia que hay en y por debajo de cada intervalo.
Una distribucin de frecuencia suele convertirse
en forma grfica. Las dos modalidades ms comunes
para esta conversin son el histograma de frecuen
cia y el polgono de frecuencia. La figura 3-2 pre
senta estas grficas para la distribucin de frecuencia
de la figura 3-1.

La mediana es la puntuacin intermedia cuando las


puntuaciones estn distribuidas en orden de inferior a
superior, divide la distribucin de las puntuaciones
por la mitad. La moda es la puntuacin que ocurre
con mayor frecuencia. La figura 3-3 expone ejem
plos de las tres medidas de tendencia central en un
pequeo conjunto de datos.

TENDENCIA CENTRAL

i INTNTELO!...........................................................

Aunque la distribucin de frecuencia, el histograma y el


polgono de frecuencia son resmenes tiles de los da
tos naturales, conviene contar con un ndice que repre
sente mejor el conjunto completo de datos. Tal ndice se
conoce como medida de tendencia central el centro
en torno del cual los datos naturales tienden a agrupar
se. Son tres las medidas de tendencia central que se
emplean con mayor frecuencia: media, mediana y moda.

Se sugiere al lector determinar las tres medidas de tenden


cia central de este conjunto de puntuaciones.

102
120
73
114
129
91
71
102
96
105

110
92
128
134
108
121
101
79
114
77

130
118
115
117
99
103
93
99
106
100

P untuaciones
99
127
109
135
105
112
91
92
83
149
147
110
88
78
111
117
111
119
131
106

La media es el promedio aritmtico, se represen


ta ya sea con M o X (lase X-barra, o simplemente
media). Su frmula es:
M=

yy

Frmula 3-1

donde
X = puntuacin o dato natural
N = nmero de puntuaciones
X = signo de sumatoria, que indica sumar todo
esto (X)"

Puntuacin: 2

Media = ______

Mediana = _______

(W = 100)
107
116
138
98
103
90
105
98
101
108

113
103
100
96
95
122
145
115
123
113

76
150
158
125
95
94
90
112
109
143

100
91
103
155
82
124
94
116
132
102

89
126
86
88
133
65
87
80
100
88

D istrib u ci n de fre cu e ncia


1
0

3.
t
E
0

In te rva lo

F acum

150-159
140-149
130-139
120-129
110-119
100-109
90-99
80-89
70-79
60-69

3
4
7
10
18
23
19
9
6
1

100
97
93
86
76
58
35
16
7
1

Figura 3-1. Ejemplo de muestra de puntuaciones naturales y distribucin de frecuencia.

Moda = ______

52

(Captulo 3)

Pruebas psicolgicas. Una introduccin prctica

F ig u ra 3 -2 . H istogram a de frecuencia y polgono de fre cu e ncia

VARIABILIDAD
Una medida de tendencia central ofrece un resumen
de datos muy conveniente, pero priva de cualquier
sentido de variabilidad en los datos. Por ejemplo, dos
conjuntos de datos pueden tener la misma media, pero
en un conjunto todas las puntuaciones se encuentran
dentro de dos puntos de la media, en tanto que en el
otro conjunto las puntuaciones estn muy dispersas.
De modo que para describir mejor los datos natura
les, se ofrece un ndice de variabilidad.
El ndice de variabilidad ms sencillo es el ran
go, es decir, la distancia de la puntuacin ms baja a
la ms alta. Para indicar el rango, se identifican las
puntuaciones ms baja y ms elevada o la diferencia
entre stas. Para los datos naturales de la figura 3-1,
se puede decir que el rango es 65-158 o que el rango
es 93.
La desviacin estndar es el ndice de variabili
dad ms utilizado. Se denota en varios contextos me
diante cualquiera de estos smbolos: S, DE o a 2 Su
frmula es:
V s ( X - M)2
N

Frmula 3-2

en una muestra pero se entiende como estimacin de


la DE en una poblacin, la AT en la frmula se reem
plaza por Ai - 1.
La frmula ofrece pocos indicios sobre la forma
en que la DE mide la variabilidad, no obstante, tiene
consecuencias matemticamente acertadas para uso
ulterior, de modo que el especialista se acostumbra
sin ms a su presencia desgarbada. En secciones
posteriores se emplea constantemente la DE.
Un ndice de variabilidad bastante relacionado es
la varianza, que es simplemente la DE2. A la inversa,
la DE es la raz cuadrada de la varianza. En ciertos
trabajos avanzados de estadstica, sta se utiliza ms
que la DE. En las pruebas psicolgicas, se recurre a la
DE con mayor frecuencia, aunque no de manera ex
clusiva. La figura 3-4 presenta la DE, la varianza y el
rango de un pequeo conjunto de datos.

INTNTELO!...........................................................
El lector habr de calcular la DE estndar y el rango de este
conjunto de datos.
Puntuaciones:

Tambin suele escribirse como:


DE=_________

Rango = _________

donde x = X - M . Estas frmulas dan la definicin for


mal de la desviacin estndar. Cuando sta se calcula
Datos naturales: 2, 5, 3, 6, 6, 7, 6, 4, 8, 3, 4

2 El smbolo a que se lee como sigma, es la letra griega j


(minscula). En estadstica, se recurre a las letras del alfa
beto griego para designar medidas de toda una poblacin
y letras del alfabeto latino (p. ej S) para designar medi
das sobre muestras. Por tanto, S es la desviacin estndar
de una muestra, s es la desviacin estndar de la pobla
cin. La distincin no se observa con mucho rigor en la
bibliografa sobre psicometra.

Media: M= 1XJN = 54/11 = 4.91


Mediana: 5

Moda: 6

F ig u ra 3 -3 . M edid a s de ten d en cia central de un p equeo


conjunto d e datos.

Normas de las pruebas 53

Puntuaciones': 6

(X - M) = x

4 -1 0

x 2 = 1 16
D E = 2 .3 8

5 5

M=

SX/N = 30/6 = 5

0 -4

1 0 0

16

/ x 2/ N = / 34/6 = 2.38

Varianza = D E 2 = 5.66

Rango = 1 - 9

Figura 3 -4 . Medidas de variabilidad de un pequeo conjunto de datos.

Una cuarta medida de variabilidad es el rango


semiintercuartilar. Como su nombre lo indica, se
trata de la mitad de la distancia entre los cuartiles pri
mero y tercero, los cuales corresponden a los per
centiles 25 y 75, respectivamente. Si ya se dispone de
percentiles, como suele suceder con los datos de las
pruebas psicolgicas, el rango semiintercuartilar se
determina con facilidad, aunque pocas veces se utili
za en la prctica.

PUNTUACIONES z
Una puntuacin z o, sencillamente z, se define como:
z_ X- M

E d it o ria l E ! m a n u a l m o d e r n o F o to c o p ia r s in a i

DE

Frmula 3 -4

donde X es una puntuacin individual o datos puntua


les, M es la media y DE es la desviacin estndar. La
distribucin de las puntuaciones z tiene una media
= 0 y una DE = 1. Por tanto, al margen de cuales sean
los valores de las puntuaciones originales, cuando se
convierten en puntuaciones z, siempre son idnticas
su media y desviacin estndar.
Las puntuaciones z se usan para delinear la cur
va normal en trminos de reas bajo la curva. La figu
ra 3-5 ilustra el uso de las puntuaciones z para marcar
reas bajo la curva normal, se tendrn presentes las
tablas de reas bajo la curva normal de la estadstica

elemental. Dado que las puntuaciones z poseen una


media (0) y una >(]) comn sin importar los valo
res de las puntuaciones originales, desempean una
funcin crucial en el desarrollo de algunas de las nor
mas de las pruebas

FORMAS DE LAS DISTRIBUCIONES


Hay una referencia frecuente en la psicometra a la
forma de la distribucin de frecuencia de las puntua
ciones de las pruebas, es menester familiarizarse con
los trminos empleados para describir estas formas.
El parmetro o distribucin de referencia es la curva
normal o distribucin normal. Su nombre populares
curva de campana, aunque slo tiene la forma de
una campana en forma aproximada. La curva, gene
rada por una frmula bastante limitada,3 es una fun
cin de densidad, es decir, que el rea bajo la curva
est llena de datos puntuales. La distribucin en la
figura 3-5 es una curva normal, est dispuesta con
una media de 0 en su centro y un escala establecida
por unidades de estndar DE (llamadas en ocasiones
unidades o) en su base. Obsrvese con atencin la
posicin de las unidades de la DE.

3 Esta ecuacin genera la curva normal: Y = (NI (ojz))


(e-W - v-W )

Figura 3 -5. Ejemplos de puntuaciones z que marcan reas bajo la curva normal.

(Captulo 3)

54 * Pruebas psicolgicas. Una introduccin prctica

Esta distribucin es unimodal: cuenta con una


moda o monte. Es simtrica alrededor de su eje
central, una lnea imaginaria erigida en forma perpen
dicular a la base en la media. Alrededor de este eje
central, el lado izquierdo es el reflejo del lado dere
cho de la curva. Las colas (o extremos) de la curva
son asintticas con relacin a la base, es decir, conti
nan hasta el infinito, acercndose cada vez ms a la
base, pero sin alcanzarla nunca. Por supuesto, esto
slo se aplica en la curva normal terica; en la prcti
ca, los datos se detienen en algn punto finito. Ad
vierta el lector que casi todas las reas (cerca de 99.8%)
bajo la curva estn dentro de +/- 3 unidades a
Las distribuciones pueden desviarse de la nor
malidad, es decir, ser diferentes de la curva normal,
de varias maneras. La figura 3-6 representa estas des
viaciones de la normalidad. La primera es en trmi
nos de curtosis, el punto mximo de la distribucin.
Una distribucin leptocrtica est ms acentuada y
una distribucin platocrtica est ms plana que la
distribucin normal.
Otra forma de desviacin de la normalidad se da
en trminos del sesgo, el grado de simetra de los la

dos derecho e izquierdo de la curva. El sesgo negati


vo o hacia la izquierda tiene un extremo alargado ha
cia la izquierda y una acumulacin de puntuaciones
hacia la derecha. El sesgo positivo o hacia la derecha
cuenta con un extremo alargado hacia la^dgrecha^y
una acumulacin de puntuaciones hacia la izquierda.
Un ltimo tipo de desviacin de la normalidad es en
trminos de la modalidad de la distribucin. Si bien la
distribucin normal es unimodal, una distribucin
puede tener ms de una moda, por ejemplo, una dis
tribucin bimodal, como se aprecia en la parte infe
rior de la figura 3-6.
Por qu es importante la curva normal en la
psicometra? Muchos fenmenos que ocurren en for
ma natural tienden a distribuirse en forma normal. Por
ejemplo, para personas de un determinado sexo y edad,
las siguientes variables que se miden con facilidad
suelen distribuirse normalmente: estatura, rango de
memoria a corto plazo de dgitos, tiempo de reaccin,
fuerza de sujecin y muchas otras variables. Esta ten
dencia hacia la normalidad es tan frecuente que cuan
do la distribucin real de una variable se desconoce,
no es aventurado suponer que quiz sea normal. As

Figura 3 -6. Ejemplos de varias distribuciones.

Normas de las pruebas 55

que muchas pruebas se elaboran con la finalidad de


generar una distribucin de puntuaciones aproxima
damente normal. Sin embargo, en ocasiones de ma
nera intencional se disean pruebas que generan
distribuciones con sesgo positivo o negativo, como se
ver en el captulo 6. Tambin sucede que algunas
distribuciones que ocurren de manera natural no son
normales, como las distribuciones del ingreso, el peso
y la poblacin urbana.
Con este repaso de la estadstica basta por ahora
para profundizar en este captulo, se ampliar la revi
sin de la estadstica al principio del captulo 4.

PUNTUACIN NATURAL

En la figura 3-7 se aprecia una muestra de este tipo de


puntuacin natural en una prueba de 6 reactivos de ac
titudes hacia las matemticas; en este ejemplo, ios
reactivos con formulacin o connotacin negativa ha
cen necesario invertir los valores de la escala con la
finalidad de determinar la puntuacin natural.
Las mediciones antropomtricas y fisiolgicas
tambin pueden considerarse como puntuaciones na
turales. Sheri mide 1.57 metros de estatura; el pulso
de Dan es de 54 latidos por minuto; Amanda nada en
estilo mariposa 180 metros en 2:20...todas estas me
diciones son puntuaciones naturales. Ubicarlas en un
contexto normativo ayuda a interpretarlas. Las nor
mas son tiles para responder preguntas como stas:
Sheri es muy alta para su edad?, el pulso de Dan es
normal?, Amanda tiene un nivel de natacin para
competencia olmpica?
Por lo genera!, la ca lifica ci n e m p ie za con respues

Todas las normas de las pruebas son transformaciones


de puntuaciones naturales, por tanto, conviene tomarla
en consideracin antes de definir los tipos de normas
de las pruebas. La puntuacin natural es el resultado
ms inmediato de la calificacin de una prueba, se pre
senta en formas diferentes. La puntuacin natural pue
de ser la cantidad de respuestas correctas que se dan a
una prueba de aprovechamiento, o el total de pregun
tas a las que se responde en cierta direccin, por ejem
plo, sf o de acuerdo en un inventario de personalidad
o de intereses. Tambin puede ser la suma de las res
puestas numricamente codificadas en una serie de
reactivos de actitudes, por ejemplo, una escala de acti
tudes puede contar con 10 reactivos, cada uno de los
cuales exige una respuesta en una escala de 5 puntos,
que van de Completamente en desacuerdo (1) a Com
pletamente de acuerdo (5). La puntuacin natural es la
suma de las respuestas numricas a los 10 reactivos.

tas a reactivos a islad o s en las p ruebas, que a m enu


d o est n co d ific a d o s co n 0 o 1 p a ra re p re s e n ta r
respu e sta s in c o rre c ta /c o rre c ta o n e g a tiva /p o sitiva ,
pero a veces c on va lo re s n u m rico s para in dica r g ra
dos de respuesta m s fin o s. E ntonces, las p un tua
c io n e s del re a c tiv o se c o m b in a n , a m e n u d o p or
adicin, pero en ocasion e s se hace m ediante un p ro
cedim iento m s e laborado, p ara o b te n e r u n a puntua
cin natural. E stndares...
(A E R A /A P A /N C M E , 1999, p. 49)

Los procedimientos de algunas pruebas exigen una


puntuacin natural corregida o ajustada. El ms
popular de estos ajustes es la correccin por adivi
nacin que se aplica a ciertas pruebas de capacidad o de
aprovechamiento en las que se utiliza u n formato de
opcin mltiple. La teora plantea que en una prueba
de opcin mltiple es posible obtener algunas respuestas
correctas adivinando. De manera ms precisa, alguien

Respuesta
C o m pletam ente
en d esacuerdo

C o m pletam ente
de acu erd o

(P u n tu a ci n
del reactivo)

Reactivo

1. El lgebra es muy divertida.

l l

[X]

11

11

11

(2)

2. La geometra es para los pjaros.

II

11

11

[X]

(1)

3. Me gusta realizar clculos.

[XI

11

ii

0)

4. Las matemticas me son muy tiles.

[ ]

11

[XI

ii

(3)

5. Me gusta la estadstica.

11

[X]

i i

(2)

6. Las ecuaciones me causan escalofros.

11

11

11

[X]

I ]

(2)

Puntuacin natural = 11
F igura 3 -7 . Derivacin de la puntuacin natural para una escala de actitud hacia las matemticas.

(Captulo 3)

56 Pruebas psicolgicas. Una introduccin prctica

puede responder de manera correcta a \/K de las pre


guntas adivinando, donde K es la cantidad de opcio
nes en el reactivo de opcin mltiple. En un reactivo
de verdadero o falso, K es 2. En una prueba de 100
preguntas, compuesta por reactivos de opcin mlti
ple con cuatro opciones por cada uno, la puntuacin
esperada de adivinar todos los reactivos es de 25 co
rrectos. Por supuesto que un examinado pocas veces
adivinara en todos los reactivos, sin embargo, tal vez
l conozca la respuesta a 50, conteste stos correcta
mente, deje 10 reactivos en blanco y adivine en los 40
restantes. De estos ltimos 40, 10 sern correctos por
razones debidas al azar, lo que genera una puntuacin
de 50 + 10 = 60. Las respuestas a 30 reactivos son
incorrectas, sin incluir los 10 que quedaron en blan
co. En la correccin por adivinacin, se aplica la fr
mula siguiente:
PNC= PN0 -

I
K- 1

Frmula 3 -5

donde PNC= puntuacin natural corregida


PN0 = puntuacin natural original
I = cantidad de respuestas incorrectas
K = cantidad de opciones en los reactivos
de opcin mltiple
Nota: los reactivos omitidos no se cuentan
como incorrectos.
Vase algunos ejemplos adicionales que ilustran el
funcionamiento de la frmula:
En una prueba de 50 reactivos compuesta de
reactivos de opcin mltiple con cinco opciones,
Tom obtuvo 40 correctos y 10 incorrectos. Cul es
la puntuacin cuando se aplica la correccin por
adivinacin?
40 - [(10/(5 - 1 )] = 40 - 2.5 = 37.5
Suponga que Tom realiz con acierto 40 y omiti
los 10 reactivos restantes. Cul es su puntuacin
corregida?
40 - 0 = 40
En una prueba de 50 preguntas de verdadero-falso,
Jen realiz de manera correcta 25 reactivos y 25
incorrectamente. Cules su puntuacin corregida?
25 - [25/(2 - 1)] = 25 - 25 = 0
La correccin por adivinacin supone que una per
sona adivina en forma aleatoria entre las opciones dis
ponibles, desde luego, en ocasiones puede eliminar
algunas de las opciones incorrectas y luego adivinar

entre las opciones restantes. Las correcciones o ajus


tes tambin aplican a algunas puntuaciones en prue
bas de personalidad para adecuar ciertos conjuros
de respuestas. Para un anlisis s b re n te tema, vase
el captulo 12.

EL CASO ESPECIAL DE theta (0)


El lector recordar el anlisis de la teora de respuesta
al tem (TRI) que se plante en el primer captulo. Si
bien una prueba calificada en la forma convencional
genera una puntuacin natural que es la suma de las
respuestas a todos los reactivos en la prueba, una prue
ba calificada segn la TRI no es la simple suma de las
respuestas. La puntuacin TRI es una funcin de las

respuestas del examinado que interactan con


las caractersticas de los reactivos. La puntuacin
TRI suele denominarse theta (q), considrese dos
ejemplos de cmo puede darse q, en ambos es crucial
que los reactivos se seleccionen por unidimensionalidad y se escalen por dificultad en un programa de
investigacin previo. En el captulo 6, se consideran
ms a fondo las caractersticas TRI de los reactivos;
su calificacin real segn los procedimientos TRI es
compleja, ya que exige programas de cmputo com
plejos. No consiste tan solo en sumar respuestas co
rrectas, aunque en este momento, es posible dar una
idea aproximada del modo en que metodologa TRI
genera una puntuacin theta.
En primer lugar, se deben considerar los datos de
la figura 3-8, los reactivos estn dispuestos en orden
de dificultad de izquierda a derecha, aquellos con la
numeracin ms baja son muy sencillos y los que tie
nen la numeracin ms elevada son muy difciles. Por
ejemplo, si sta fuese una prueba de operaciones arit
mticas para estudiantes de enseanza elemental, el
reactivo 1 podra ser 6 + 3 = ______ , el reactivo 10
sera 740 - 698 = ______ y el reactivo 20 sera .56 x
1.05. Aqu se han clasificado simplemente los reactivos
como fciles, moderados o difciles. En una aplica
cin real, se utilizaran valores de dificultad exactos.
(Los reactivos de una prueba deben disponerse fsica
mente en orden de dificultad, pero para los ejemplos
que aqu se muestra conviene mostrar la disposicin
de esta manera.) Cada x en la figura representa una
respuesta correcta. A Mike se le presentaron los
reactivos 1 a 10 y respondi de manera correcta a 7; a
Ned se le dieron los reactivos 11 a 20 y contest con
acierto a 7. Dado que Ned respondi en forma conec
ta a los reactivos ms difciles, obtiene una puntua
cin theta ms elevada, pese al hecho de que ambos
examinados realizaron 7 reactivos correctamente.
Desde luego, este procedimiento no funcionara a
menos que los reactivos se escalaran, en primer lugar,
por grado de dificultad.

Normas de las pruebas 57

Reactivo

1 2 3

Dificultad del reactivo:


M ike

a 9

10 11

Fcil
x x

12

13

14

15

16

Moderada

x x

Ned

17

18

19 20

Difcil

x = respuesta correcta

F ig u ra 3 -8 . D erivacin de u n a p untuacin Iheta de d iferentes co n jun to s de reactivos.

INTNTELO!...........................................................

una adivinacin afortunada. Kristen respondi con


acierto a casi todos los reactivos, pero fall en uno
muy sencillo (el 2), tal vez por descuido. Muchos
procedimientos de calificacin TRI consideran el pa
trn de respuestas total para determinar la puntuacin
theta de la persona, pero existen numerosos procedi
mientos especficos para calificar las pruebas segn
los mtodos TRI; dichos procedimientos dependen del
modelo particular utilizado para ajustar los datos. Aqu
no se revisarn estos modelos, no obstante se exami
narn las caractersticas de los reactivos segn la TRI
en el captulo 6.
Theta posee ciertas propiedades de una puntua
cin natural y de una normalizada. Es como una pun
tuacin natural en cuanto a que es un resultado
relativamente inmediato de las respuestas del exami
nado. Adems, como puntuacin natural, tiene en s
poco sentido. Theta es como una puntuacin norma
lizada en cuanto a que no es una suma simple de las
respuestas del examinado, depende no slo de si la
respuesta es correcta (o s u otra respuesta as), sino
tambin de los valores TRI de los reactivos a los que
se dan las respuestas. Theta ubica al examinado en un
rasgo o capacidad que se supone que subyace al con
junto completo de reactivos en el banco de la prueba;
no obstante, los valores numricos de la dimensin
son arbitrarios y, por ende, no se interpretan con faci
lidad. Si bien los valores numricos theta son arbitra-

Hay una demostracin excelente en Internet de la interaccin


de las respuestas del examinado con las caractersticas de los
reactivos que emplean la metodologa TRI, la direccin es:
ERI-CAE.NET/scripts/cat. Se trata del mismo portal ERICAE
utilizado como fuente clave de informacin en el captulo 2.
Se sugiere al estudiante registrarse y responder la prueba;
luego observar como se ajusta la estimacin de capacidad
despus de cada respuesta. Aunque las puntuaciones se in
formarn como percentiles o alguna otra puntuacin norma
lizada, estas puntuaciones son transformaciones de theta, que
se actualizan luego de cada respuesta.

E d it o ria l E l m a n u a l m o d e r n o F otoco piar

AI menos algunas aplicaciones de la metodologa TRI


permiten examinar el patrn de respuestas, lo mis
mo que la cantidad de respuestas correctas; ese pa
trn puede generar ajustes en la cantidad de respuestas
correctas al determinar theta. Considrense los datos
de la figura 3-9, ah a ambos examinados se les pre
sentan los 20 reactivos. Una vez ms, se conocen los
1 datos de la dificultad de los reactivos y stos estn
1 dispuestos en orden de dificultad.
S
Jen, en general, no tiene un desempeo muy
| elevado;sin embargo, se observa que realiz de maJ era correcta un reactivo muy difcil (el 20), quiz

Reactivo

1 2

3 4

Dificultad del reactivo:


Jen
Kristen

7 8 9

10

Fcil
X

X X

11

12

13

14

15

Moderada
X
X X X

16

17

18

19 20

D ifcil
X

x = respuesta correcta

Figura 3 -9 . Los patrones de respuesta p ue d e n a yu da r a determ inar una pun tua ci n theta.

(Captulo 3)

58 Pruebas psicolgicas. Una introduccin prctica

ros, suelen establecerse con 0.0 como valor central


y un rango de cerca de -4.0 a +4.0. En consecuencia,
pueden verse como puntuaciones z, aunque no alu
den a una posicin dentro de un grupo normativo bien
definido.
Aunque estos valores theta pueden ser el resulta
do inmediato de las respuestas del examinado en un
entorno TRI, su interpretacin prctica con mucha fre
cuencia se logra mediante el uso de las puntuaciones
normalizadas presentadas en este captulo, es decir, se
convierten en percentiles, puntuaciones estndar, equi
valentes de grado, etc. De hecho, en un informe de pun
tuaciones de prueba, se podra considerar un percentil
o puntuacin T sin percatarse siquiera de que es una
transformacin de la puntuacin theta, en lugar de una
puntuacin natural convencional.

EL CASO ESPECIAL
DE LAS PUNTUACIONES IPSATIVAS
Las puntuaciones ipsativas (del latn ipse, que significa
yo) son autorreferenciadas, ocurren cuando una prue
ba genera ms de una puntuacin y los reactivos de la
prueba se califican de tal modo que una determinada
respuesta produce el incremento de una puntuacin y,
al mismo tiempo, la disminucin de otra puntuacin o,
al menos, impide que otra puntuacin aumente. De
modo que las puntuaciones ipsativas muestran la fuer
za relativa de las puntuaciones en lugar de su fuerza
absoluta. Un ejemplo aclarar la situacin.
A fin de medir los intereses de la gente en activi
dades verbales y cuantitativas, tome en cuenta los dos
mtodos siguientes para realizar esta tarea.
Formato A
En cada par de reactivos, marque el que ms le guste:
a. Sumar nmeros
o
b. B uscar pala
bras en un dic
cionario
a. Resolver ecuaciones o
b. Leer libros
Formato B
Marque si le gusta (G) o le disgusta (D) cada acti
vidad:
G
D
a) Sumar nmeros
D
b) Buscar palabras en un diccionario G
D
G
c) Resolver ecuaciones
G
D
d) Leer libros
En el formato B, al lector tal vez le gusten o disgusten
todos los reactivos o puede utilizar cualquier otra com
binacin de respuestas. Al asignar 1 punto por cada
respuesta Gusta, su puntuacin puede ser 2,1 o 0 en
Inters Verbal y 2, 1 o 0 en Inters Cuantitativo. No
obstante, en el formato A, conforme aumenta su pun

tuacin Verbal, disminuye (o no aumenta) su puntua


cin Cuantitativa. Los posibles patrones de puntuacin
son 2 Verbal y 0 Cuantitativo, 1 Verbal y 1 Cuantitati
vo, o 0 Verbal y 2 Cuantitativo. En el formato A, no se
puede calificar 2 en ambas reas de inters, tampoco es
posible calificar 0 en ambas reas. El formato A genera
puntuaciones ipsativas. Las puntuaciones muestran una
fuerza relativa y no una fuerza absoluta de intereses;
por ejemplo, tal vez odie todas las actividades, pero
repudie ms los reactivos cuantitativos que los verba
les. O bien, tal vez le agraden todas las actividades,
aunque las verbales ms que las cuantitativas.
Las puntuaciones ipsativas se emplean con cier
tas pruebas de personalidad e inventarios de intere
ses. Se sugiere consultar los captulos sobre estas
pruebas para conocer casos concretos. Las puntuacio
nes ipsativas se contrastan con las puntuaciones nor
mativas, se dice que las primeras aluden al individuo
en tanto que las segundas refieren al grupo normati
vo. Sin embargo, ese es un contraste potencialmente
engaoso ya que las puntuaciones ipsativas tambin
pueden referirse a normas.
Las puntuaciones naturales y las puntuaciones
theta en s mismas por lo comn carecen de significa
do, son bastante estriles y difciles de interpretar. La
forma ms comn de darles cierto significado en las
puntuaciones naturales consiste en convertirlas o trans
formarlas en algn tipo de norma. La puntuacin nor
malizada tambin llamada puntuacin derivada
ubica la puntuacin del individuo en el contexto de
las puntuaciones que obtienen otros examinados; es
tos ltimos constituyen el grupo normativo.

TIPOS DE NORMAS

En esta seccin se analizan los tipos de normas que se


utilizan con mayor frecuencia en las pruebas psicol
gicas. Hay tres principales categoras de normas, con
varias subcategoras, aqu se describe cada tipo de
norma y despus se identifican sus fortalezas y debi
lidades. Se dispone de varios tipos de normas, no slo
de uno, para muchas pruebas; casi todos ellos se rela
cionan en forma sistemtica entre s, de modo que es
posible hacer una conversin de un tipo de prueba a
otro, aunque esto no puede realizarse con todos los
tipos de normas. Estas relaciones son importantes,
suelen conceptuarse en el contexto de la curva nor
mal que ya se revis en este captulo. Muchas de las
relaciones se muestran en la figura 3-10, la cual me
rece un estudio cuidadoso; en este libro se aludir a
ella con frecuencia en las secciones subsiguientes de

Normas de las pruebas * 5 9

RANGO PERCENTILARES Y PERCENTILES


Resumen de puntos clave 3 -3

Principales categoras de las normas


de las pruebas

R a ng o s percentilares

P untuaciones estndar

N o rm a s de desarrollo

este captulo. Muchas de las relaciones representadas


en la figura 3-10 se representan en forma tabular en
el cuadro 3-1.

Uno de los tipos ms comunes de normas para las prue


bas psicolgicas es el rango percentilaropercentil. Hay
una distincin tcnica entre estos dos trminos. El ran
go pereentilar (RP) indica el porcentaje de casos en ci,,-- grupo normativo que se ubican por debajo de una de
terminada puntuacin natural. Si una puntuacin natu
ral de 48 tiene un RP de 60, esto significa que 60% de
los casos en el grupo normativo se califican en o por
debajo de una puntuacin natural de 48. Por supuesto,
algunos casos en el grupo normativo obtienen una pun
tuacin exacta de 48; esta puntuacin se considera como
un intervalo de 47.5 a 48.5, en el cual 48.0 es el punto
medio del intervalo; por tanto, en algunas aplicacio-

Porcentaje de casos
bajo las partes de la
curva normal
Desviaciones
estndar

_ 4G

-3 a

-2 a
i
2.3%

l
0.1%

1
___ I I

Equivalentes
de percentil

.0

E d ito ria l E ! m a n u a l m o d e r n o F o to c o p ia r s in au to riz a c i n

Puntuaciones
CEEB

1
200

;f

1
1

Escalas W echsler J________


Subpruebas
Cl derivados

L_

a 15
Otis-Lennon

l_

+ 1a

+2a

1
50.0%
50%

i
84.1%
84%

i
97.7%
98%

1 l.l, .1.1 1
lL J l l i l i l
20 130 40 50 60 70 1 80

0
1
50
1
500

40
400
20

30

40

50

1
2
7%

Porcentaje en estanina

i
15.9%
16%

-1.0

300

Puntuaciones ECN

Estaninas

10

-2.0
1
30

-3.0
1
20

Puntuaciones T

-1 a

3
12%

60

1
17%

20%

90

99

95

+1.0
1
60

+2.0

1
600

1
700

70

l
80

70

901

17%

+4.0

1
800
1

99

1
6

+3.0
1
80

12%

7%

13

16

19

I_

_I_

55

115

_1

_ l__

Figura 3-10. Equivalencia de varios tipos de normas en la curva normal.

(Captulo 3)

60 Pruebas psicolgicas. Una introduccin prctica

Cuadro 3 -1 . Equivalentes de percentil de varios sistem as de puntuacin estndar


%il
98
97
96
95
94
93
92
91
90

89
88

87
86

85
84
83
82
81
80
79
78
77
76
75
74
73
72
71
70
69
08

67
66
65
64
63
62
61
60
59
58
57
56
55
54
53
52
51
50
49
48
47
46
45
44
43
42
41
40
39
38
37
36
35
34
33
32

E stanina

ECN

9
9
9
9
8
8
8
8
8
8
8
7
7
7
7
7
7
7
7
7
7
7
7
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
4
4
4
4
4
4
4
4

99
93
90
87
85
83
81
80
78
77
76
75
74
73
72
71
70
69
68
68
67
66
66
65
64
64
63
62
62
61
60
60
59
59
58
58
57
56
56
55
55
54
54
53
53
52
52
51
50
50
50
49
48
48
47
47
46
46
45
45
44
44
43
42
42
41
41
40

Cl (15)
133
130
129
127
125
123
122
121
120
119
118
117
116

Cl (16)
135
132
130
128
126
125
124
122
121
120
119
118
117

115

116

114
113

114

112

113

111

112

110

111

109

110

P untuacin T

SAT

74
70
69
68
66

740
700
690
680
660

P untuacin z
2.4
2.0
1.9
1.8
1.6

65
64

650
640

1.5
1.4

63

630

1.3

62

620

1.2

61

610

1.1

60

600

1.0

59

590

0.9

58

580

0.8

57

570

0.7

56

560

0.6

55

550

0.5

54

540

0.4

53

530

0.3

52

520

0.2

51

510

0.1

50

500

0.0

49

490

-0.1

48

480

-0 .2

47

470

-0 .3

46

460

-0 .4

109
108
108
107
107
106
106
105
105
104
104
103

103

102

102

101
101
100

100
99

99
98

98

97

97
96

96
95
95
94
94
93
93

%il
99
98
97
96
95
94
93
92
91
90
89
88
87
86
85
84
83
82
81
80
79
78
77
76
75
74
73
72
71
70
69
68
67
66
65
64
63
62
61
60
59
58
57
56
55
54
53
52
51
50
49
48
47
46
45
44
43
42
41
40
39
38
37
36
35
34
33
32

VE

Normas de las pruebas 61

Cuadro 3 -1 . (C ontinuacin)
% il

E sta n in a

ECN

31
30
29
28
27
26
25
24
23
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1

4
4
4
4
4
4
4
4
4
3
3
3
3
3
3
3
3
3
3
3
3
2
2
2
2
2
2
2
1
1
1

40
39
38
38
37
36
36
35
34
34
33
32
32
31
30
29
28
27
26
25
24
23
22
20
19
17
15
13
10
7
1

C l (15)

Cl (16)

P u n tu a c i n T

92

S AT

P u n tu a c i n z

45

450

-0 .5

44

440

-0 .6

43

430

-0 .7

42

420

-0 .8

41

410

-0 .9

40

400

-1 .0

39

390

-1.1

38

380

-1 .2

37

370

-1 .3

36
35

360
650

-1 .4
-1 .5

34
32
31
30
29

340
320
310
300
290

-1 .6
-1 .8
-1 .9
-2 .0
-2 .4

92
91
91

90

90

89

89

88

88

87

87
86

86

85
84
83
82
81
80
79
78
77
76
74
72
70
67

85
84
83
82
81
80
79
78
76
75
74
72
70
68
65

% il
-^

o 31
30
29
28
27
- 26
25
24
23
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1

El Cl (15) es para pruebas de Cl con una M = 100 y una D E - 15. p.ej., las puntuaciones de las escalas Wechsler Verbal, de Ejecucin y Total.
El C1 (16) es para pruebas de Cl con una M = 100 y una DE= 16, como la Stanford-Binet y la Otls-Lennon. El SAT abarca cualquiera de varias
pruebas que utilizan una M - 500 y una DE = 100.
Reproducido de Hogan.T, P. (1988). Abreviaturas: ECN, equivalente de curva normal.

E d it o ria l E i m a n u a l m o d e r n o Fotocopie

nes, el RP se calcula de modo que incluya a la mitad de


los casos en el intervalo de la puntuacin natural.
Un percentii (que suele abreviarse como %il) es
un punto en una escala por debajo del cual se ubica
I un porcentaje especfico de los casos. La diferencia
entre un percentii y un rango percentilar podra
$ resumirse de la siguiente manera: en el percentii, se
s empieza con un determinado porcentaje, luego se en| cuentra la puntuacin natural correspondiente a ese
| punto. En el caso de un rango percentilar, se inicia
con una puntuacin determinada, luego se halla el por
centaje de casos que se encuentran por debajo de esa
puntuacin. En la prctica, los trminos percentii y
rango percentilar suelen emplearse en forma indistin
ta sin problema.
A veces los investigadores se topan con ramifi
caciones del sistema de percentiles, las cuales inclu
yen a los deciles, los quintiles y los cuartiles. Como
se deriva de sus races latinas, estos sistemas dividen
la distribucin en dcimos, quintos y cuartos, respec
tivamente. En consecuencia, es posible considerar los
percentiles como un sistema que divide la distribu
cin en centsimos.

La figura 3-10 ilustra el lugar de los rangos percentilares en la curva normal. El RP (rango percentilar)
de una puntuacin baja de 1 a una elevada de 99, don
de 50 es el punto intermedio o mediana. La relacin
entre los rangos percentilares y las puntuaciones z se
define por el cuadro de reas bajo la curva normal
que se estudia en la introduccin a la estadstica.

INTNTELO!
Se sugiere al estudiante usar la figura 3 -1 0 para responder
a estas preguntas. Dar estimaciones. Poner la puntuacin z
aproximada en cada uno de estos rangos percentilares. Lue
go, con ayuda del cuadro 3 -1 , revisar las estaninas.
RP
50
84
16
25
99

z estimada
(figura 3-10)
________
________
________
________
________

z del cuadro
(cuadro 3 -1 )
________
________
________
________
________

(Captulo 3)

62 Pruebas psicolgicas. Una introduccin prctica

Fortalezas y debilidades de los rangos


percentilares
Los RP poseen varias caractersticas atractivas, pri
mero, porque el concepto de RP as-senlllo, fe ii de
captar y se explica con rapidez incluso a alguien que
no est versado en estadstica. Adems, los RP se cal
culan con facilidad a partir de un grupo normativo;
por tales razones, los RP se utilizan en forma muy
generalizada.
Los RP tienen dos principales inconvenientes. En
primer lugar, el lego con frecuencia confunde el RP
con la puntuacin de porcentaje correcto, la cual se
utiliza en muchas pruebas que se realizan en las aulas.
Segn la tradicin, en el sistema de puntuacin de por
centaje correcto, 90% equivale a una A, 60% equivale
a reprobar y as sucesivamente. Por tanto, un RP de 72,
que se encuentra por encima del desempeo prome
dio, puede mal interpretarse como desempeo apenas
aprobatorio. Un RP de 51, que se halla cerca del pro
medio, suena como si se tratara de un desempeo psi
mo en el sistema de porcentaje correcto. Los psiclogos
deben distinguir con sumo cuidado entre RP y puntua
ciones de porcentaje correcto, sobre todo al interpretar
las puntuaciones para los legos.
El segundo inconveniente importante del RP es
la marcada desigualdad de las unidades en diversos
puntos en la escala. En concreto, los RP se agrupan
a la mitad de la distribucin y se dispersan en los
dos extremos de ella. Al principio, esta peculiaridad
parecera un tecnicismo trivial, no obstante, tiene con
secuencias prcticas muy sustanciales. Una determi
nada diferencia de puntuacin natural, por ejemplo
de 3 puntos, abarcar muchos puntos de percentil a la
mitad de la distribucin, pero slo unos cuantos pun
tos de percentil en cualquiera de sus extremos. El fe
nmeno puede indicarse en las normas del RP de
cualquier prueba. Esta dificultad no es una propiedad
de los RP, sino del hecho de que se aplican a una va
riable que tiene una distribucin normal, lo cual se
adjudica de manera aproximada a la mayor parte de
las pruebas psicolgicas. La dificultad no surgira en
la circunstancia inusual en la que la variable tuviese
una distribucin rectangular, el fenmeno se reverti
ra en realidad en una distribucin en forma de U.
La figura 3-11 muestra las normas percentilares
de una de estas facetas en la escala de escrupulosidad
del NEO PI-R.4 En estas normas, el pasar de una pun
tuacin natural de 10 a 13 genera un movimiento in
significante en la escala de percentiles, slo de un
punto, del percentil 2 al 3. Empero, ir de una puntua
cin natural de 20 a 23 corresponde a una diferencia
4 El NEO PI-R es una prueba de personalidad que se utiliza
en forma generalizada. Se describe con mayor detalle en
el captulo 12.

percentilar de 27 puntos (43-70). Tambin es posible


observar este fenmeno al revisar la figura 3-10.

PUNTUACIONES ESTNDAR
Las puntuaciones estndar son otro tipo de norma que
se utiliza con frecuencia con las pruebas educativas y
psicolgicas. Constituyen una familia de normas, exis
ten versiones de puntuaciones estndar muy utiliza
das y una variedad en potencia infinita de otras
versiones. Aqu se describir primero lo que es co
mn a todas las puntuaciones estndar y luego se iden
tificarn las propiedades de las versiones especficas.
En el cuadro 3-2 se muestran algunos ejemplos.
Un sistema de puntuacin estndar es una con
versin de puntuaciones z (ya comentadas en este ca
ptulo) en un nuevo sistema que tiene una media (Ai)
y una DE elegidas de manera arbitraria. Las nuevas M
y DE suelen elegirse para que sean cifras fciles de
recordar como 50 y 10 o 500 y 100. En contados ca
sos se buscan otras caractersticas deseables.
A fin de convertir una puntuacin natural en una
puntuacin estndar, primero se traducir la puntua
cin natural en puntuacin z. Luego, se multiplicar
la puntuacin z por la nueva DE (puntuacin estndar)
y se sumar la nueva media (puntuacin estndar).
Las etapas se resumen en la figura 3-12. La frmula
siguiente realiza estas etapas:

PE =

(X - M) + M e
DEn

Frmula 3 -5

donde PE = puntuacin estndar deseada


DEe = desviacin estndar en el sistema de
puntuacin estndar
DE = puntuacin estndar en el sistema de
puntuacin natural
Mn = media en el sistema de puntuacin na
tural
Me = media en el sistem a de puntuacin
estndar
X = puntuacin natural
Cuando la puntuacin (X) se traduce en forma de pun
tuacin z, la frmula es:
PE = z ( DEe) + M e

Frmula 3 -6

En la prctica comn, todas estas etapas ya se han rea


lizado y slo se utiliza un cuadro del manual de la prueba
para convertir una puntuacin natural en una puntua
cin estndar. En la figura 3-13 aparece un ejemplo de
este tipo de cuadros, slo se incluye una seccin del
cuadro, no el rango de puntuaciones completo.


N o n m s de las pruebas 63

Puntuacin natural

10

11

12

13

14

15

Percentil

16 17
11

14

18

19 20 21

22 23 24

26

33

60 70

43 52

25 26

27

28

29 30

79 83 88

93

96

98

99

Figura 3 -1 1 . P un tu a ci n natural para conversin a percentil d e a escala N E O Pl-R .

Transformaciones lineales y no lineales


La mayor parte de las puntuaciones estndar son

transformaciones lineales de puntuaciones natura


les, siguen la frmula 3-5. No obstante, algunas pun
tuaciones naturales se derivan de una transformacin
no lineal, en tales casos, ni esa frmula ni el ejemplo

de la figura 3-12 aplican. Las transformaciones no


lineales se emplean para generar una distribucin de
puntuaciones normales, por lo cual, el resultado en
ocasiones se denomina puntuacin estndar norma
lizada; su efecto se ilustra en la figura 3-14. Por lo
comn, la transformacin no lineal se consigue ba
sndose en la relacin entre puntuaciones z y per
centiles, en reas bajo la curva normal, por tal razn,
a veces se la conoce como transformacin de rea.
Aunque parezca complicado, el proceso es bastante
simple. En este captulo se asume que las puntuacio
nes estndar son transformaciones lineales, a menos
que se indique de otro modo.

E d it o ria l E l m a n u a l m o d e r n o F o to c o p ia r s in a u to riz a c i n e s u n de lito.

Puntuaciones T
Las puntuaciones T, conocidas tambin como pun
tuaciones T de McCall, son puntuaciones estndar con
M = 50 y DE = 10. El rango efectivo de puntuaciones
T es de casi 20 (correspondientes a -3 z) a alrededor
de 80 (+ 3 z). Las puntuaciones T (en mayscula) de
ben distinguirse de los valores / de Student (en mi
nscula) utilizados en pruebas de significancia esta
dstica. Las puntuaciones T se emplean de manera
generalizada con las pruebas de personalidad, aun
que tambin con otro tipo de instrumentos, como en
el Inventario Multifsico de la Personalidad Minnesota
que se describe en el captulo 12 y en el Strong Interest
Inventory (Sil; Inventario de Intereses Strong) que se
analiza en el captulo 14. La figura 3-10 muestra la
distribucin de puntuaciones T.

Sistem a de puntuacin natural


Puntuacin z
Puntuacin estndar
Frm ula 3-5:

M = 38

DE = 6

X = 47

z = ( X - M ) ID E = (47 38)/6
M = 50

D E = 10

P E = 65

P E = (DEsID E r ) ( X - M , ) + Ms
PE = (10/6) (47 - 38) + 50 = 65

Figura 3-12. Ilustracin de conversin de un sistema de puntuacin natural a uno de puntuacin estndar.

(Captulo 3)

64 Pruebas psicolgicas. Una introduccin prctica

P u n tu a ci n natu ra l:

... 60 61

62 63 64 65

66 67

68 69 ...

P u n tu a ci n estndar: ... 55 56

56 57 58 59

60 61

62 63

Figura 3 -1 3 . Ejemplo de puntuacin natural convertida a puntuacin estndar (puntuacin 7).

Las pruebas SAT y GRE


En la Scholastic Assessment Test (SAT; Prueba de Eva
luacin Acadmica) y en los Graduate Record Exa
minations (GRE) (Exmenes de Registro de Gradua
dos) se utiliza un sistema de puntuacin estndar con
M = 500 y DE = 100, mismo que tambin se aplica a
las principales pruebas de esta serie: Verbal y Mate
mticas en el SAT, y Verbal, Cuantitativa, Analtica y
las diversas pruebas Avanzadas en los GRE. Las prue
bas a menudo se combinan para generar una puntua
cin total, por ejemplo, en el SAT se utiliza a menudo
una puntuacin combinada de las pruebas Verbal y de
Matemticas. Cuando as sucede, las medias son
aditivas, pero las DE no; es decir, la media de la pun
tuacin combinada o Total es 500 + 500. pero la DE
de la puntuacin total no es 100 + 100. La DE de las pun
tuaciones totales es menor de 200, ya que las dos pruebas
que se integran no estn correlacionadas a la per
feccin. Este fenmeno no es particular de las pruebas
SAT y el GRE, se emplea en cualquier fusin de prue
bas que no estn correlacionadas-en forma perfecta.

Cl de desviacin
La definicin tradicional del CI (coeficiente de inteli
gencia) es: CI = (EM/EC) x 100, donde EM es edad
mental (para una descripcin de edad mental, vase
ms adelante), EC es edad cronolgica y 100 es un
multiplicador que sirve para eliminar el punto deci
mal. As, por ejemplo, la EM de Zelda es de 10 aos,

su EC es de 8 aos, de modo que su CI es (10/8) x 100


= 125. Lo anterior se denomina razn de CI ya que
representa la razn de EM a EC.

IN TN TELO !................................................................
Se sugiere al estudiante calcular los Cl de razn de estos
casos.
La EM de Matt es de 78 meses (6 aos, 6 meses),
su EC es de 84 meses (7 aos, 0 meses). Cul
es su razn de Cl?
La edad mental de Meg es de 192 meses, su EC es
de 124 meses. Cul es su razn de Cl?

La razn de CI se utiliz con las primeras prue


bas de inteligencia, pero se observ que la DE de es
tos CI no eran iguales a niveles de edad diferentes; en
concreto, las DE tendan a aumentar con la edad. As,
una razn de CI de 120 se desva menos del promedio
(100) a los 18 que a los 6 aos de edad y, a la inversa,
una razn de CI de 70 se desva ms de 100 a los 7
que a los 17 aos de edad. Tal variacin en el signifi
cado de un CI a diferentes niveles de edad es desafor
tunada e indeseable.

Resumen de puntos clave 3 -4

Modalidades de puntuaciones estndar


P untuaciones T
S c h o la s tic A s s e s s m e n t T e st (SA T) y G ra d u a te
Record E xam inations (G RE)
C l de desviacin
E sta n ina s
E quivalentes de cu rva norm al
P untuaciones e st n da r m ultinivel (o escaladas)

F ig u ra 3 -1 4 . Ilustracin de la transform acin no lineal de


una d istrib uci n no norm al de puntuaciones n atu ra le s en el
sistem a de p untuacin estndar que la a pro xim a a u n a dis
tribucin norm al.

"

Normas de las pruebas 65

Cuadro 3 -2 . Sistem as de puntuacin estndar utilizados en form a generalizada


P ru e b a

M e d ia

DE

E scalas W e ch sler Verbal, de Ejecucin y Total


Pruebas S tanfo rd -B in e t y O tis-Lennon
P untuaciones de las su b esca la s W echsler
P ruebas de adm isi n a las facultades de dere ch o
S cholastic A sse ssm e n t Test (SAT)
G raduate R ecord E xam inations (GRE)

100
100
10
150
500
500

15
16
3
10
100
100

Los CI que se obtienen de las pruebas de inteli


gencia modernas no son de razn, son puntuaciones
estndar con M = i 00 y una DE establecida normal
mente en 15 o 16. Estas puntuaciones estndar se sue
len conocer como CI de desviacin. La M = 100 se
utiliza por deferencia a la definicin (razn) tradicio
nal del CI. Los CI de razn en la prueba StanfordBinet original generaban una DE de 16 a ciertas
edades, esta DE se adopt como la DE de las pun
tuaciones estndar empleadas en algunas pruebas de
inteligencia. Otras pruebas, de las cuales destacan las
de Wechsler (WAIS, WISC, WPPSI), optaron por una
DE= 15.
Algunos segmentos de la comunidad psicolgica
luchan con todas sus fuerzas por evitar el trmino CI,
aunque mantienen la tradicin de emplear un sistema
de puntuacin estndar con M = lOOy D E = 15o 16.
Lo que aqu se denomina CI de desviacin en ocasio
nes aparece en los manuales de las pruebas y los in
formes de las puntuaciones con nombres diferentes,
como ndice de capacidad escolar. Esos nombres
alternos suelen reconocerse con facilidad como siste
mas de puntuacin estndar, que cuentan con las M y
DE ya familiares para los lectores de este texto.

= 5 y DE = 2 (aproximadamente). Se elaboraron para:


a) dividir la distribucin normal en 9 unidades y,
b) hacer que las unidades abarcaran distancias igua
les sobre la base de la curva normal, excepto por
aquellas que cubren los extremos de la distribucin,
es decir, la 1 y la 9. Cuando se cumple con estas dos
condiciones, la Ai ser de 5 y la D un poco superior
a 2; estas dos propiedades de las estaninas se ilus
tran en la figura 3-10. vea tambin la figura 3-15 y
note que las unidades 2-8 involucran distancias igua
les sobre la base de la curva normal. Como la densi
dad de la curva vara en diferentes secciones, estas
distancias iguales cubren varios porcentajes de los
casos en la distribucin, por ejemplo, la estanina 2
comprende 7% de los casos (del percentil 4 al 11),
en tanto que la estanina 4 cubre 17% de los casos
(del percentil 23 al 40).

INTNTELO !................................................................
Con ayuda de la figura 3 -1 0 o 3 -15, el lector determinar
la estanina correspondiente a cada uno de estos percentiles.
Percentil:

36

52

90

Estaninas
Estanina:
Las estaninas, contraccin en ingls de standard
nine , son un sistema de puntuacin estndar con M
Las estaninas siempre se derivan en relacin con
las desviaciones de los percentiles que se aprecian en
la figura 3-15 y no por medio de la frmula 3-5. Las
estaninas generan una transformacin no lineal de
puntuaciones naturales (a menos que la distribucin
original ya sea perfectamente normal). Se emplean
de manera generalizada para informar puntuaciones

Estaninas
Por debajo de 4 | 4-10 | 11-22 | 23-39 | 40-59 | 60-76 | 77-86 | 89-95 | Porenguade

Rangos de percentil

Figura 3-15. Distribucin de ias estaninas.

(Captulo 3)

66 Pruebas psicolgicas. Una introduccin prctica

en pruebas de aprovechamiento estandarizadas y en


algunas pruebas de capacidad mental, en las escuelas
de enseanza elemental y secundaria; no se usan mu
cho en otros contextos.
Una ligera variacin de la estanina es la estn,
contraccin en ingls de standard ten". Se trata de
un sistema de puntuacin estndar con valores que
van de 1 a 10 y con M = 5.5 y DE = 2 (aproximada
mente). Los estn 2 a 9 cuentan con distancias iguales
sobre la base de la curva normal, en tanto que los es
tn 1 y 10 que cubren los extremos de la distribucin
son abiertos. Los estn se encuentran en publicacio
nes del Institute for Personality and Ability Tests (1PAT;
Instituto para las pruebas de personalidad y capaci
dad); la mejor conocida de estas pruebas es el Cues
tionario de 16 factores de la personalidad (16PF)*.

Equivalentes de curva normal


El equivalente de curva normal (ECN) es un siste
ma de puntuaciones estndar desarrollado para que
los ECN sean iguales a los rangos percentilares en los
puntos 1,50 y 99. Cuando se cumple con esta condi
cin, el sistema ECN tiene M = 50 y DE (ms o me
nos) 21. Los ECN se emplean en forma casi exclusiva
para cumplir con ciertos requisitos federales de infor
macin sobre las pruebas de aprovechamiento en las
escuelas pblicas. En la figura 3-10, se aprecia la re
lacin entre los ECN y otras normas.

Puntuaciones estndar de multinivel


Una prueba multinivel es un instrumento que cuenta
con pruebas distintas, al menos en parte, para dife
rentes edades o en distintos grados. Los principales
ejemplos de estas pruebas son las bateras de apro
vechamiento (vase el captulo 11) y las pruebas de
capacidad cognitiva aplicadas a grupos (vase el ca
ptulo 9) que se utilizan en las escuelas de enseanza
elemental y secundaria. Si bien una de estas pruebas
tal vez tenga el mismo nombre (p. ej., la Metropolitan
A chievem ent Test [Prueba de Aprovechamiento
Metropolitan] o la Otis-Lennon School Ability Test
[OLSAT; Prueba de Capacidad Escolar Otis-Lennon])
a lo largo de un amplio margen de edades o grados,
obviamente no se utilizan los mismos reactivos en el
rango completo. La prueba se divide en varios niveles
diferentes, uno puede usarse en los grados 1 a 2, otro
en ios grados 3 a 4 y as de manera sucesiva.
Las puntuaciones estndar obtenidas a partir de
diferentes niveles en tales pruebas suelen relacionarse
mediante un sistema de puntuaciones estndar que abar
ca todos los niveles; en ocasiones se alude a ellas como
* N. del E.: Publicado en espaol por Editorial El Manual
Moderno, Mxico.

puntuaciones escaladas. Las puntuaciones estndar de


niveles mltiples son difciles de interpretar, poseen una
media y una DE convenientes (p. ej., 500 y 100) en un
nivel, por lo general para un grado o edad a la mitad del
rango que cubre toda la serie, pero la media y la DE
diferirn en otros niveles de edad o de grado. Por tanto,
una puntuacin estndar de 673 de un estudiante de
sptimo grado en la prueba de lectura no tiene un sig
nificado que resulte fcil de interpretar.
Las puntuaciones estndar de niveles mltiples
pueden ser tiles para medir el crecimiento por gra
dos o edades, el sistema de calificacin suele desarro
llarse con el fin de aproximarse a una escala de
intervalo; sin embargo, para la interpretacin comn
de las pruebas, las puntuaciones estndar de niveles
mltiples no son muy tiles.

Fortalezas y debilidades
de las puntuaciones estndar
Las puntuaciones estndar constituyen un sistema
mtrico conveniente para interpretar el desempeo en
las pruebas en muy diversas circunstancias. Dado que
muchos rasgos de inters para los psiclogos, se su
pone, estn distribuidos en forma normal, son tiles
las conexiones entre las puntuaciones estndar y las
puntuaciones z. Con las puntuaciones estndar se evi
ta el problema del percentil respecto a la desigualdad
marcada de unidades en diversas regiones de la distri
bucin normal, por ello, estas puntuaciones son ms
acordes a los clculos estadsticos.
Empero, las puntuaciones estndar tienen algunos
inconvenientes. En primer lugar, hay que reconocer que
slo una fraccin sumamente pequea de la raza huma
na tiene idea de lo que es un curva nonnal o una puntua
cin z; as que vincular las puntuaciones estndar con el
contexto de la curva normal y de las puntuaciones z tie
ne poco valor, salvo cuando se trabaja con entendidos en
la materia. En segundo lugar, para que una puntuacin
estndar tenga sentido, se debe recordar la M y la DE del
sistema. En prrafos anteriores se mencionaron algunos
de los conocidos sistemas de puntuacin estndar en los
que se reduce al mnimo este problema, por ejemplo, M
= 100 y DE = 15 en el caso de los CI de desviacin en las
pruebas de capacidad mental. No obstante, hay muchos
otros sistemas de puntuacin estndar quiz una va
riedad infinita, ya que se puede elegir cualquier valor
para M y DE , Por ejemplo, la Law School Admission
Tests (LSAT; Pruebas de Admisin a las Facultades de
Leyes) y la prueba de ingreso a la universidad ACT tie
nen, cada una, sistemas de puntuacin estndar distinti
vos. Qu implica una puntuacin de 130 en el LSAT?
Qu significa una puntuacin de 26 en el ACT? Es im
posible saberlo sin consultar el manual de la prueba y
ver cules son los valores de M y DE en estos sistemas
de puntuacin estndar.

Normas de las pruebas 67

Es preciso hacer una observacin especial acerca


de las estaninas: tienen la virtud de ser sencillas para
informar las puntuaciones individuales. Es fcil de
explicar, por ejemplo a los padres, que el desempeo
de su hijo se informa en una escala del 1 a jjl. En
general, no se necesita una expliCSctn adicional so
bre medias, desviaciones estndar, distancias iguales
sobre la base de la curva normal u otros, esta sencillez
es una ventaja. Por otra parte, las estaninas son bas
tante burdas para informar promedios de grupos.
Los equivalentes de curva normal son una crea
cin desafortunada. Como puntuaciones estndar, no
ofrecen una ventaja con relacin a otros sistemas de
puntuacin estndar, no obstante, parecen percentiles
y, por ello, se confunden con facilidad con stos. Como
ya se dijo, estos equivalentes corresponden, de he
cho, a los percentiles en tres puntos de la distribu
cin, pero en otros son diferentes de manera notoria.

NORMAS DE DESARROLLO
Cuando el rasgo que se mide se desarrolla en forma
sistemtica en el tiempo, es factible crear lo que puede
denominarse norm a de desarrollo. Son dos las nor
mas de esta ndole ms utilizadas; los equivalentes de
edad (EE) y los equivalentes de grado (EG). Los EE
se usan en algunas pruebas de capacidad mental, en
este contexto, la puntuacin se denomina edad mental
(EM); con mucho el ms conocido de los equivalentes
de edad. Los EG se emplean con muchas pruebas de
aprovechamiento. Las normas de desarrollo son signi
ficativas slo para el rango en que el rasgo que se mide
se desarrolla o crece en el tiempo en la poblacin perti

nente. En una norma de desarrollo, una nueva puntua


cin se interpreta en trminos de la edad o el grado en
que es caracterstica la puntuacin natural.

Edad mental (EM)


Las edades mentales son el principal ejemplo de equi
valentes de edad, fueron de las primeras normas utili
zadas con las pruebas psicolgicas; se originaron con
las escalas Binet. Las EM se determinan hallando la
puntuacin comn o mediana de los examinados a eda
des sucesivas. Los grupos de edad pueden formarse por
intervalos de un ao, medio ao, un trimestre o cual
quier otra de estas agrupaciones de individuos. Luego,
se determina la puntuacin mediana en la prueba de
cada grupo. Los resultados se indican mediante puntos
y con una ligera curva se unen los puntos, como en la
figura 3-16. Cada
en la figura es una mediana obte
nida a partir del programa de normalizacin de la prue
ba. La figura ilustra cmo obtener una EM de 88 meses,
o 7 aos con 4 meses (la cual suele escribirse como 7-4
en la jerga de los equivalentes de edad). En la prctica,
las puntuaciones naturales se convierten en edades
mentales mediante un cuadro preparado a partir de la
curva de desarrollo. En la figura 3 - 17, apar ece un ejem
plo de cuadro de esta ndole.

INTNTELO !................................................................
Con ayuda de la figura 3-17, estime la EM (edad mental)
correspondiente a las puntuaciones naturales siguientes:
Puntuacin natural
EM

11

Figura 3-16. Ilustracin de curva para desarrollar edades mentales.

22

47

(Captulo 3)

68 Pruebas psicolgicas. Una introduccin prctica

P u n tu a ci n natural:
Edad m ental:

15

20

25

30

35

40

45

4 -0

4 -2

4 -5

5 -0

5 -4

6 -2

8 -8

Figura 3 -1 7 . P arte de una puntuacin natural p ara cu a dro de edad m ental desarrollada a p a rtir de la figura 3 -1 6 .

Equivalentes de grado (EG)


Los equivalentes de grado se desarrollan aplicando
una prueba a estudiantes de diferentes grados, esto se
lleva a cabo en el programa de normalizacin. Luego
se obtiene el desempeo tpico o mediano en cada
grado. Las medianas se sealan con puntos y una cur
va une los puntos como en la figura 3-18. De manera
similar al procedimiento de las EM, los EG de una
puntuacin natural se leen de la curva y se prepara un
cuadro de conversiones de puntuacin natura] a EG.
La convencin para los EG consiste en dividir el
ao escolar en dcimos, como se aprecia en la figura 3-19.
Se informa un EG, por ejemplo, como 6.3, lo que signi
fica el tercer mes del sexto grado. Los EG superiores a
12.9 (el ltimo mes del decimosegundo grado) suelen
informarse como 12.9+ o con alguna clasificacin ver
bal (quiz Posterior al bachillerato). La escala de EG
no suele extenderse a los aos universitarios.

Otras normas de desarrollo


Aunque las edades mentales y los equivalentes de grado
son los principales ejemplos de normas de desarrollo, se
debe comentar con brevedad otros dos ejemplos. Prime
ro, hay pruebas que se basan en las teoras de las etapas

del desarrollo humano, como las de Piaget sobre el de


sarrollo cognitivo y de Kohlberg sobre el desarrollo
moral. Las pruebas basadas en estas perspectivas gene
ran resultados que ubican al individuo en cierta etapa,
as, una tarea piagetana puede ubicar a un nio en la
etapa preoperacional del desarrollo cognitivo; una
prueba kohlberiana tal vez site a un individuo en la eta
pa convencional del desarrollo moral. Tales pruebas por
lo general no producen una puntuacin numrica aun
que, en algunas aplicaciones, estas etapas tambin se
relacionan con las edades a las que con frecuencia se les
alcanza. En cualquier caso, las nociones fundamentales
asociadas con las normas basadas en etapas de estas prue
bas son las mismas, en esencia que las nociones de EM
y EG. Por supuesto, la utilidad de las normas de las teo
ras basadas en etapas depende de la validez de la teora
de las etapas y caractersticas psicomtricas de la prueba.
Un segundo ejemplo lo constituyen las medicio
nes antropomtricas, como la estatura y el peso, que
suelen interpretarse en trminos de normas de desa
rrollo. Se trata en esencia de equivalentes de edad,
por ejemplo, se informa que un menor tiene una es
tatura tpica de un nio de 6 aos. Como sucede con
las edades mentales, tales afirmaciones se interpretan
en relacin con la edad cronolgica del menor, como
Mike es muy alto para su edad.

Figura 3-18. Ilustracin de la curva para desarrollar equivalentes de grado.

Normas de las pruebas 69

Sept

Oct

.0 _ , o1

Nov
-o .2

Dic

Ene

Feb

Mar

Abr

May

Jun

.3

.4

.5

.6

.7

.8

.9

F ig u ra 3 -1 9 . D ivisin del ao e sco lar en el siste m a de e quivalentes de grado.

Fortalezas y debilidades
de las normas de desarrollo

i
|
|
|
|

|
|
^
|

I
|
^

Todas las normas de desarrollo tienen algunas forta


lezas y debilidades comunes, por el lado positivo, el
significado de las normas de desarrollo suele por natu
raleza ser muy atractivo. Cuando se dice que un chico
de 16 aos funciona a nivel mental como un nio de
tres aos o que un estudiante de segundo grado lee
como uno de octavo, tales afirmaciones al parecer
transmiten un significado considerable, libre de lajerga
estadstica estril de los rangos percentilares y las pun
tuaciones estndar. Las ideas sobre las pautas de de
sarrollo normales estn arraigadas de modo profundo
en las ideas que se tienen sobre los seres humanos; la
nocin fundamental de las normas de desarrollo se
utiliza en muchas situaciones. Al adulto que mani
fiesta un berrinche, se le acusa de actuar como si
tuviera dos aos; se dice que en Japn, los estudian
tes de sexto grado realizan ejercicios de lgebra nor
malmente reservados para los estudiantes de noveno
en EUA ; a Mike lo elogian por desempearse en su
primer juego de primer grado como si fuera un exper
to. Los equivalentes de edad y los equivalentes de
grado formalizan este modo de pensar natural, ayu
dan a lograr la meta de hacer que las puntuaciones
naturales resulten significativas.
Una segunda ventaja de las normas de desarrollo
radica en que ofrecen una base para medir el crecimiento en las pruebas de niveles mltiples. As, durante los aos de enseanza elemental, a un nio tal
vez lo sometan al nivel Primario 1, al nivel Elemental
y al nivel Intermedio de una prueba de aprovechamiento en el primer, cuarto y sptimo grados, respectivamente. Los equivalentes de grado (desarrollados
en el programa de escalamiento, descrito en el subtlulo Puntuaciones estndar de muitinivel, antes) relacionan todos estos niveles de la prueba.
Las normas de desarrollo tienen dos nconvenientes principales. En primer lugar, slo son aplicables a
variables que muestran pautas de desarrollo claras, por
tanto, no suelen aplicarse en reas como los rasgos de
personalidad, las actitudes y los intereses vocacionales. No significa nada decir que alguien tiene la extroversin de un chico de 10 aos o de uno de tercer grado;
adems, hasta las variables que presentan pautas de
desarrollo en ciertos niveles por lo general no siguen
pautas de crecimiento en forma indefinida. La capaci

dad mental, segn la miden muchas pruebas, se desa


rrolla sistemticamente alrededor de los 18 aos de
edad, pero no despus. La capacidad de lectura se
incrementa con rapidez durante los aos de enseanza
elemental, pero esto no prosigue de manera indefinida.
Para fines interpretativos de las pruebas, existe una til
distincin entre la capacidad mental de un nio de 5
aos de edad y de uno de 15, pero no entre una persona
de 25 y una de 35. No se trata de un asunto de todo o
nada, no es que las normas de desarrollo dejen de ser
tiles en un preciso momento, sino que van perdiendo
poco a poco su utilidad conforme la curva de desa
rrollo se vuelve menos pronunciada (como las que se
observan en las figuras 3-16 y 3-18): cuando sta
deviene plana, las normas de desarrollo pierden por
completo su significado.
Una segunda desventaja de las normas de desarro
llo son sus DE incontroladas, ya que no son iguales en
niveles diferentes ni tampoco en distintas pruebas. En
muchas pruebas, las DE tienden a incrementarse de for
ma sistemtica con el nivel de edad o de grado. Las DE
varan de modo no sistemtico entre diferentes pruebas
dentro de la misma batera, aun cuando las normas se
basen en el mismo grupo normativo. Tal vez ste parez
ca un aspecto tcnico trivial, pero tiene repercusiones
prcticas sustanciales; por ejemplo, un nio de 5 aos de
edad que est un ao por debajo del promedio en capa
cidad mental (a saber, EC = 5-0, EM = 4-0), se encuen
tra muy por debajo del promedio en unidades de DE o
en unidades percentilares en comparacin con uno de
16 aos de edad que aparece con un ao por abajo del
promedio (a saber, EC = 16-0, EM = 15-0). El estudian
te del grado 1.5 que lee con un EG = 3.5 est casi fuera
de la distribucin de los estudiantes de primer grado, en
tanto que no resulta tan inusual el pupilo del grado 7.5
que posee un EG de 9.5 en lectura. Adems, considrese
al alumno del grado 3.5 que tiene un EG de 4.5 en clcu
lo matemtico y un EG de 4.5 en lectura, en relacin con
otros estudiantes quiz se encuentre mucho ms avanza
do en clculo que en lectura. Estas diferencias en cuanto
a la DE entre varias pruebas no son sistemticas, pueden
diferir de una serie de evaluaciones a otra.
Una tercera crtica suele reservarse a los equiva
lentes de grado. Ya se dijo que, por ejemplo, los estu
diantes en tercer grado pueden tener un EG de 6.5, no
por conocer el mismo material que el estudiante co
mn de sexto grado, sino por responder sin error a
todos los reactivos de segundo, tercero y cuarto grados;


( Captulo J )

70 Pruebas psicolgicas. Una introduccin prctica

en tanto que el alumno comn de sexto grado resuel


ve con acierto algunos, ms no todos los reactivos de
un rango de grados de segundo a sptimo. Tal situa
cin se representa en la figura 3-20.
Dicho argumento, normalmente mencionado slo
en relacin con los equivalentes de grado, puede apli
car a cualquier tipo de puntuacin normalizada. Dos
estudiantes que obtienen una puntuacin que corres
ponde al percentil 75 o una puntuacin estndar de 60, no
por fuerza responden de modo correcto a los mismos
reactivos. Las pruebas elaboradas segn la teora de
respuesta al tem tratan de reducir al mnimo este pro
blema, pero eso est en funcin del mtodo de elabora
cin del instrumento y no del tipo de norma utilizada.

El cuadro 3^ f muestra parte del cuadro de normas


de la Piers-Harris Childrens Self-concept Scale (Esca
la de Autoconcepto para Nios de Piers-Harris). Se tra
ta de un caso mucho ms sencillo, uno de los cuadros
contiene todas las puntuaciones; en ste, uno ubica la
puntuacin natural en la columna de la izquierda, lue
go lee hacia la derecha para convertirla en un rango de
percentil, estanina o puntuacin estndar (en este caso
una puntuacin T). Por supuesto, para procesamiento
de cmputo, los cuadros de normas de estos dos ejem
plos se leen en un archivo de computadora y las con
versiones se hacen en forma electrnica.

INFORMES NARRATIVOS Y NORMAS


EJEMPLOS DE CUADROS DE NORMAS
Ahora que ya se han considerado cada uno de los princi
pales tipos de normas, conviene observar como se pre
sentan las normas en los manuales de las pruebas. Cmo
es un cuadro de normas? En realidad, estos cuadros pre
sentan una variedad enorme; aunque hay algunos esque
mas estndar. Luego de ver unos cuantos ejemplos, es
fcil descifrar las variaciones a estos esquemas; aqu se
presentan dos ejemplos comunes de cuadros de normas,
uno de una prueba en la que se utilizan diversas normas
y el otro de un caso mucho ms sencillo.
El cuadro 3-3 es un cuadro compuesto de varios
cuadros relacionados en la Otis-Lennon School Ability
Test, sptima edicin. En la prueba total, se empieza
con una puntuacin natural, luego se la convierte en
una escalar, puntuacin estndar de niveles mltiples.
Con ayuda de otro cuadro, esta puntuacin escalar
puede traducirse en el ndice de capacidad escolar
(ICE), una puntuacin estndar parecida a un CI con
M = 100 y DE = 16. Sin embargo, otro cuadro con
vierte la puntuacin escalar en un rango de percentil
y una estanina; por ltimo, basndose en la relacin
fija entre percentiles y ECN (cuadro 3-1), la puntua
cin escalar puede convertirse en un ECN.

Nivel
de contenido:
Reactivos

Recurdese que la finalidad bsica de las normas con


siste en ofrecer un contexto de interpretacin a una
puntuacin natural. En general, la informacin nor
mativa es cuantitativa: otra serie de cifras. Sin embar
go, las puntuaciones de las pruebas se informan cada
vez ms como narraciones generadas por computa
dora. Quiz el usuario no vea ningn nmero, aunque
la mayora de los reportes incluyen ambos nmeros
la clase usual de normas as como un informe
narrativo. Cmo se originan estos ltimos?
La esencia de los informes narrativos siempre
inicia con la puntuacin de una prueba, al menos una
puntuacin natural o theta y, las ms de las veces, con
una puntuacin normalizada. A partir de esto, dichos
informes varan de forma considerable en cuanto a su
complejidad. En el nivel ms simple, tal vez slo tra
duzcan una puntuacin normalizada en una descrip
cin verbal; por ejemplo, una computadora cuenta con
un cuadro que muestra la siguiente correspondencia
entre puntuaciones estndar (en un sistema con M =
100, DE = 15) y clasificaciones verbales:
130+
120-129

E xce p cion a lm en te elevado


M uy p o r e ncim a del prom edio

110-119

L igeram ente p o r e ncim a del prom edio

Segundo grado

Tercer grado

Cuarto grado

Quinto grado

xxxxx

xxxxx

xxxxx

xxxxx

Estudiante
de tercer grado

/////

/////

/////

Estudiante
de sexto grado

lili

11/

III

Sexto grado
xxxxx

Sptim o grado

PN

EG

15

6.5

15

6.5

xxxxx

Cada x es un reactivo de la prueba. Cada / es una respuesta correcta.


F ig u ra 3 -2 0 . D ife ren tes fo rm a s de o btener un EG d e 6 .5. A bre via tu ra s: EG , equ iva le ntes d e grado; PN , puntuacin natural.

Normas de las pruebas 71

Cuadro 3 -3 . C om puesto de puntuaciones norm alizadas de algunas


puntuaciones naturales de la O tis-lenn on Shool Ability Test, 7 a edicin.
Adaptado del cuadernillo de normas m ultinivel OLSAT7
PN

PE

ICE

RP

ECN

64
54
35

705
667
620

115
101
83

82
50
10

7
5
2

69
50
23

PN a PE va cuadro 9. PE a ICE va cuadro 22. ICE a P va cuadro 37. RP a ECN va cuadro 3. Puntuadones del nivel F, grupo de edad 16 aos 9-11 meses, grado 11 otoo.
Abreviaturas: ECN, equivalente de curva normal: ICE, ndice de capacidad escolan P, puntuacin; PE,
puntuacin estndar; PN, puntuacin natural; RP, rango de percentil.

9 0-1 0 9
8 0-8 9

P rom edio
Ligeram ente p or d e b a jo d e l prom edio

7 0 -7 9
M uy por d ebajo el pro m e d io
P or deb a jo
de 7 0

Excepcionalm ente bajo

Con este cuadro, el perfil de las puntuaciones de un


individuo en las pruebas A, B y C se vera de la si
guiente manera:

est ligeramente por encima del promedio de los ni


os de su edad.
Algunos informes narrativos van ms all de la
traduccin de puntuaciones normalizadas en clasifi
caciones verbales, consideran la informacin sobre la
confiabilidad y la validez de la prueba; estos aspectos
se abordan en los captulos dedicados a estos temas.

INTNTELO!.........................................................
P ru e b a

P u n tu a c i n

A
B

98
82

94

N ive l d e d e s e m p e o
P rom edio

Para utilizar en un inform e narrativo, disee una serie


de etiquetas que distingan entre las estaninas 1-3, 4-6
y 7-9. Las clasificaciones pueden ser algo ms que pala
bras aisladas.

L ige ra m e n te p or debajo
del pro m e d io
P rom edio

La columna de Puntuacin tal vez ni siquiera apa


rezca en el informe, aunque las puntuaciones son la
base del informe. Con un poco ms de sofisticacin
en programacin, el informe podra leerse como si
gue: El desempeo de Jim en la prueba A y C estuvo
en el rango promedio, en tanto que su desempeo en
la prueba B estuvo ligeramente por debajo del pro
medio . Los informes narrativos suelen incorporar
referencias al grupo normativo; por ejemplo, En com
paracin con los dems nios de su grado, Jim se en
cuentra en el percentil 60 en aptitud mecnica, lo cual

Grupo de estaninas
'
1-3
'
4-6
7-9

Etiqueta verbal
_____________
_____________
____________

En la figura 3-21, se aprecian partes de un infor


me narrativo del NEO PI-R, prueba que se describe
con todo detalle en el captulo 12. El informe narrati
vo completo tiene entre 5 y 6 pginas, el extracto aqu

Cuadro 3 -4 . Parte del cuadro de normas de la Piers-Harris Childrens


Self-Concept Scale
P u n tu a c i n n a tu ra l

P erce n til

E s ta n in a

P u n tu a c i n T

69
68
67
66
65
64
63
62
61
60

91
89
87
85
82
79
77
74
71
69

8
7
7
7
7
7
6
6
6
6

63
62
61
60
59
58
57
56
56
55

72

(Captulo

Pruebas psicolgicas. Una introduccin prctica

n d ice s de validez
Los ndices de validez se encuentran dentro de los lmites normales y los datos obtenidos de la prueba al parecer son
vlidos.
B ase de la in te rp re ta ci n
Este informe compara al entrevistado con otro varn adulto. Se basa en autorreportes del entrevistado.
En trminos generales, la personalidad puede describirse en funcin de cinco dim ensiones bsicas o factores. Las puntua
ciones de dominio del NEO-PI-R ofrecen estimaciones de cada uno de estos cinco factores. Sin embargo, las puntuaciones
factoriales del NEO-PI-R proporcionan mediciones ms precisas, las cuales pueden diferir ligeramente de las puntuaciones
de dominio indicadas en el perfil del individuo. Las puntuaciones factoriales son las siguientes:
E scala
Neuroticismo
Extraversin
Apertura
Agradabilidad
Escrupulosidad

(N)
(E)
(A)
(Ag)
(Es)

P u n tu a ci n T fa cto ria l
53
44
56
50
50

R ango
PROMEDIO
BAJO
ELEVADO
PROMEDIO
PROMEDIO

Estas puntuaciones factoriales se emplean para describir al individuo en un nivel general. Las puntuaciones factoriales se
basan en un compuesto de las puntuaciones escalares de los aspectos. En la medida en que hay una dispersin amplia entre
las puntuaciones de los aspectos dentro de un dominio, se vuelve ms com pleja la interpretacin del dominio y del factor. En
estos casos, debe prestarse particular atencin a las escalas de los aspectos y su interpretacin.
D e scrip ci n general de la p erso n a lid a d: lo s c in c o fa c to re s
La caracterstica ms distintiva de la personalidad de este individuo es la posicin que ocupa en el factor de extraversin.
Tales personas son ligeramente introvertidas, prefieren hacer muchas cosas solas o con un grupo reducido de personas.
Evitan las fiestas grandes y ruidosas y suelen ser silenciosas y reservadas en las interacciones sociales. Quienes conocen
a estas personas es probable que las describan com o retradas y serias (McCrae, Costa, 1987). El hecho de que estos
individuos sean introvertidos no por fuerza significa que carezcan de habilidades sociales, de hecho muchas personas con
esta caracterstica funcionan muy bien en situaciones sociales, aunque preferiran evitarlas. Obsrvese tambin que la
introversin no supone introspeccin, estos individuos tal vez sean atentos y reflexivos, slo si tienen un grado elevado de
apertura.

Esta persona tiene un grado elevado de apertura. Las personas que poseen este rasgo se interesan en la experiencia por
el gusto de experimentar, disfrutan la novedad y la variedad; son sensibles a sus propios sentimientos y poseen una capa
cidad superior al promedio para reconocer las emociones de los dems; aprecian m ucho la belleza en el arte y la naturaleza;
estn dispuestos a considerar ideas y valores nuevos y tal vez sean poco convencionales en sus opiniones. Sus com paeros
los califican como individuos originales y curiosos.
Luego, tmese en cuenta el nivel del individuo en neuroticismo. Las personas que califican en este rango se encuentran
en el promedio en trminos de estabilidad emocional, experimentan una cantidad norm al de angustia psicolgica y tienen un
equilibrio comn entre satisfaccin e insatisfaccin en la vida; cuentan una autoestim a elevada o baja; su capacidad para
enfrentar el estrs es tan buena com o la del individuo promedio.
La persona se encuentra en el promedio en trm inos de agradabilidad. Q uienes califican en este rango son tan agrada
bles como la persona promedio. Pueden ser comprensivos aunque tam bin firm es. Son confiados mas no crdulos, y estn
preparados para competir y cooperar con los dems.
Por ltimo, el individuo califica en el rango promedio en trm inos de escrupulosidad. Quienes califican en este rango
cuentan con un nivel normal de necesidad de logro, son capaces de hacer de lado el trabajo en la bsqueda del placer o la
recreacin; son moderadamente bien organizados y bastante confiables, y tienen una disciplina personal que se ubica en el
promedio.
In te rp re taci n deta lla d a: asp ecto s de N, E, A, A g y Es
Cada uno de los cinco factores abarca muchos otros rasgos especficos, o aspectos. El NEO-PI-R mide seis facetas en cada
uno de los cinco factores. Un examen de las puntuaciones de los aspectos ofrece una imagen ms detallada de la forma
distintiva en que se ven estos factores en esta persona.
N e u ro ticism o
Este individuo es ansioso, en general aprehensivo y tiende a preocuparse. En ocasiones se molesta con los dems y se
muestra propenso a sentirse triste, solo y desalentado. La vergenza o la tim idez para enfrentar a los extraos no es un
problema para l. Reporta que no controla muy bien sus impulsos y deseos, pero que puede manejar el estrs tan bien como
la mayora de la gente.

F ig u ra 3 -2 1 . E xtractos de un inform e narra tivo del N E O P l-R .

Normas de las pruebas

presentado ofrece una idea de tal reporte. Ntese que


el informe empieza con las puntuaciones normaliza
das, puntuaciones T en este caso; luego procede a in
terpretar estas puntuaciones.
La figura 3-22 proviene de la prueba STAR Math,
una prueba de desempeo en matemticas adaptada
por computadora para los grados 1 a 12. Este informe
empieza tambin con puntuaciones normalizadas, que
en este caso incluyen una puntuacin estndar (PE),
un equivalente de grado (EG), un rango percentilar
(RP) y un Rango del RP, as como un equivalente de
curva normal (ECN). El reporte interpreta el desem

peo del estudiante y hace recomendaciones relacio


nadas con la instruccin; adems, combina elemen
tos de interpretacin referidos a normas y criterios.

Efecto Barnum
Al evaluar los informes narrativos de las puntuacio
nes de las pruebas, se debe estar alerta en no incurrir
en el efecto Barnum, el cual recibe su nombre en ho
nor del promotor de circo, P. T. Barnum, reconocido
por su capacidad para hacer que la gente creyera (y

Informe de diagnstico de Melissa Barrett


STAR Math : Mircoles, 09/09/99,10:31 a. m.
Fecha de la prueba: 09/09/99
Gregory Middle School
C lase: m a te m tica s 9 para s p tim o grado
G rado: 7

M aestro: Robert W illiam s


Id:

Este reporte presenta informacin de diagnstico sobre las habilidades generales del estudiante en matemticas, con base en su desempeo
en una prueba STAR Math.

PE

EG

RP

Rango
RP

667

5.0

18

RP y Rango RP

Por debajo
del promedio

p,o|Md|0
,

11-26

50

Por encima
del promedio
99

ECN

30.7

Estas puntuaciones indican que es probable que Melissa domine los hechos matemticos bsicos de las cuatro operacio
nes. Es razonablemente competente en la reagrupacin de las combinaciones de nmeros enteros ms difciles y capta
bien el sistema decimal de nmeros enteros. Melissa quiz an no domine conceptos y operaciones con fracciones y
decimales, pero est preparada para trabajar en este mbito con intensidad.
Para un crecimiento ptimo en matemticas, Melissa necesita:
Mantener la competencia con los conceptos y las operaciones de nmeros enteros, mediante prctica peridica.
Recibir instruccin minuciosa en los conceptos de fracciones y decimales, desarrollar una comprensin conceptual
mediante el uso de modelos manipulativos y concretos.
Practicar suma, resta, multiplicacin y divisin de fracciones y decimales.
Relacionar operaciones simples y problemas de palabras con modelos concretos.
Empezar a trabajar con operaciones ms difciles que involucren fracciones y decimales.
Las habilidades matemticas de esta estudiante se encuentran por debajo del promedio de su grado. M elissa tal vez se
beneficie si cuenta con ms tiempo del que a diario suele tener en instruccin de matemticas. Quiz tam bin necesite
ms tiempo con las representaciones concretas de conceptos y procesos matemticos. Se recomienda asegurarse de que
Melissa alcance un buen nivel en matemticas y luego vea material nuevo; evitar la repeticin innecesaria de operaciones
y conceptos matemticos simples.
Si con Melissa se emplea el software de manejo de matemticas Accelerated Math , asgnesele al 4 o o 5o grado de
Library. Pueden presentrsele los primeros objetivos del 4 o grado de Library en la modalidad de diagnstico. Si Melissa
domina estos objetivos, debe pasrsele de inmediato al 5o grado de Library; en caso contrario, debe trabajar en el 4o grado
de Library. Repita los objetivos de los grados 4o o 5 o si es necesario, hasta que ella sienta confianza con el material.

Figura 3 -2 2 . Inform e narrativo com pleto de STAR M ath. A breviaturas; ECN, equivalente de curva norm a l; EG, equivalente de
grado; PE, pun tua ci n estndar; RP, rango percentilar.

(Captulo 3)

74 8 Pruebas psicolgicas. Una introduccin prctica

comprara) cualquier cosa. En lo que atae a las prue


bas psicolgicas, el efecto Barnum tiene que ver con
la tendencia de la gente a creer en declaraciones gran
dilocuentes que quiz sean verdaderas sobre cualquier
persona, pero que carecen de informacin especfica
y singular derivada de una prueba. Considrense estas
declaraciones, supuestamente basadas en una prueba
de personalidad:
Sus puntuaciones indican que con algunos grupos,
usted puede ser muy extrovertido; sin embargo, en
ocasiones desea ser usted mismo.
8 La combinacin de las primeras tres escalas sea
la que normalmente puede controlar su tempera
mento, aunque a veces hierve por dentro.
Segn esta prueba, hay ocasiones en que usted con
sidera injusto que las personas se aprovechen unas
de otras.
Ahora obsrvense estas declaraciones que se supone
estn basadas en pruebas de capacidad mental y apro
vechamiento, aplicadas a un estudiante de enseanza
elemental:
Esta batera de pruebas muestra que Ned no es
igualmente bueno en todas las reas. Su maestro
necesita aprovechar sus fortalezas y al mismo tiem
po motivarlo para que se desempee bien en otras
reas.
8 Los resultados de esta prueba son especialmente
tiles para abordar un caso como el de Abigail, quien
ciertamente puede mejorar de diversas maneras.
Todas las afirmaciones anteriores podran hacerse
en relacin con cualquier persona, no contienen in
formacin que se funde de manera especfica en
los resultados de una prueba, de hecho, podra ela
borarse todo un informe basado en declaraciones
al estilo Barnum. Esta clase de aseveraciones no
son de gran ayuda, los informes narrativos deben
ofrecer datos que caractericen en forma singular al
individuo y que se deriven directamente de los re
sultados de una prueba.

GRUPOS NORMATIVOS

Hasta aqu, todos los flpos de normas tratados se ba


san en grupos normativos. La prueba se aplica al
grupo normativo en lo que se denomina un programa
de normalizacin o programa de estandarizacin. El
valor de las normas de una prueba depende de la na
turaleza de este grupo. El grupo normativo que se
emplea para derivar las normas, independientemente
del tipo de normas derivadas, influye mucho en la in
terpretacin de las puntuaciones de la prueba. En con
secuencia, es importante considerar la clase de grupos
normativos que podran encontrarse.
Los grupos normativos de las pruebas psicolgi
cas muestran una enorme variedad, en tal sentido, re
sulta difcil formular categoras distintivas dentro de
una variedad as. En esta seccin, el autor presentar
un esquema de categorizacin que representa puntos a
lo largo de un continuo y no modelos diferenciados
con claridad. En la prctica, cada quien encontrar ejem
plos en puntos intermedios a lo largo del continuo.

NORMAS NACIONALES
Algunas pruebas aspiran a contar con normas nacio
nales, es decir, normas basadas en un grupo que sea
representativo del segmento de la poblacin del pas
para el cual se ide la prueba. Este segmento poblacional puede estar conformado en su totalidad por
adultos, nios en grados K-12, personas que quieren
ingresar a la universidad o que legalmente sean
invidentes. El grupo o poblacin meta suele defi
nirse junto con la finalidad de la prueba. En el cuadro
3-5 se aprecian declaraciones que aparecen en los
manuales de pruebas, en las que se afirma que los ins
trumentos cuentan con normas representativas a nivel
nacional; comprense con las del cuadro 3-6, en las
cuales se niega que los instrumentos tengan representatividad de algn grupo bien definido.

NORMAS INTERNACIONALES
INTNTELO!...........................................................

Elabore una declaracin al estilo Barnum, en el mbito de la


personalidad, que aplique a casi cualquier persona conoci
da. Habr de empezar con algo como esto: Los resultados
de la prueba demuestran que usted_____________.

En el contexto de los estudios internacionales sobre


desempeo escolar, en los ltimos aos se han creado
normas internacionales, basadas en nios en edad es
colar provenientes de varios pases por lo general
slo de naciones econmicamente avanzadas quie
nes optaron por participar en estos estudios. La ma
yor parte de las interpretaciones se fundan en compa
raciones de puntuaciones totales y en el porcentaje de
alumnos que respondieron correctam ente a los

Normas de las pruebas 75

C uadro 3 -5 . Ejem plos de declaraciones en las que se afirma que los instrum entos
cuentan con norm as representativas de la nacin
Las norm as de la W IS C -lll pre se n ta d as en este m anual se d erivan d e una m uestra de e sta n da riza ci n que es represen
tativa de la p oblacin infantil de EUA. (W echsler, 1991, p. 20)
La m uestra [de la M S C S ] es m uy representativa de la poblacin esta d ou n id en se y corre sp o n de m uy bien a los
parm etros de la p oblacin d e EUA en la m ayor parte de las variables. (Bracken, 1992, p. 15)
"La PPVT-R se e sta n d a riz en una m uestra nacional representativa de nios y jvenes. (D unn, D unn, 1981, p. 35)

reactivos en lo individual, por tanto, poco se utilizan


normas como los rangos de percentil o las puntuacio
nes estndar. Para conocer ejemplos de estas normas
internacionales, consulte el captulo 11.

GRUPOS NORMATIVOS CONVENIENTES

Algunas pruebas aspiran a tener una norma nacional,


pero no simulan contar en realidad con tal norma si no
la tienen; ms bien, poseen normas basadas en uno o
varios grupos convenientes, de los que con facilidad se
puede disponer para evaluacin. Con frecuencia, tales
grupos provienen de un solo lugar geogrfico, son un
tanto homogneos en cuanto a antecedentes culturales
y quiz estn limitados en trminos de rango de edad,
nivel educativo y otras variables importantes.
Algunas pruebas presentarn varias normas di
ferentes basadas en distintos grupos, por ejemplo,
una prueba de autoconcepto tal vez presente una
norma basada en 250 pupilos de octavo grado en una
ciudad del noroeste, otra norma basada en 150 per
sonas de entre 15 y 18 aos de edad canalizadas para
asesora psicolgica y otra norma basada en 200 adul
tos que participaron en una encuesta de actitudes del
consumidor.
Al menos, el usuario de la prueba confa en que
el manual del instrumento cuente con una descrip
cin franca y cuidadosa de las caractersticas de estos
grupos normativos ad hoc\ muchas veces ni siquiera
de eso se dispone. Las normas basadas en estos gru
pos convenientes deben interpretarse con sumo cui
dado, el usuario de la prueba se abstendr de suponer
que tales normas pueden usarse como sustituto de una
norma nacional o de una norma de subgrupo definida
de manera clara.

NORMAS DE LOS USUARIOS


En algunas pruebas se emplean lo que ha dado en
denominarse normas de usuario, las cuales se basan
en cualquier grupo que en realidad se somete a la prue
ba, por lo general dentro de cierto periodo especfico.
Conforme a nuevos grupos se les administra la prue
ba, la editorial agrega estos casos a la base de datos
normativos.5 Las normas del rango percentilar en
la SAT son normas de usuario (vase el captulo 9,
p. 270) y se basan en todos los estudiantes que resol
vieron la prueba en el ao ms reciente; las normas de
las Major Field Tests (Pruebas de Campo de las Prin
cipales Asignaturas) (vase el captulo 11, p. 325) se
basan en todos los individuos que se sometieron a la
prueba en un periodo de tres aos.
Con las normas de usuario no hay un intento a
priori por asegurar que el grupo es representativo de
alguna poblacin bien definida. Las normas de usua
rio son, en realidad, una modalidad de norma conve
niente; como ya se seal, se confa en que estn
acompaadas de una descripcin detallada.

NORMAS DE SUBGRUPOS
Algunas pruebas ofrecen normas de subgrupos. Los
subgrupos se toman del grupo normativo en su totali
dad, por ejemplo, tal vez se proporcionen normas se
paradas por sexo, raza, grupo socioeconmico, grupo
ocupacional o regin geogrfica.
5En consecuencia, este tipo de norma suele encontrarse slo
en casos en los cuales la editorial que publica la prueba,
califica todas o al menos una fraccin sustancial de las
pruebas aplicadas.

Cuadro 3 -6 . Ejem plos de declaraciones en las que no se afirma representatividad


Es im portante que las instituciones recuerden que los datos de esta G ua provienen de los usuarios [...] Las instituciones
incluidas en los datos de ca d a prueba no representan proporcionalm ente a los diversos tipos d e instituciones de educacin
superior; se trata de lo s b achilleratos y universidades que han presentado las M a jor Field Tests. (ETS, 1997, p. 3)
"Para la p untuacin to ta l, la m uestra norm ativa con sisti en 1 183 n io s en edad e sco lar d e u n a e scu e la pblica en un
pequeo pueblo d e P ennsylvania [...] [los datos n orm ativos] tal ve z cu e nten con una ca p acid a d de g eneralizacin
limitada. (Piers, 1996, p. 50)

(Captulo 3)

76 Pruebas psicolgicas. Una introduccin prctica

Las normas de subgrupos tal vez slo sean tiles


si hay diferencias sustanciales entre los subgrupos
en la variable que mide la prueba, si stos no difieren en
la variable, entonces dichas normas no divergirn de
la norma basada en el grupo total.
Dependiendo del objetivo de la evaluacin psicomtrica, es posible preferir usar slo una norma de
grupo total o slo una norma de subgrupo. En mu
chas circunstancias, el empleo tanto de una norma de
grupo total como de una norma de subgrupo mejora
r la interpretacin de la prueba. Por ejemplo, puede
resultar til el saber que la puntuacin de Zeke se en
cuentra en el percentil 60 en la norma nacional esta
dounidense, pero en el percentil 30 para las personas
de su grupo ocupacional.

quiz resulte engaoso; por ejemplo, en la situacin


de evaluacin escolar antes sealada, el estudiante
comn en cada grado estar en la norma, lo cual no
es muy ilustrativo, ya>que es cierto por definicin; en
una norma local es posible determinar si el individuo
comn est por debajo o por encima del promedio, en
trminos de cierto marco de referencia externo.
La figura-3-23 ofrece un ejemplo, donde el gru
po local est ligeramente por encima de la norma na
cional, una puntuacin natural de X se ubica en el
percentil 55 en las normas nacionales, pero en el per
centil 45 en la norma local. Diferencias mucho mayo
res se observarn cuando el grupo local est muy por
encima o muy por debajo del promedio.

NORMAS INSTITUCIONALES
NORMAS LOCALES
Una escuela utiliza las MetropolitanAchievementTest,
las puntuaciones de sus alumnos se informan en tr
minos de normas nacionales; adems, la escuela pre
para una distribucin de las puntuaciones de sus
propios estudiantes e interpreta la puntuacin de cada
pupilo comparndolas con las de sus otros alumnos.
Esto se denomina norma local, mismas que casi siem
pre se expresan como percentiles.
Considrese otro ejemplo. Una empresa utiliza
una prueba de aptitud cuantitativa para seleccionar a
oficinistas, cada ao evala a 200 solicitantes a los
puestos. Aunque hay normas nacionales sobre la prue
ba, la empresa se vale de los 200 solicitantes que so
mete a prueba para desarrollar una norma local.
Las normas locales pueden ser tiles para ciertos
fines de interpretacin, una ventaja es que el interesa
do en verdad conoce las caractersticas del grupo nor
mativo, ya que en rigor son las personas que estn en
la situacin local. Por supuesto, en una norma local,
el individuo comn se ubicar en el promedio, esto

Algunas pruebas, sobre todo las de aprovechamiento,


ofrecen normas basadas tanto en instituciones como en
individuos. Las normas institucionales se sustentan
en promedios de individuos dentro de las instituciones,
por ejemplo, se aplica una prueba a 5 000 estudiantes
en 200 universidades, se determinan las puntuaciones
promedio de cada una de las 200 universidades, se ob
tiene una distribucin de frecuencia de estos prome
dios y se crea una norma, por lo general una norma
percentilar, para los promedios. Esta es una norma
institucional, podra denominarse norma escolar, de
grupo o alguna otra designacin semejante.
Por lo comn, las distribuciones de las puntua
ciones individuales y los promedios de los grupos
contarn con casi el mismo centro, pero las puntua
ciones individuales sern sustancialmente ms varia
das que los promedios grupales. En consecuencia, una
determinada puntuacin natural, salvo a la mitad de
la distribucin, estar ms desviada en la norma

Resumen de puntos clave 3 -5

Principales tipos de grupos normativos

N orm as nacion a les

N orm as in te rn a cio n a le s

G rupos n orm a tivo s convenientes

N orm as de u suario

N orm as d e su b g ru p o s

N o rm a s lo ca le s

N orm as institu cio n ale s

Fig ura 3 -2 3 . E jem plo de com paracin de norm a s nacional


y local.

Normas de las pruebas 77

institucional que en las de los individuos. Las pun


tuaciones por encima del promedio sern muy supe
riores en la norma institucional que en la individual y
a la inversa, en el caso de las puntuaciones por debajo
del promedio. Las diferencias pueden ser asombro
sas. En la figura 3-24 se aprecia una comparacin de
normas individuales e institucionales; se trata slo de
un ejemplo. El grado de traslape real entre los dos
tipos de normas variar en funcin de las diferentes
pruebas y grupos normativos.
Si no se distingue con cuidado entre normas indi
viduales e institucionales, se generar ms confusin.
Considrese, por ejemplo, la afirmacin siguiente: La
puntuacin del sudoeste se encuentra en el percentil 95
en las normas nacionales. Muchas personas interpre
taran esto en el sentido de que el estudiante comn en
el sudoeste obtiene calificaciones mejores que 95% de
los estudiantes del pas. No obstante, ese percentil 95
se basa en normas institucionales, bien puede ser que
el estudiante comn del sudoeste haya obtenido una
calificacin mejor al exclusivo 70% de los estudiantes
de la nacin.

INTERPRETACIN REFERIDA AL CRITERIO


Para ilustrar este tema, imagine que a un grupo de
adultos se le aplica una prueba de 50 reactivos, para
evaluar su capacidad aritmtica bsica. La prueba in
cluye reactivos como 7 x 9 = _____ , 417 + 236 =
_____ y 2596 - 1688 = ______. Un individuo realiza
correctamente 30 preguntas (60%); es posible que ese
desempeo un maestro o padreTo juzgue insatisfac
torio. Esta es una muestra de interpretacin referida
Norm a institucional

= %l 95 en ei norma
institucional
F ig u r a 3 - 2 4 . C o m p a ra c i n d e n o rm a s in d iv id u a le s e
institucionales.

al criterio sobre el desempeo en la prueba. Al emitir


el juicio de que 60% de los reactivos correctos fue
insatisfactorio, no hubo referencia a ningn grupo nor
mativo. Por tanto, la interpretacin referida al criterio
entra en contraste con aquella referida a la norma. La
interpretacin referida a la norma fue tema de las pri
meras secciones de este captulo.
Lgs mismas pruebas en ocasiones se caracterizan
como referidas al criterio o a la norma, esta termino
loga es inapropiada. No es la prueba, sino el marco
de referencia para interpretar el desempeo en la prue
ba, lo que se refiere al criterio o a la norma; de hecho,
ambos tipos de interpretacin pueden utilizarse en una
determinada prueba. Por ejemplo, en la prueba del
prrafo anterior, podra sealarse que una puntuacin
natural de 30 ubica al individuo en el percentil 75, de
un grupo normativo que representa en general a la
poblacin adulta estadounidense. En la figura 3-25,
Calvin y su padre tienen cierto desacuerdo acerca de
la interpretacin referida al criterio sobre el desempe
o de Calvin en matemticas. Convendra agregar una
interpretacin referida a la norma en su conversacin.
La interpretacin referida ai criterio es aplicable
slo en ciertos mbitos de contenido debidamente
definidos como aritmtica, ortografa o todas las ha
bilidades necesarias para cierta ocupacin. A menu
do se hace una interpretacin con respecto al criterio
de las puntuaciones en los exmenes para obtener una
licencia profesional y a los exmenes de competen
cias mnimas para graduarse del bachillerato. (En la
seccin sobre puntuaciones de corte del captulo 11,
se examina este tema.) Cuanto menos definido est el
mbito, ms difcil se torna la interpretacin referida
al criterio. El mtodo de evaluacin psicomtrica tam
bin adquiere importancia cuando se aplica una inter
pretacin referida al criterio; por ejem plo, en la
referida prueba de aritmtica, la interpretacin del
desempeo puede diferir de manera sustancial, depen
diendo de si los reactivos de la prueba fueron de res
puesta libre o de opcin mltiple, si se utiliz una
calculadora y si se asign un lmite de tiempo. Cmo
cambiara la interpretacin del 60% correcto si se
hubiera permitido un tiempo ilimitado o si cada reac
tivo se hubiese completado en 10 segundos? La inter
pretacin referida al criterio a menudo parece una idea
simple, pero se vuelve problemtica cuando se la exa
mina ms de cerca.
La interpretacin referida al criterio suele em
plearse en los exmenes resueltos en el saln de cla
ses. El esquema de clasificacin familiar 90% es A,
80% es B...menos de 60% es reprobado constituye
un ejemplo de interpretacin referida al criterio. El
mbito de contenido puede definirse como lo que el
maestro abord en clase o todo lo que aparece en
los captulos 1 a 4 del libro de texto . Eljuicio consis
te en que los estudiantes deben haber aprendido todo

(Captulo 3)

78 Pruebas psicolgicas. Una introduccin prctica

F ig u ra 3 -2 5 . C alvin y su p a d re in te ntan interpretar ei desem peo d e C alvin.

ese material. Luego, se aplica el esquema de clasifi


cacin familiar. Por supuesto, puede trazarse una cur
va con las calificaciones de modo que la puntuacin
promedio sea C, etc. Este torcimiento es en reali
dad un tipo de interpretacin referida a la norma, en
concreto, la aplicacin de una norma local.

EL GRUPO DE ESTANDARIZACIN:
CMO DETERMINAR SU UTILIDAD
Se prueba a los individuos del grupo normativo en lo
que se denomina un program a de normalizacin o
programa de estandarizacin, que de manera comn
constituye una de las ltimas etapas en la elaboracin
de pruebas. En el captulo 6, se describe con mayor
detalle el proceso completo de desarrollo de pruebas;
aqu se aborda la interrogante de cmo determinar si
el programa de estandarizacin es adecuado. El uso
competente de pruebas psicolgicas exige no slo
conocimientos sobre estos tipos de normas percen
tiles, puntuaciones estndar y dems, sino tambin
la capacidad para juzgar la utilidad de las normas.
Utilidad aqu significa hasta qu punto las normas
ofrecen un marco de referencia significativo para la
interpretacin de las pruebas; en casi todos los casos
esto significa contar con una norma que sea 1) estable
y 2) representativa de cierta poblacin bien definida.
De modo que hay dos aspectos; la estabilidad y la
representatividad.
La estabilidad de una norma la determina en gran
medida el tamao del grupo normativo, es decir, la
cantidad de casos en el programa de estandarizacin.
Se trata de un verdadero problema, no se requiere de
muchos casos para lograr una estabilidad estadstica;
varios cientos de casos generarn la suficiente estabi
lidad para la mayor parte de los usos prcticos de las
normas. Considrese la norma en un sistema de pun
tuacin estndar con M = 100 y DE = 15; con N= 300,

el error estndar de la media es menos de un punto y el


intervalo de confianza de 95% es +/-1.7 puntos, que
implica una buena estabilidad. En la prctica, las nor
mas de muchas pruebas se basan en miles de casos.
Al considerar la cantidad de casos en un grupo
normativo, es necesario determinar el tamao del gru
po en el que se basa una determinada norma. La canti
dad total de casos agregados sobre varios grupos
normativos no es la cantidad crucial. Por ejemplo, una
prueba puede presumir que sus normas se basan en cerca
de 1 000 casos pero si, por ejemplo, las normas reales
se dan separadamente por gnero y grado, sobre 10
grados, en realidad hay 20 grupos normativos, cada uno
con tan solo unos 50 casos. El nmero importante aqu
para determinar la estabilidad es 50 y no I 000.
Como ya se indic, la estabilidad pocas veces es
un problema y, en cualquier caso, se determina con
facilidad; no obstante, la estabilidad no garantiza la
representatividad. La diferencia entre estabilidad y
representatividad es una de las distinciones ms im
portantes que debe aprenderse sobre las normas. Es
posible contar con grupos normativos muy grandes,
que generen normas muy estables, que sean muy poco
representativos de la poblacin meta de una prueba.
Cmo se determina la representatividad de un
grupo normativo? Formular una respuesta a esta pregunta
depende de los planteamientos que haga el autor de la
prueba sobre las normas. Hay dos posibilidades, una se
refiere a que el autor del instrumento quiz asegure que
las normas son representativas de una determinada po
blacin; por ejemplo, el planteamiento acaso sea que el
grupo normativo es representativo de todos los adultos
de EUA entre 20 y 80 aos de edad o de todos los estu
diantes de sexto grado o de todas las mujeres que cursan
carreras de cuatro aos en las universidades. La otra po
sibilidad consiste en que tal vez el autor no plantee que
las normas sean representativas de ninguna poblacin
en particular, sino que slo presente la muestra normati
va como norma de grupo conveniente o de usuario.

- t - 3 - iO

1 * io
Normas de las pruebas 79

Cuadro 3-7. Tipos de inform acin necesaria


para juzgar la utilidad de un grupo norm ativo
E dad
G nero
Nivel de capacidad
Nivel educativo

G rupos raciales o tnicos


C ondicin socioeconm ica
- o '^ T lf lg i n geogrfica
Tam ao de la ciudad

Los reportes de los e studios de norm alizacin deben


incluir una e sp ecifica cin p recisa d e la poblacin que
se m uestreo, lo s p rocedim ientos de m uestreo y las
tasas de participa ci n, cu a lqu ie r ponderacin d e la
m uestra, las fe ch a s d e la evaluacin psicom trlca y
estadsticas descriptivas. La inform acin ofrecida debe
s e r s uficiente p ara p e rm itir q ue los usuarios juzguen
lo a propiado de las n orm a s para interp re ta r las p u n
tuaciones de los e xam inados locales. La docum e n ta
cin tcnica d ebe in dica r la precisin de las norm as
m ism as. E stndares...
(AE R A /A PA /N C M E , 1999, p. 55)

Cuando se plantea que un grupo normativo es repre


sentativo de una determinada poblacin, es responsa
bilidad del autor de la prueba ofrecer la informacin
suficiente que justifique el planteamiento. El usuario
necesita estar especialmente alerta a planteamientos
en el sentido de que el grupo normativo es represen
tativo cuando slo se presenta informacin mnima
sobre la correspondencia entre el grupo normativo y
la poblacin en caractersticas importantes. Por ejem
plo, mostrar tan solo que un grupo normativo para
una prueba de inteligencia corresponde a la pobla
cin nacional en trminos de edad y gnero es insufi
ciente, pues qu ocurre con la condicin socioeco
nmica y el nivel de consecucin educativa de los
casos en el grupo normativo?
Aun cuando un grupo normativo muestre una bue
na correspondencia con una poblacin meta, en cuanto
a las caractersticas importantes, hay dos problemas que
vician el proceso de establecimiento de una norma ade
cuada. El primero es el efecto de la no participacin,
mismo que se deriva del hecho de que la participacin
en un programa de normalizacin casi siempre es vo
luntaria, ya sea para el individuo o para la organizacin
a la cual pertenece. Qu clase de individuos u organi
zaciones renuncian a participar? Cules son sus ca
ractersticas? Qu efecto podra ejercer su no partici
pacin en las normas? Las ms de las veces no se cuenta
con buenas respuestas a estas interrogantes.
En segundo lugar, los programas de normalizacin
son programas de investigacin y no usos comunes de
las pruebas; los participantes suelen saberlo. En tales
circunstancias, resulta difcil asegurar que los niveles
de motivacin de los participantes sean iguales a lo s^
que seran en el caso del uso comn de la prueba. Como

mo

Considrese el modo de juzgar la representan vidad


del grupo normativo en el primer caso, en el cual el
planteamiento es que el grupo normativo es represen
tativo de una poblacin meta. Desde una perspectiva,
determinar la calidad de un grupo normativo, cuya meta
consiste en ser representativo de una poblacin, es un
asunto de teora de muestreo. El lector, sin duda, estar
familiarizado con las tcnicas de muestreo aleatorio que
se utilizan en los cursos de introduccin a la estadsti
ca; empero, el muestreo aleatorio simple pocas veces
se utiliza en la prctica para normar pruebas. Con fre
cuencia se emplea alguna forma de muestreo de gru
pos estratificados en los programas ms complejos, por
ejemplo, en el desarrollo de normas nacionales o inter
nacionales. Los temas relacionados con el muestreo son
complicados por el hecho de que la participacin en el
programa de normalizacin suele ser voluntaria. Por
tanto, en la prctica, en lugar de centrar la atencin en
las nociones de la teora de muestreo, este texto se en
focar en la evidencia relacionada con la correspon
dencia entre el grupo normativo y la poblacin meta,
en trminos de caractersticas importantes. Las carac
tersticas importantes en este contexto son peculiari
dades que se relacionan con la variable que se somete a
prueba. Varias caractersticas demogrficas se utilizan
con frecuencia para demostrar la correspondencia en
tre el grupo normativo y la poblacin meta. Las carac
tersticas que por lo comn se utilizan son edad, gnero,
clasificacin racial o tnica, condicin socioeconmica
y regin geogrfica. Tambin puede recurrirse al des
empeo en otras pruebas que en s cuentan con normas
debidamente documentadas. Debe demostrarse que el
grupo normativo corresponde bien, en trminos razo
nables, a la poblacin meta en tales caractersticas.
Con frecuencia, cuando no hay correspondencia
entre el grupo normativo y la poblacin meta, los ca
sos del grupo normativo se ponderan a fin de mejo
rarla. Por ejemplo, se supone que la poblacin tiene
50% de varones y 50% de mujeres, en tanto que el
grupo normativo cuenta con 40% de hombres y 60%
de mujeres. Asignar una ponderacin de l .5 a cada
varn (o .67 a cada mujer) generar un grupo norma
tivo ponderado con la divisin de 50-50 necesaria en
cuanto a gnero.
En las figuras 3-26 y 3-27 aparecen cuadros que
ilustran la correspondencia entre grupos normativos y
estadsticas nacionales de dos pruebas, en las que se
plantea que poseen normas representativas de pobla
ciones nacionales (estadounidenses). Las pruebas son
la Otis-Lennon School Abilty Test, sptima edicin, y la
Peabody Picture Vocabulary Test-III (Prueba Peabody
de Vocabulario con Ilustraciones, tercera edicin). Los
manuales de los instrumentos contienen informacin
adicional sobre los grupos normativos, en donde se ofre
ce una idea acerca de la informacin que podra hallar
el usuario de las pruebas.

( f U.NAM."
-

SO Pruebas psicolgicas. Una introduccin prctica

(Captulo 3)

Porcentaje de matrcula
total en escuelas
estadounidenses*

Porcentaje de estudiantes
en el programa
de estandarizacin
Otoo

Prim avera

Regin geogrfica
Noreste 19.6
Regin central
Sur
Oeste

19.6
23.8
24.1
32.4

18.9
24.4
24.7
32.0

19.7
24.6
24.3
31.3

Condicin socioeconmica
Baja
Baja-media
Media
Alta-media
Alta

19.6
21.4
20.8
17.8
20.3

19.6
21.0
21.2
17.8
20.3

19.6
21.4
20.8
17.8
20.3

Urbanidad
Urbana
Suburbana
Rural

26.8
48.0
25.2

26.2
48.0
25.8

26.5
48.0
25.5

Origen tnico
Afroestadounidense
Hispano
Blanco
Asitico
Indgena

16.1
12.7
66.6
3.6
1.1

14.9
12.1
38.7
3.4
0.9

15.4
12.4
66.8
2.9
2.5

0.2
2.1
0.1
0.1
1.9
0.1
1.3
0.7

0.3
2.9
0.2
0.1
0.1
0.1
1.9
0.6

5.0
5.3

5.2
5.1

Condicin de discapacidad
Perturbacin emocional
Discapacidad de aprendizaje
Discapacidad mental
Deterioro auditivo
Deterioro visual
Deterioro ortopdico
Soltura limitada en ingls
Otra
Escuelas no pblicas
Catlica
Privada

5.4
4.9

* National Center for Education Statistics. United States Department ot Education. 1992-1993.
F ig u ra 3 -2 6 . Inform acin d em o g rfica p ara el program a de e standarizacin de la O tis-Lennon School A bility Test, sptim a
e dicin.

sucede con la no participacin, a menudo se desconoce


el efecto que los niveles de motivacin ejercen en las
normas. Ahora considrese el segundo caso: cuando
no se plantea que el grupo normativo es representativo
de una determinada poblacin. Qu criterios se em
plean entonces para juzgar la calidad de las normas?
En esencia, se invierte el proceso aplicado con anterio
ridad. En el primer caso, se contaba con una poblacin
meta y se buscaba demostrar que el grupo normativo
era representativo de esa poblacin; la demostracin
dependa del uso de la informacin sobre caractersti
cas importantes. En el segundo, se esperaba contar con
informacin adecuada sobre el grupo normativo a fin

de proyectar a qu poblacin podra reflejar dicho gru


po. Por ejemplo, si al tener normas de usuario para una
prueba de aprovechamiento que se utiliza en las uni
versidades, se quisiera informacin sobre las universi
dades, como sus dimensiones, lasas de aceptacin y
retencin, nfasis curricular, composicin de gnero
y racial, etc. Con base en esta informacin descriptiva,
sena factible inferir que las normas ofrecen una buena
representacin de las universidades de artes pequeas,
selectivas, liberales, pero no de las universidades gran
des, urbanas, de admisin abierta. Si se contase con
normas convenientes para una prueba de autoconcepto
para estudiantes de bachillerato, se querra conocer el

Normas de las pruebas 81

PPVT-III

M uestra de estandarizacin, por grupo de edad y nivel educativo, en com paracin con la
poblacin de EUA
N ivel educativo del padre o el e xa m in a d o *
G raduado
d e bachillerato

G rado 1 1 o m enos
Muestra
PPVT-III

Pobl.
EUAV

Uno a tres aos e n la


universidad o escuela
norm al

M uestra
P PVT-III

Pobl.
EUA6

M uestra
PPVT-III

C uatro o m s aos
en la universidad

Pobl.
EUAb

M uestra
PPVT-III

Pobl.
EU A 6

G rupo
de edad

2 -5
6 -9
1 0 -1 3
1 4 -1 8
1 9 -2 4
2 5 -3 0
3 1 -5 0
5 1 -9 0 +

97
102
91
76
31
11
26
31

3.6
3.7
3.3
2.8
1.1
0.4
1.0
1.1

5.5
3.5
3.0
3.0
1.2
0.6
1.1
1.9

199
167
119
128
42
35
86
78

7.3
6.1
4.4
4.7
1.5
1.3
3.2
2.9

8.0
6.3
4.7
4.9
1.8
1.6
3.1
2.7

262
147
120
128
50
43
54
48

9.6
5.4
4.4
4.7
1.8
1.6
2.0
1.8

8.5
5.9
4.9
4.6
1.7
1.3
2.5
1.4

142
84
70
68
27
36
84
43

5.2
3.1
2.6
2.5
1.0
1.3
3.1
1.6

3.6
2.6
2.1
2.1
0.8
1.1
2 .5
1.3

M uestra
total

465

17.1

19.9

854

31.3

33.1

852

31.3

31.0

554

20.3

16.0

a Para los exam inados de 24 aos de edad o menores, si no se inform ei nivel educativo de am bos padres o
tutores, se utiliz ei nivei educativo de uno de ellos.
b Datos de la poblacin de EUA provenientes de la Current Population Survey 1994 (Encuesta Poblacional
Actual de 1994) [archivo de datos legible en mquina] realizada por la Oficina del censo para la O ficina de
estadsticas laborales. Los porcentajes de la poblacin estadounidense de la muestra total son prom edios de
los porcentajes del censo de cada uno de los grupos de edad, ponderados por el tamao de la m uestra de
cada grupo de edad en la PPVT-III.

E d ito ria l E ! m a n u a l m o d e r n o F o to c o p ia r sin au to riz a c i n

Figura 3 -2 7 . Inform acin dem ogrfica p ara el p rogram a de estandarizacin de la P eabody P icture Vocabulary T est-lll.

nivel de capacidad, el gnero, la clasificacin tnica o


racial y la condicin socioeconmica de los participan
tes. Con base en esta informacin, podra llegarse a la
conclusin de que las normas quiz sean representati
vas de las escuelas de baja condicin socioeconmica
muy urbanizadas, pero que desde luego no constituyen
un grupo representativo a nivel nacional.
En el primer o segundo casos, el usuario debe te
ner mucho cuidado con las normas si pretende hacer
una derivacin de la prueba original. Sea el caso de
alguien que desea crear una forma resumida de una
prueba originalmente ms larga, o bien que desea apli
car a manera de prueba aislada los 30 reactivos que
miden un determinado rasgo de una prueba de perso
nalidad de 300 reactivos que mide 10 rasgos. No puede
darse por hecho que las normas del instrumento origi
nal sean aplicables a estos trabajos derivados, el cam
bio de contexto llega a ejercer efectos impredecibles
en las respuestas de los examinados a los reactivos. En
estas situaciones, la aplicabilidad de las normas origi
nales debe demostrarse empricamente.
C u an d o se crean form as derivadas de las pruebas,
to m a n do para e llo un subconjunto de los reactivos de

una de las fo rm a s d e la p ru e b a existente o reorde


nando sus reactivos, y hay una razn de peso para
considerar que los efectos del contexto de los reactivos
pueden in flu ir en las puntua cio n es de estas form as,
deben o frecerse e videncias d e que no se g enera una
distorsin indebida d e las norm a s en las versiones
diferentes o en las vin cu lacio n e s de las relaciones
que guardan las p un tua cio n es entre s. Estndares...
(AE R A /A P A /N C M E , 1999, p. 58)

RESUMEN

1. La puntuacin natural con frecuencia es el re


sultado ms inmediato de una prueba. Las pun
tuaciones naturales comunes son la cantidad de
respuestas correctas en las pruebas cognitivas y
la cantidad de respuestas que tienen una deter
minada direccin en las pruebas no cognitivas.
2. Las pruebas calificadas segn los mtodos TRI,
que generan una puntuacin theta (8), conside-

82

Pruebas psicolgicas. Una introduccin prctica

i.is

>

ran el nivel de dificultad de los reactivos y en


ocasiones, las pautas de respuesta.
3. La distribucin de las puntuaciones naturales en
un grupo normativo constituye la base para convgjtjr^mntuaciones naturales en puntuaciones nor
malizadas. Las puntuaciones normalizadas ayu
dan a dar sentido a las puntuaciones naturales.
4. Para entender las normas de las pruebas, es ne
cesario familiarizarse con los temas siguientes
de la estadstica elemental: distribuciones de fre
cuencia y formas de las distribuciones, medidas
. de tendencia central y variabilidad, y puntuacio
nes z dentro de la distribucin normal.
5. Los rangos de percentil indican el porcentaje de
individuos en el grupo normativo que obtuvie
ron una puntuacin por debajo de una determi
nada puntuacin natural.
6. Las puntuaciones estndar son normas que con
vierten la distribucin de las puntuaciones natu
rales en una distribucin con una media y una
desviacin estndar nuevas convenientes. Hay
varios sistemas de puntuacin estndar de uso
generalizado.
7. Las normas de desarrollo expresan el desempe
o en trminos de la puntuacin que es comn
de un nivel de edad o de grado. Las normas de
desarrollo ms habituales son las edades menta
les y los equivalentes de grado.
8. Cada uno de los principales tipos de normas po
see ventajas y desventajas.
_ 9. La calidad de la norma depende de las caracte
rsticas del grupo normativo. El hecho ms im
portante es el grado de representatividad del gru
po normativo en relacin con una poblacin de
bidamente definida.
10. Las modalidades comunes de grupos normati
vos son nacional, conveniente, de usuario y lo
cal. Son contadas las pruebas que tienen normas
internacionales. Algunas pruebas tambin con
tienen normas de subgrupo y normas institu
cionales.
11. En algunas pruebas puede recurrirse a una inter
pretacin de las puntuaciones referida al criterio
y no referida a la norma. La interpretacin refe
rida al criterio es un juicio un tanto directo sobre
la calidad del desempeo en la prueba sin refe
rencia a ningn grupo normativo. Ambos tipos
de interpretacin pueden utilizase con algunas
pruebas.
12. Es importante poder juzgar la utilidad de un gru
po normativo. La informacin sobre las caracte
rsticas del grupo normativo es crucial para emi
tir tales juicios. Al juzgar la utilidad de un grupo
normativo, a menudo conviene comparar al grupo
con una poblacin, en trminos de caractersti
cas como edad, gnero, grupo racial o tnico,

(Captulo 3)

regin geogrfica y rasgos socioeconmicos,


como nivel educativo e ingreso familiar.

TRMINOS CLAVE

cero verdadero
CI de desviacin
constructo
correccin por adivinacin
curtosis
curva normal
desviacin estndar
distribucin de frecuencia
edad cronolgica
edad menta]
efecto Bamum
equivalente de curva normal
equivalente de edad
equivalente de grado
escala de intervalo
escala de razn
escala nominal
escala ordinal
estadstica descriptiva
estadstica inferencial
estandarizacin
estanina
estn
grupo conveniente
grupo normativo
histograma de frecuencia
informe narrativo
media
mediana
moda
norma de desarrollo
norma institucional
norma local
norma nacional
normas de subgrupo
normas de usuario
percentil
polgono de frecuencia
puntuacin de porcentaje correcto
puntuacin estndar normalizada
puntuacin ipsativa
puntuacin natural
puntuacin normalizada
puntuacin T
puntuacin z
puntuaciones escalares
rango
razn de CI

Normas de las pruebas 83

rango percentilar
rango semiintercuartilar
referido a la norma
referido al criterio
sesgo
tendencia central
theta
transformacin lineal
transformacin no lineal
variabilidad
variable
varianza

C l W e c h s le r - ________
E sta n in a = _________
P u n tu a c i n z = _________

6. Con ayuda del cuadro 3-1, llene los valores exac


tos para los mismos casos (Nota: para el CI
Wechsler, DE = 15, para el CI Otis-Lennon, DE
= 16).
P u n tu a c i n z = + 1.0
P e rce n til = 75
P u n tu a c i n 7 = 3 0
P e rce n til = ________
P u n tu a c i n z = ________
P e rce n til = _________

EJERCICIOS

E C N = ________
O tis -L e n n o n = ________

1. Con ayuda de los datos de la figura 3-1, elabo


re una distribucin de frecuencia con un inter
valo de 5 puntos, empezando con 65-69.
2. Calcule la media, la mediana y la desviacin
estndar de estas puntuaciones:
5, 3, 6, 8, 8
M=

____

Mdn = _______
D E = _______

3. De ser factible, registre la estatura de todos en


su saln de clases. Elabore una distribucin de
frecuencia. Qu forma adquiere la distribucin
en comparacin con los modelos presentados
en la figura 3-6? Se le sugiere realizar el mis
mo ejercicio para el pulso.
4. Aplique la correccin por adivinacin a estos
casos. Esto es para una prueba de 50 reactivos
en la que cada reactivo tiene cuatro opciones.
Caso Correcto
A
40
B
40
C
30
D
30

Incorrecto
10
0
10
20

O m isin

Puntuacin corregida
0
________

10
10
0

5. Con ayuda de la figura 3-10, calcule los valo


res faltantes.
P u n tu a ci n z = + 1.0
P e rce n til = 7 5
P u n tu a c i n T = 30
P erce n til = _________
P u n tu a ci n z = _________
P e rce n til = _________
E C N = _________
O tis -L e n n o n = _________
E sta n in a = _________

E s ta n in a = ________
C l W e c h s le r = _________
E s ta n in a = ________
P u n tu a c i n z = ________

7. Remtase a la figura 3-12, convierta una pun


tuacin natural de 32 al sistema de puntuacin
estndar.
8. Para los datos de la figura 3-12, si la puntuacin
estndar de una persona es de 70, cul es su
puntuacin natural?
9. Para los datos de la figura 3-10, calcule los
percentiles correspondientes a los siguientes
ECN:
ECN
1
25 40 50
65 80 90 99
P e r c e n til_____________________________ __________

10. Con ayuda de la figura 3-16, cul es la edad


mental estimada de una persona cuya puntua
cin natural es de 35?
11. De nuevo con la figura 3-16, cul es la puntua
cin natural estimada de una persona cuya edad
mental es de 5-0?
12. Con ayuda de la figura 3-18, cul es el equiva
lente de grado estimado de un estudiante cuya
puntuacin natural es de 45?
13. Una vez ms con la figura 3-18, cul es la pun
tuacin natural estimada de un estudiante cuyo
equivalente de grado es de 2.0?
14. Utilizar el cuadro 3-4. Qu rango percentilar y
puntuacin estndar (puntuacin T) correspon
de a una puntuacin natural de 65?
15. Idear una serie de clasificaciones que s puedan
utilizar en un informe narrativo por cada decil, es
decir, los percentiles 1-10,11-20,21-30, etc. Las
clasificaciones pueden ser de ms de una palabra.
Para no utilizar la misma clasificacin en forma
reiterada con un determinado decil, ofrezca al

(Captulo 3)

84 Pruebas psicolgicas. Una introduccin prctica

menos dos clasificaciones equivalentes de cada


decil. El programa de cmputo elegir despus
una al azar, para cada caso de ese decil.
G ru p o

C la s ific a c i n

C la s ific a c i n

d e d e c ile s

v e rb a l A

v e rb a l B

1 -1 0
1 1 -2 0
2 1 -3 0

_______
_______
_______

_______
_______
_______

3 1 -4 0

______

_______

4 1 -5 0
5 1 -6 0

_______
_______

_______
_______

6 1 -7 0

_______

_______

7 1 -8 0
8 1 -9 0
9 1 -9 9

_______
_______
_______

_______
_______
_______

16. Elabore estructuras de oraciones para un infor


me narrativo que se adecen a las siguientes com
binaciones de puntuaciones de dos pruebas. Cada
examinado contar con dos puntuaciones, una
en la prueba A y la otra en la prueba B. Asegre
se de que las oraciones fluyan de manera ade
cuada.

17. Lea el reporte del NEO PI-R que aparece en la


figura 3-21. Identifique las afirmaciones narra
tivas basadas en normas.
18. Consulte una edicin reciente del Mental Measu
rements Yearbook (Anuario de Mediciones Men
tales), ya sea en su forma impresa o electrnica,
seleccione tres revisiones. Identifique lo que se
alan los revisores sobre a) los tipos de normas
dadas para la prueba y b) la calidad del grupo
normativo.
19. Introduzca los datos del apndice D 1: GPA en la
hoja de clculo de un paquete estadstico, como
el SPSS, SAS o Excel. Aplique el programa para
obtener las medias y desviaciones estndar de
cada una de las variables. Para cualesquiera dos
variables, em plear las distribuciones e
histogramas de frecuencia. Cmo describira las
formas de las distribuciones?

P ru e b a B
% il 25-75

%l < 25

P rueba A

%l > 75
% il 2 5-7 5
% il < 25

%l > 75

X __

Objetivos
1. Definir la confiabilidad segn el uso que se le da al trmino en la psicologa.
2. Actualizar sus conocimientos sobre conceptos estadsticos bsicos relacionados con la correlacin y el
pronstico, incluidos los factores que influyen en la magnitud de las correlaciones.
3. Distinguir entre confiabilidad y validez, entre los diversos usos cotidianos que se dan al trmino
confiabilidad, entre cambio real y funciones temporales, y entre errores constantes y no sistemticos.
4. Identificarlas principales fuentes de inestabilidad o falta de confiabilidad en las puntuaciones de las pruebas.'

E d it o ria l E t m a n u a l m o d e r n o F o to c o p ia r s in

5. Describir los componentes de la teora de la puntuacin verdadera.


6. En cada uno de los mtodos de confiabilidad siguientes, indicarcmo se realiza el estudio y de qu fuente
de inestabilidad o falta de confiabilidad se trata: test-retest, entre calificadores, forma alterna y consisten
cia interna.
7. Definiry calcular el error estndar de medicin y una banda de confianza.
8. Distinguir el error estndar de medicin a partir del error estndar de la media y del error estndar de
estimacin.
9. Definir lo que significa precisin de la medicin en la teora de respuesta al tem (TRI).
10 . Describirlo que busca la teoria de la generalizabilidad.
11. Establecer cmo influyen los factores que afectan el coeficiente de correlacin en los datos de confiabilidad.
12. Ofrecer parmetros para los niveles de confiabilidad aceptables.
85

You might also like