lunes, 16 de agosto de 2010

Nivel de dificultad y poder de discriminación del Examen de Habilidades y Conocimientos Básicos (EXHCOBA)

Resumen


El Examen de Habilidades y Conocimientos Básicos (EXHCOBA) es uno de los pocos exámenes de gran escala en México que ha ido dando a conocer sus estándares de calidad. En este trabajo, se describen los resultados del análisis de reactivos, relativos al nivel de dificultad y poder de discriminación del examen. Los resultados muestran que la mayoría de los reactivos del EXHCOBA tienen una dificultad media y un buen poder discriminativo. Asimismo, se observa que los reactivos que mejor discriminan pertenecen al área de matemáticas y los que poseen menor nivel de discriminación pertenecen al área de ciencias sociales.

Introducción

La evaluación educativa es un proceso que involucra la elaboración, aplicación y análisis de los instrumentos de medición. La función principal de un instrumento de medición educativo, cuando se crea como medida para inferir las capacidades de las personas, es ofrecer información para la correcta toma de decisiones.

Cuando se utilizan instrumentos de gran escala y alto impacto, como en el caso de los exámenes de admisión, es necesario conocer los indicadores técnicos que definen la calidad del instrumento educativo que se emplea. Los exámenes de gran escala son aquellos diseñados para aplicarse en más de un plantel escolar, usualmente en un estado, región o país. Por su dimensión y por el poderoso impacto social que tienen, su elaboración debe ajustarse a rigurosos estándares de calidad (Aiken, 1996).

En 1985, la Asociación Americana de Psicología (APA), en colaboración con la Asociación Americana de Investigación Educativa (AERA) y el Consejo Nacional para la Medición en Educación (NCME), publicó el manual "Estándares para las pruebas educativas y psicológicas”, documento que enfatiza la importancia de tomar en cuenta el bienestar de las personas que hacen una prueba y evitar el mal uso de los instrumentos de evaluación. El seguimiento de estos códigos ayuda a asegurar que los instrumentos psicométricos sean aplicados, calificados e interpretados por personas sensiblemente aptas.

Mientras que, en países como Estados Unidos, es obligatorio que estos criterios de calidad se satisfagan, en México es inexistente esta normatividad.

Por otro lado, el mayor interés que deben tener las instituciones de educación superior (IES) al utilizar exámenes de admisión es asegurar que los lugares disponibles en la institución los ocupen quienes están más capacitados para estudiar una carrera profesional y tengan mayor probabilidad de éxito académico. Sin embargo, hasta hace muy poco tiempo, una práctica común de las IES mexicanas para seleccionar a sus estudiantes (cuando la matrícula se saturaba) era la utilización de exámenes de admisión informales, que eran elaborados por grupos de profesores que impartían clases en cada institución, pudiendo ser o no especialistas en el tema. Por desconocimiento, estos exámenes nunca se ponían en tela de juicio y, por lo tanto, no se validaban ni se estandarizaban. Una excepción a esta regla eran algunas IES privadas (y recientemente algunas públicas) que utilizaban la Prueba de Aptitud Académica (PAA); versión puertorriqueña del Scholastic Aptitud Test (SAT), desarrollada por el College Board de los Estados Unidos de Norteamérica.

Este escenario nacional ha cambiado, recientemente, con la aparición del Centro Nacional de Evaluación de la Educación Superior (CENEVAL), el cual fue creado en 1994 con el propósito de elaborar y administrar exámenes para el ingreso a las instituciones de educación media superior y superior. Asimismo, otras instituciones han trabajado para contar con un examen de ingreso válido, como es el caso la Universidad Autónoma de Baja California (UABC), Universidad Nacional Autónoma de México (UNAM) y la Universidad Autónoma Metropolitana (UAM), por mencionar algunas. Sin embargo, aún existe un gran atraso en materia de evaluación educativa en México lo cual se evidencia por (1) la ausencia de organismos nacionales o regionales que normen sobre los criterios de calidad de las pruebas; (2) la falta de pruebas de calidad de gran escala desarrolladas, estandarizadas y validadas en nuestro país, y (3) la escasez de publicaciones de los indicadores psicométricos que poseen el reducido número de pruebas de gran escala desarrolladas en México.

Una excepción a la regla es el Examen de Habilidades y Conocimientos Básicos (EXHCOBA), el cual se desarrolló, en 1992, por un grupo de investigadores de la UABC y la UNAM, con el propósito de contar con un instrumento para seleccionar a los mejores estudiantes que desean ingresar a la UABC y, hasta donde fuera posible, a otras instituciones de educación superior del país (Backhoff y Tirado, 1992).

Desde su inicio, el EXHCOBA ha venido acumulando evidencias acerca de los diversos indicadores que soportan su calidad técnica; algunos se han publicado en diferentes revistas, tales como la descripción del contenido (Backhoff y Tirado, op. cit.; 1993;1994), estandarización (Larrazolo, 1997a y 1997b), validez predictiva y concurrente (Tirado, Backhoff, Larrazolo y Rosas, 1997), y datos comparativos (Backhoff y Tirado, 1993;1994; y Backhoff, Tirado, Larrazolo y Antillón, 1997). Se han publicado otros indicadores en reportes técnicos o están en proceso como proyectos de tesis de posgrado.

Sin embargo, aún no se realizan o publican todos los estudios que den cuenta de la calidad técnica del EXHCOBA, tales como la validez de contenidos, la validez de constructo, la ausencia de sesgo, la confiabilidad y el análisis de reactivos. Son tres los indicadores que se utilizan para describir las características psicométricas de los reactivos de un test objetivo: su nivel de dificultad, su poder de discriminación y el funcionamiento de sus distractores.

El propósito de este estudio es dar a conocer los resultados de los indicadores psicométricos de los reactivos del EXHCOBA, los relacionados con su nivel de dificultad y poder de discriminación. Se excluye de este trabajo el funcionamiento de sus distractores por lo extenso que representaría ese trabajo.

Para lograr nuestro objetivo, en primer lugar, describiremos lo que en la literatura especializada se entiende técnicamente por dificultad y discriminación de un ítem, así como las formas de calcularlos. Posteriormente, describiremos la metodología empleada en nuestro estudio y los resultados obtenidos, para discutir los resultados encontrados.


Análisis de reactivos

Dificultad. La dificultad de un ítem se entiende como la proporción de personas que responden correctamente un reactivo de una prueba. Entre mayor sea esta proporción, menor será su dificultad. Lo que quiere decir que se trata de una relación inversa: a mayor dificultad del ítem, menor será su índice (Wood, 1960). Para calcular la dificultad de un ítem, se divide simplemente el número de personas que contestó correctamente el ítem entre el número total de personas que contestó el ítem (correcta o incorrectamente). Usualmente, a esta proporción se le denota con una p, e indica la dificultad del ítem (Crocker & Algina, 1986). Se calcula con la siguiente fórmula:

................................................................ (1)

donde: pi = Indice de dificultad del reactivo i

Ai = Número de aciertos en el reactivo i

Ni = Número de aciertos más número de errores en el reactivo i

De acuerdo al manual del EXHCOBA, el nivel medio de dificultad del examen debe oscilar entre 0.5 y 0.6, distribuyéndose los valores de p de la manera siguiente: 5% de reactivos fáciles, 20% medianamente fáciles, 50% con una dificultad media, 20% medianamente difíciles y 5% difíciles.

Discriminación. Si la prueba y un ítem miden la misma habilidad o competencia, podemos esperar que quien tuvo una puntuación alta en todo el test deberá tener altas probabilidades de contestar correctamente el ítem. También debemos esperar lo contrario, es decir, que quien tuvo bajas puntuaciones en el test, deberá tener pocas probabilidades de contestar correctamente el reactivo. Así, un buen ítem debe discriminar entre aquellos que obtuvieron buenas calificaciones en la prueba y aquellos que obtuvieron bajas calificaciones.

Usualmente, se utilizan dos formas para determinar el poder discriminativo de un ítem: el índice de discriminación y el coeficiente de discriminación. Aunque hay varias maneras equivalentes de calcular el índice de discriminación, en este trabajo utilizaremos la siguiente fórmula:

......................................................... (2)

donde: Di = Indice de discriminación del reactivo i

GAaciertos = Número de aciertos en el reactivo i del 27% de personas con las puntuaciones más altas en el test.

GBaciertos = Número de aciertos en el reactivo i del 27% de personas con las puntuaciones más bajas en el test.

Ngrupomayor = Número de personas en el grupo más numeroso (GA o GB).

Entre más alto es el índice de discriminación, el reactivo diferenciará mejor a las personas con altas y bajas calificaciones. Si todas las personas del GA contestan correctamente un reactivo y todas las personas del GB contestan incorrectamente, entonces D = 1 (valor máximo de este indicador); si sucede lo contrario, D = -1 (valor máximo negativo); si ambos grupos contestan por igual, D = 0 (valor mínimo de discriminación).

Método

Instrumentos. El EXHCOBA es un examen normativo de opción múltiple, diseñado para seleccionar a los mejores aspirantes que desean ingresar al nivel superior (aunque también se puede utilizar para el nivel medio superior haciendo ciertos ajustes). Algunas de sus características importantes para el diseño de este estudio, son las siguientes:

· El examen está conformado por tres secciones: habilidades básicas (con dos áreas temáticas y 60 preguntas), conocimientos básicos (con cuatro áreas temáticas y 70 preguntas) y conocimientos básicos de especialidad (con nueve áreas temáticas y 180 preguntas). La estructura del examen se presenta en la Tabla II. La primera corresponde al nivel de primaria, la segunda, al nivel de secundaria y la tercera, al nivel de bachillerato.

· Todos los estudiantes contestan las primeras dos secciones del examen, que suman un total de 130 preguntas, y sólo contestan 60 preguntas de la tercera sección, es decir, tres áreas temáticas que se seleccionan de acuerdo a la carrera que se desee ingresar. Con las áreas temáticas de esta tercera sección del examen, se configuran siete distintos tipos de exámenes que corresponden a las áreas de conocimiento que utiliza la ANUIES. La Tabla III muestra la configuración de éstos para las carreras que se ofrecen en la UABC.

· Adicionalmente, se cuenta con cinco versiones de preguntas clones para cada uno de los 310 ítems del examen. En este estudio se utilizó solamente una de ellas (la versión dos).

Discusión

Una forma fundamental de conocer la calidad de los reactivos de un test es poniéndolos a prueba y analizando su comportamiento empíricamente. Dos indicadores fundamentales para realizar este análisis son el nivel de dificultad y el poder discriminativo.

En cuanto al primero de ellos, podemos decir que el promedio de dificultad de los reactivos del EXHCOBA (0.56) es ligeramente más difícil que el nivel de dificultad esperado para un examen normativo con cuatro opciones de respuesta (0.62). Igualmente, la distribución de la dificultad de sus reactivos se acerca mucho a lo deseado, cubriendo prácticamente toda la gama de valores de p y concentrando 42% de sus reactivos con un valor medio de dificultad. Sin embargo, se nota una proporción ligeramente mayor de reactivos difíciles y medianamente difíciles que fáciles y medianamente fáciles (5% aproximadamente). Por último, es importante señalar que solamente 12% de los reactivos presentó niveles inapropiados de dificultad (muy fáciles o muy difíciles); valor muy cercano al 10% esperado teóricamente.

En cuanto al índice de discriminación del examen, se puede decir que 81% de sus ítems presentaron niveles de aceptables a óptimos; 18% de ellos tuvo un nivel pobre y 1% de ellos discriminó negativamente. En cuanto a los coeficientes de discriminación, 83% de sus reactivos presentaron niveles de aceptables a óptimos; 14.5 % de ellos tuvo un nivel pobre y 2.5% discriminó negativamente. Como se puede apreciar, con ambos indicadores de poder discriminativo se obtienen resultados equivalentes, lo cual se muestra claramente en la figura 2.

Definitivamente, los ítems con mayor poder discriminativo fueron los relacionados con las matemáticas; inversamente, los que discriminaron más deficientemente fueron los relacionados con las ciencias sociales. Lo anterior se puede explicar si consideramos que las matemáticas evalúan competencias que tienen una estrecha relación lógica e inclusiva; es decir, sus conceptos fundamentales se enlazan y se construyen unos sobre otros, en forma progresiva, de tal manera que no es posible entender algún concepto o resolver algún problema sin entender los anteriores. Por ejemplo, para poder hacer divisiones es necesario dominar la suma, la resta y la multiplicación. En sentido opuesto, las disciplinas sociales se construyen sin esta estrecha relación entre sus conceptos básicos.

Finalmente, es interesante señalar que las áreas temáticas con mejor poder discriminativo se concentran en las dos primeras secciones del examen y que evalúan competencias que se adquieren en la primaria y la secundaria. Esto también tiene una explicación lógica, en el sentido de que estas dos secciones evalúan conocimientos muy básicos, necesarios para entender otros más complejos y que estas dos secciones las contestan la totalidad de los estudiantes. Este último aspecto hace que haya una mayor diversidad en las competencias del estudiantado, por lo cual serán más fácil de discriminar. Lo contrario es cierto para las áreas temáticas de especialidad.

Por todo lo anterior, es importante señalar que estos resultados, además de servir para mejorar la calidad de los reactivos, fortalecen una de las ideas centrales del EXHCOBA: evaluar habilidades y conocimientos básicos que se adquieren durante todo el recorrido escolar, ya que con ellos se podrá discriminar y, por lo tanto, seleccionar a los mejores estudiantes que desean ingresar a la universidad.

referencias:

Backhoff, E., Larrazolo, N. y Rosas, M. (2000). Nivel de dificultad y poder de discriminación del Examen de Habilidades y Conocimientos Básicos (EXHCOBA). Revista Electrónica de Investigación Educativa, 2 (1). Consultado el día de mes de año en: http://redie.uabc.mx/vol2no1/contenido-backhoff.html












No hay comentarios:

Publicar un comentario