Un examen ( examen o evaluación ) o prueba es una evaluación educativa destinada a medir el conocimiento , la habilidad , la aptitud , la aptitud física o la clasificación del examinado en muchos otros temas (por ejemplo, creencias ). [1] Una prueba puede administrarse verbalmente, en papel, en una computadora o en un área predeterminada que requiere que el examinado demuestre o realice un conjunto de habilidades.
Los exámenes varían en estilo, rigor y requisitos. No existe un consenso general ni un estándar invariable para los formatos y la dificultad de los exámenes. A menudo, el formato y la dificultad del examen dependen de la filosofía educativa del instructor, la materia, el tamaño de la clase, la política de la institución educativa y los requisitos de acreditación o de los organismos rectores.
Una prueba puede administrarse de manera formal o informal. Un ejemplo de una prueba informal es una prueba de lectura administrada por un padre a un niño. Una prueba formal puede ser un examen final administrado por un maestro en un aula o una prueba de CI administrada por un psicólogo en una clínica. Las pruebas formales a menudo dan como resultado una calificación o una puntuación de prueba . [2] Una puntuación de prueba puede interpretarse con respecto a una norma o criterio , o en ocasiones ambos. La norma puede establecerse de forma independiente o mediante un análisis estadístico de un gran número de participantes.
Un instructor, un médico, un organismo rector o un proveedor de pruebas puede desarrollar y administrar una prueba. En algunos casos, el desarrollador de la prueba puede no ser directamente responsable de su administración. Por ejemplo, en los Estados Unidos, Educational Testing Service (ETS), una organización sin fines de lucro dedicada a la evaluación y la evaluación educativa, desarrolla pruebas estandarizadas como el SAT , pero puede no estar directamente involucrado en la administración o supervisión de estas pruebas.
A lo largo de la historia han existido pruebas y sistemas de evaluación informales, no oficiales y no estandarizados. Por ejemplo, las pruebas de habilidad, como los concursos de tiro con arco, han existido en China desde la dinastía Zhou (o, más mitológicamente, Yao ). [3] Los exámenes orales se administraban en varias partes del mundo, incluida la antigua China y Europa. Un precursor de los exámenes imperiales chinos posteriores estuvo vigente desde la dinastía Han , durante la cual se determinó la característica confuciana de los exámenes. Sin embargo, estos exámenes no ofrecían una vía oficial para el nombramiento gubernamental, la mayoría de los cuales se llenaban a través de recomendaciones basadas en cualidades como el estatus social, la moral y la capacidad.
Los primeros exámenes escritos estandarizados se implementaron en China. Se los conocía comúnmente como exámenes imperiales ( keju ).
Los exámenes imperiales burocráticos como concepto tienen sus orígenes en el año 605 durante la efímera dinastía Sui . Su sucesora, la dinastía Tang , implementó los exámenes imperiales en una escala relativamente pequeña hasta que el sistema de exámenes se expandió ampliamente durante el reinado de Wu Zetian . [4] Incluido en el sistema de exámenes ampliado había un examen militar que evaluaba la capacidad física, pero el examen militar nunca tuvo un impacto significativo en el cuerpo de oficiales chinos y los títulos militares eran vistos como inferiores a sus contrapartes civiles. La naturaleza exacta de la influencia de Wu en el sistema de exámenes todavía es un tema de debate académico.
Durante la dinastía Song , los emperadores ampliaron tanto los exámenes como el sistema de escuelas gubernamentales, en parte para contrarrestar la influencia de la nobleza hereditaria, aumentando el número de poseedores de títulos a más de cuatro o cinco veces el de los Tang. A partir de la dinastía Song, los exámenes desempeñaron el papel principal en la selección de funcionarios académicos, que formaban la élite literaria de la sociedad. Sin embargo, los exámenes coexistieron con otras formas de reclutamiento, como nombramientos directos para la familia gobernante, nominaciones, cuotas, promociones clericales, venta de títulos oficiales y procedimientos especiales para eunucos . El ciclo regular de exámenes de grado de nivel superior se decretó en 1067 para que fuera de 3 años, pero este ciclo trienal solo existía en términos nominales. En la práctica, tanto antes como después de esto, los exámenes se implementaron irregularmente durante períodos de tiempo significativos: por lo tanto, los promedios estadísticos calculados para el número de títulos conferidos anualmente deben entenderse en este contexto. Los exámenes jinshi no eran un evento anual y no deben considerarse como tal; Las cifras promedio anuales son un artefacto necesario del análisis cuantitativo. [5] Las operaciones del sistema de exámenes eran parte del sistema de mantenimiento de registros imperial, y la fecha de recepción del grado de jinshi es a menudo un dato biográfico clave: a veces la fecha de obtención del jinshi es la única fecha firme conocida incluso para algunas de las personas históricamente más prominentes en la historia china.
A principios de la dinastía mongol Yuan, en el siglo XIII, se produjo una breve interrupción de los exámenes, pero más tarde se restablecieron con cuotas regionales que favorecían a los mongoles y perjudicaban a los chinos del sur. Durante las dinastías Ming y Qing , el sistema contribuyó a la naturaleza estrecha y centrada de la vida intelectual y mejoró el poder autocrático del emperador. El sistema continuó con algunas modificaciones hasta su abolición en 1905, durante los últimos años de la dinastía Qing. El sistema de exámenes moderno para seleccionar a los funcionarios públicos también evolucionó indirectamente del imperial. [6]
Japón aplicó el sistema de exámenes durante 200 años durante el período Heian (794-1185). Al igual que los exámenes chinos, el plan de estudios giraba en torno al canon confuciano. Sin embargo, a diferencia de China, solo se aplicó a la pequeña nobleza y, por lo tanto, se fue desvaneciendo gradualmente bajo el sistema hereditario durante la era samurái . [7]
El sistema de exámenes se estableció en Corea en 958 bajo el reinado de Gwangjong de Goryeo . Cualquier hombre libre (no Nobi ) podía presentarse a los exámenes. En el período Joseon , los altos cargos estaban cerrados a los aristócratas que no habían aprobado los exámenes. El sistema de exámenes continuó hasta 1894, cuando fue abolido por la Reforma de Gabo . Al igual que en China, el contenido de los exámenes se centraba en el canon confuciano y aseguraba una clase burocrática leal y académica que defendía el trono. [8]
El sistema de exámenes confuciano en Vietnam se estableció en 1075 bajo el emperador Lý Nhân Tông de la dinastía Lý y duró hasta el emperador Khải Định de la dinastía Nguyễn (1919). Solo había tres niveles de exámenes en Vietnam: interprovincial, precorte y corte. [8]
El sistema de exámenes imperiales era conocido por los europeos desde 1570. Recibió gran atención del jesuita Matteo Ricci (1552-1610), quien lo vio y su apelación confuciana al racionalismo de manera favorable en comparación con la dependencia religiosa del "apocalipsis". El conocimiento del confucianismo y el sistema de exámenes se difundió ampliamente en Europa después de la traducción al latín del diario de Ricci en 1614. Durante el siglo XVIII, los exámenes imperiales a menudo se discutían junto con el confucianismo, que atrajo gran atención de pensadores europeos contemporáneos como Gottfried Wilhelm Leibniz , Voltaire , Montesquieu , el barón d'Holbach , Johann Wolfgang von Goethe y Friedrich Schiller . [9] En Francia y Gran Bretaña , la ideología confuciana se utilizó para atacar el privilegio de la élite. [10] Figuras como Voltaire afirmaban que los chinos habían "perfeccionado la ciencia moral" y François Quesnay abogaba por un sistema económico y político modelado según el de los chinos. Según Ferdinand Brunetière (1849-1906), los seguidores de la fisiocracia como François Quesnay, cuya teoría del libre comercio se basaba en la teoría clásica china, eran sinófilos empeñados en introducir "l'esprit chinois" en Francia. También admite que la educación francesa se basaba en realidad en exámenes literarios chinos que fueron popularizados en Francia por filósofos, especialmente Voltaire. La percepción occidental de China en el siglo XVIII admiraba el sistema burocrático chino como favorable a los gobiernos europeos por su aparente meritocracia. [11] [12] Sin embargo, aquellos que admiraban a China, como Christian Wolff, a veces fueron perseguidos. En 1721 dio una conferencia en la Universidad de Halle elogiando el confucianismo, por lo que fue acusado de ateísmo y obligado a abandonar su puesto en la universidad. [13]
La evidencia más antigua de exámenes en Europa data de 1215 o 1219 en Bolonia . Estos eran principalmente orales en forma de pregunta o respuesta, disputa, determinación, defensa o conferencia pública. El candidato daba una conferencia pública de dos pasajes preparados que se le asignaban del derecho civil o canónico, y luego los médicos le hacían preguntas o expresaban objeciones a las respuestas. La evidencia de exámenes escritos no aparece hasta 1702 en Trinity College, Cambridge . Según Sir Michael Sadler , Europa puede haber tenido exámenes escritos desde 1518, pero admite que "la evidencia no es muy clara". En Prusia , los exámenes de medicación comenzaron en 1725. Se cree comúnmente que el Tripos de Matemáticas , fundado en 1747, es el primer examen de honor, pero James Bass Mullinger consideró que "los candidatos no habían realizado realmente ningún examen" porque la calificación para un título era simplemente cuatro años de residencia. Francia adoptó el sistema de exámenes en 1791 como resultado de la Revolución Francesa , pero fracasó después de sólo diez años. Alemania implementó el sistema de exámenes alrededor de 1800. [12]
Los ingleses del siglo XVIII, como Eustace Budgell, recomendaron imitar el sistema de exámenes chino, pero el primer inglés que recomendó los exámenes competitivos para calificar para el empleo fue Adam Smith en 1776. En 1838, el misionero de la iglesia congregacional Walter Henry Medhurst consideró que los exámenes chinos eran "dignos de imitar". [12] En 1806, los británicos establecieron un Colegio de Servicio Civil cerca de Londres para la capacitación de los administradores de la Compañía de las Indias Orientales en la India. Esto se basó en las recomendaciones de los funcionarios de la Compañía Británica de las Indias Orientales que servían en China y habían visto los exámenes imperiales. En 1829, la compañía introdujo los exámenes de servicio civil en la India de forma limitada. [14] Esto estableció el principio del proceso de calificación para los funcionarios públicos en Inglaterra. [13] En 1847 y 1856, Thomas Taylor Meadows recomendó enérgicamente la adopción del principio chino de los exámenes competitivos en Gran Bretaña en sus Desultory Notes on the Government and People of China . Según Meadows, "la larga duración del imperio chino se debe únicamente y en su totalidad al buen gobierno que consiste en el avance de hombres de talento y mérito solamente". [15] Tanto Thomas Babington Macaulay , que fue fundamental en la aprobación de la Ley de Santa Elena de 1833 , como Stafford Northcote, primer conde de Iddesleigh , que preparó el Informe Northcote-Trevelyan que catalizó el servicio civil británico , estaban familiarizados con la historia y las instituciones chinas. El Informe Northcote-Trevelyan de 1854 hizo cuatro recomendaciones principales: que el reclutamiento debería basarse en el mérito determinado a través de un examen escrito estandarizado, que los candidatos deberían tener una educación general sólida para permitir transferencias interdepartamentales, que los reclutas deberían ser clasificados en una jerarquía, y que la promoción debería ser a través del logro, en lugar de 'preferimiento, patrocinio o compra'. [16]
Cuando el informe se presentó en el parlamento en 1853, Lord Monteagle argumentó en contra de la implementación de exámenes abiertos porque era un sistema chino y China no era un "país ilustrado". Lord Stanley llamó a los exámenes el "principio chino". El conde de Granville no lo negó, pero argumentó a favor del sistema de exámenes, considerando que la minoría manchú había podido gobernar China con él durante más de 200 años. En 1854, Edwin Chadwick informó que algunos nobles no estaban de acuerdo con las medidas introducidas porque eran chinos. El sistema de exámenes finalmente se implementó en el Servicio Civil Indio Británico en 1855, antes del cual la admisión al servicio civil era puramente una cuestión de patrocinio, y en Inglaterra en 1870. Incluso tan tarde como diez años después de que se aprobara el plan de exámenes competitivos, la gente todavía lo atacaba como una "cultura china adoptada". Alexander Baillie-Cochrane, primer barón Lamington insistió en que los ingleses "no sabían que era necesario que aprendieran lecciones del Imperio Celestial". En 1875, Archibald Sayce expresó su preocupación por la prevalencia de los exámenes competitivos, que describió como "la invasión de esta nueva cultura china". [12]
Después de la exitosa implementación de exámenes sistemáticos, abiertos y competitivos en Gran Bretaña en la India en el siglo XIX, se instituyeron sistemas similares en el propio Reino Unido y en otras naciones occidentales. [17] Al igual que en Gran Bretaña, el desarrollo del servicio civil francés y estadounidense estuvo influenciado por el sistema chino. Cuando Thomas Jenckes hizo un Informe del Comité Selecto Conjunto sobre Reducción en 1868, contenía un capítulo sobre el servicio civil en China. En 1870, William Spear escribió un libro llamado El imperio más antiguo y el más nuevo: China y los Estados Unidos , en el que instaba al gobierno de los Estados Unidos a adoptar el sistema de exámenes chino. Al igual que en Gran Bretaña, muchas de las élites estadounidenses despreciaron el plan de implementar exámenes competitivos, que consideraban extranjeros, chinos y "antiamericanos". Como resultado, la reforma del servicio civil introducida en la Cámara de Representantes en 1868 no se aprobó hasta 1883. La Comisión del Servicio Civil intentó combatir tales sentimientos en su informe: [18]
...sin intención de elogiar ni la religión ni el imperialismo de China, no podíamos entender por qué el hecho de que el gobierno más ilustrado y duradero del mundo oriental hubiera adquirido un examen sobre los méritos de los candidatos a un cargo, debería privar al pueblo estadounidense de esa ventaja, si es que podía ser una ventaja, más de lo que los hechos de que Confucio había enseñado moralidad política, y el pueblo de China había leído libros, usado la brújula, la pólvora y la tabla de multiplicar, durante siglos en que este continente era un desierto, deberían privar a nuestro pueblo de esas comodidades. [12]
— Comisión de Servicio Civil
Las pruebas estandarizadas comenzaron a influir en el método de evaluación en las universidades británicas a partir de la década de 1850, donde los exámenes orales habían sido comunes desde la Edad Media . En los EE. UU., la transición se produjo bajo la influencia del reformador educativo Horace Mann . El cambio ayudó a estandarizar una expansión de los planes de estudio hacia las ciencias y las humanidades , creando un método racionalizado para la evaluación de los profesores y las instituciones y creando una base para la clasificación de los estudiantes según su capacidad. [19]
Tanto la Primera como la Segunda Guerra Mundial demostraron la necesidad de las pruebas estandarizadas y los beneficios asociados a ellas. Se utilizaron pruebas para determinar la aptitud mental de los reclutas del ejército. El ejército de los EE. UU. utilizó la Escala de Inteligencia Stanford-Binet para evaluar el cociente intelectual de los soldados. [20] Después de la guerra, la industria comenzó a utilizar pruebas para evaluar a los solicitantes de diversos puestos de trabajo en función de su desempeño. En 1952, se administró la primera prueba de Colocación Avanzada (AP) para comenzar a cerrar la brecha entre las escuelas secundarias y las universidades. [21]
En la mayoría de los sistemas educativos se utilizan exámenes. Pueden ser desde preguntas breves e informales elegidas por el profesor hasta exámenes importantes para los que los alumnos y los profesores pasan meses preparándose.
Algunos países como el Reino Unido y Francia requieren que todos sus estudiantes de secundaria tomen una prueba estandarizada sobre materias individuales como el Certificado General de Educación Secundaria (GCSE) (en Inglaterra) y el Baccalauréat respectivamente como requisito para graduarse. [22] Estas pruebas se utilizan principalmente para evaluar la competencia de un estudiante en materias específicas como matemáticas, ciencias o literatura. Por el contrario, los estudiantes de secundaria en otros países como los Estados Unidos pueden no estar obligados a tomar una prueba estandarizada para graduarse. Además, los estudiantes en estos países generalmente toman pruebas estandarizadas solo para postularse a un puesto en un programa universitario y generalmente se les da la opción de tomar diferentes pruebas estandarizadas como el ACT o el SAT , que se utilizan principalmente para medir la habilidad de razonamiento de un estudiante. [23] [24] Los estudiantes de secundaria en los Estados Unidos también pueden tomar pruebas de Colocación Avanzada en materias específicas para cumplir con el crédito de nivel universitario. Dependiendo de las políticas del creador de la prueba o del país, la administración de las pruebas estandarizadas puede realizarse en una gran sala, aula o centro de pruebas. Un supervisor o vigilante también puede estar presente durante el período de prueba para brindar instrucciones, responder preguntas o evitar trampas.
Las calificaciones o puntuaciones de exámenes estandarizados también pueden ser utilizadas por las universidades para determinar si un estudiante solicitante debe ser admitido en uno de sus programas académicos o profesionales. Por ejemplo, las universidades del Reino Unido admiten a los solicitantes en sus programas de pregrado basándose principalmente o únicamente en las calificaciones del solicitante en las calificaciones preuniversitarias, como los GCE A-levels o Cambridge Pre-U . [25] [26] Por el contrario, las universidades de los Estados Unidos utilizan la puntuación de la prueba de un solicitante en el SAT o ACT como solo uno de sus muchos criterios de admisión para determinar si un solicitante debe ser admitido en uno de sus programas de pregrado. Los otros criterios en este caso pueden incluir las calificaciones del solicitante de la escuela secundaria, las actividades extracurriculares, la declaración personal y las cartas de recomendación. [27] Una vez admitidos, los estudiantes de pregrado en el Reino Unido o los Estados Unidos pueden ser obligados por sus respectivos programas a tomar un examen integral como requisito para aprobar sus cursos o para graduarse de sus respectivos programas.
En algunos países, las pruebas estandarizadas se utilizan a veces para controlar la calidad de sus instituciones educativas. Por ejemplo, la ley No Child Left Behind de los Estados Unidos exige que cada estado elabore evaluaciones para los alumnos de determinados grados. En la práctica, estas evaluaciones suelen presentarse en forma de pruebas estandarizadas. Las puntuaciones de las pruebas de los alumnos de grados específicos de una institución educativa se utilizan entonces para determinar el estatus de esa institución educativa, es decir, si se le debe permitir seguir funcionando de la misma manera o recibir financiación.
Por último, a veces se utilizan pruebas estandarizadas para comparar las competencias de los estudiantes de diferentes instituciones o países. Por ejemplo, la Organización para la Cooperación y el Desarrollo Económicos (OCDE) utiliza el Programa para la Evaluación Internacional de Alumnos (PISA) para evaluar determinadas habilidades y conocimientos de los estudiantes de los diferentes países participantes. [28]
En ocasiones, determinados organismos gubernamentales utilizan pruebas estandarizadas para determinar si un candidato puede ejercer una profesión, utilizar un título laboral específico o afirmar que es competente en un conjunto específico de habilidades. Por ejemplo, un organismo gubernamental, como una agencia de licencias para el colegio de abogados, suele exigir a un candidato que desee convertirse en abogado que apruebe un examen de abogacía .
En algunos países también se utilizan pruebas estandarizadas para regular la inmigración. Por ejemplo, quienes deseen inmigrar a Australia deben aprobar un examen de ciudadanía como parte del proceso de naturalización de ese país. [29]
Cuando se analiza en el contexto de la textualidad lingüística en los procesos de naturalización, la ideología puede encontrarse desde dos puntos de vista distintos pero casi relacionados. Uno se refiere a la construcción y deconstrucción de los elementos constitutivos de la nación que configuran su propia identidad, mientras que el segundo tiene una visión más restringida de la noción de lengua específica e ideologías que pueden servir a un propósito específico. [30]
En ocasiones, las pruebas se utilizan como herramienta para seleccionar a los participantes que tienen potencial para triunfar en una competición, como un evento deportivo. Por ejemplo, los patinadores que desean participar en competiciones de patinaje artístico en los Estados Unidos deben aprobar pruebas oficiales de patinaje artístico de ese país para poder participar. [31]
En ocasiones, un grupo utiliza pruebas para seleccionar a determinados tipos de individuos para que se unan al grupo. Por ejemplo, Mensa International es una sociedad de alto coeficiente intelectual que exige que los individuos obtengan una puntuación del percentil 98 o superior en una prueba de coeficiente intelectual estandarizada y supervisada. [32]
Los tipos de evaluación incluyen: [33] [34] [35]
Las pruebas basadas en criterios están diseñadas para medir el desempeño de los estudiantes en relación con un conjunto fijo de criterios o estándares de aprendizaje. Es posible que todos los examinados aprueben, al igual que es posible que todos los examinados fracasen. Estas pruebas pueden utilizar las puntuaciones de los individuos para centrarse en mejorar las habilidades que les faltaban en la comprensión. [36]
Los exámenes competitivos son pruebas de alto riesgo y referenciadas por normas en las que los candidatos se clasifican según sus calificaciones y/o percentil, y luego se seleccionan los mejores. Si el examen está abierto para n puestos, entonces los primeros n candidatos en los rangos aprueban, los demás son rechazados. Se utilizan como exámenes de ingreso para admisiones a universidades y colegios , como el Examen de Ingreso Conjunto o para escuelas secundarias . Los tipos son los exámenes de servicio civil , requeridos para puestos en el sector público ; el Examen del Servicio Exterior de los Estados Unidos y el Examen Competitivo de las Naciones Unidas . Los exámenes competitivos se consideran una forma igualitaria de seleccionar solicitantes dignos sin correr el riesgo de tráfico de influencias , sesgo u otras preocupaciones.
Un mismo examen puede tener múltiples cualidades. Por ejemplo, el examen de abogado para aspirantes a abogados puede ser una evaluación sumativa, estandarizada y basada en normas. Esto significa que solo aprobarán los candidatos con puntuaciones más altas, que todos ellos realizaron el mismo examen en las mismas circunstancias y fueron calificados con los mismos estándares de puntuación, y que el examen tiene como objetivo determinar si los graduados de la facultad de derecho han aprendido lo suficiente para ejercer su profesión.
Los exámenes escritos son pruebas que se realizan en papel o en una computadora (como un examen electrónico ). El candidato que realiza un examen escrito puede responder a preguntas específicas del examen escribiendo o tecleando en un espacio determinado del examen o en un formulario o documento aparte.
En algunas pruebas, donde se requiere el conocimiento de muchas constantes o términos técnicos para responder preguntas de manera efectiva, como Química o Biología , el desarrollador de la prueba puede permitir que cada examinado traiga consigo una hoja de trucos .
La elección del estilo o formato que utilizará un desarrollador de pruebas al desarrollar una prueba escrita suele ser arbitraria, dado que no existe un único estándar invariable para las pruebas. Sea como fuere, ciertos estilos y formatos de pruebas se han vuelto más utilizados que otros. A continuación, se incluye una lista de los formatos de elementos de prueba que utilizan ampliamente los educadores y los desarrolladores de pruebas para construir pruebas en papel o por computadora. Como resultado, estas pruebas pueden constar de un solo tipo de formato de elemento de prueba (por ejemplo, prueba de opción múltiple, prueba de ensayo) o pueden tener una combinación de diferentes formatos de elementos de prueba (por ejemplo, una prueba que tiene elementos de opción múltiple y de ensayo).
En una prueba que tiene ítems con formato de preguntas de opción múltiple, al candidato se le daría una cantidad de respuestas establecidas para cada pregunta, y el candidato debe elegir qué respuesta o grupo de respuestas es correcto. Hay dos familias de preguntas de opción múltiple. [39] La primera familia se conoce como la pregunta de Verdadero/Falso y requiere que el candidato elija todas las respuestas que sean apropiadas. La segunda familia se conoce como la pregunta de la Mejor Respuesta y requiere que el candidato responda solo una de una lista de respuestas.
Existen varias razones para utilizar preguntas de opción múltiple en los exámenes. En términos administrativos, las preguntas de opción múltiple generalmente requieren menos tiempo para que los examinados las respondan, son fáciles de puntuar y calificar, brindan una mayor cobertura del material, permiten una amplia gama de dificultades y pueden diagnosticar fácilmente la dificultad de un examinado con ciertos conceptos. [40] Como herramienta educativa, los ítems de opción múltiple prueban muchos niveles de aprendizaje, así como la capacidad del examinado para integrar la información, y brindan retroalimentación al examinado sobre por qué los distractores fueron incorrectos y por qué las respuestas correctas fueron correctas. Sin embargo, existen dificultades asociadas con el uso de preguntas de opción múltiple. En términos administrativos, los ítems de opción múltiple que son efectivos generalmente requieren mucho tiempo para construirse. [40] Como herramienta educativa, los ítems de opción múltiple no permiten a los examinados demostrar conocimientos más allá de las opciones proporcionadas e incluso pueden alentar la adivinación o la aproximación debido a la presencia de al menos una respuesta correcta. Por ejemplo, un candidato podría no darse cuenta explícitamente de que , pero sabiendo que , elegiría una respuesta cercana a 48. Además, los candidatos pueden malinterpretar estos ítems y, en el proceso, percibirlos como complicados o exigentes. Por último, los ítems de opción múltiple no ponen a prueba las actitudes del candidato hacia el aprendizaje porque las respuestas correctas se pueden falsificar fácilmente.
Las preguntas de verdadero o falso presentan a los candidatos una elección binaria: una afirmación es verdadera o falsa. Este método presenta problemas, ya que, según la cantidad de preguntas, una cantidad significativa de candidatos podría obtener el 100 % simplemente adivinando, y en promedio debería obtener el 50 %.
Un elemento coincidente es un elemento que proporciona un término definido y requiere que el examinado relacione las características de identificación con el término correcto. [41] [ ejemplo necesario ]
Un ítem de completar espacios en blanco proporciona al examinado características de identificación y requiere que el examinado recuerde el término correcto. [41] Hay dos tipos de exámenes de completar espacios en blanco. La versión más fácil proporciona un banco de palabras de posibles palabras que completarán los espacios en blanco. Para algunos exámenes, todas las palabras del banco de palabras se utilizan exactamente una vez. Si un profesor quisiera crear un examen de dificultad media, proporcionaría un examen con un banco de palabras, pero algunas palabras pueden usarse más de una vez y otras no en absoluto. La variedad más difícil de este tipo de examen es una prueba de completar espacios en blanco en la que no se proporciona ningún banco de palabras. Esto generalmente requiere un mayor nivel de comprensión y memoria que una prueba de opción múltiple. Debido a esto, los exámenes de completar espacios en blanco sin banco de palabras a menudo son temidos por los estudiantes.
Los ítems como respuestas breves o ensayos suelen requerir que el examinado escriba una respuesta para cumplir con los requisitos del ítem. En términos administrativos, los ítems de ensayo requieren menos tiempo para su elaboración. [40] Como herramienta de evaluación, los ítems de ensayo pueden evaluar objetivos de aprendizaje complejos, así como los procesos utilizados para responder la pregunta. Los ítems también pueden proporcionar una tarea más realista y generalizable para el examen. Por último, estos ítems dificultan que los examinados adivinen las respuestas correctas y requieren que demuestren sus habilidades de escritura, así como la ortografía y la gramática correctas.
Las dificultades con los ítems de ensayo son principalmente administrativas: por ejemplo, los examinados necesitan tiempo adecuado para poder redactar sus respuestas. [40] Cuando se responden estas preguntas, las respuestas en sí mismas suelen estar mal escritas porque los examinados pueden no tener tiempo para organizar y corregir sus respuestas. A su vez, lleva más tiempo puntuar o calificar estos ítems. Cuando se puntúan o califican estos ítems, el proceso de calificación en sí mismo se vuelve subjetivo ya que la información no relacionada con la prueba puede influir en el proceso. Por lo tanto, se requiere un esfuerzo considerable para minimizar la subjetividad del proceso de calificación. Finalmente, como herramienta de evaluación, las preguntas de ensayo pueden ser potencialmente poco confiables para evaluar el contenido completo de una materia.
Las instrucciones para los candidatos a los exámenes se basan en el uso de palabras de mando , que indican al examinado que responda de una manera particular, por ejemplo describiendo o definiendo un concepto, o comparando y contrastando dos o más escenarios o eventos. Algunas palabras de mando requieren más conocimiento o habilidad que otras: por ejemplo, "analizar" y "sintetizar" evalúan habilidades de nivel superior que "describir". [42] Las palabras de mando más exigentes suelen atraer una mayor ponderación de la nota en el examen. En el Reino Unido, Ofqual mantiene una lista oficial de palabras de mando que explica su significado. [43] La guía del gobierno galés sobre el uso de palabras de mando aconseja que se utilicen "de manera coherente y correcta", pero señala que algunas materias tienen sus propias tradiciones y expectativas con respecto a las respuestas de los candidatos, [44] y Cambridge Assessment señala que en algunos casos, se pueden utilizar palabras de mando específicas de la materia. [45]
Un cuestionario es una evaluación breve que puede cubrir una pequeña cantidad de material que se dio en una clase. Algunos de ellos cubren dos o tres conferencias que se dieron en un período de tiempo como una sección de lectura o un ejercicio determinado en el que se resumió la parte más importante de la clase. Sin embargo, un cuestionario simple generalmente no cuenta mucho y los instructores suelen proporcionar este tipo de prueba como una evaluación formativa para ayudar a determinar si el estudiante está aprendiendo el material. Además, hacer esto en el momento en que el instructor recopiló todo puede representar una parte significativa de la calificación final del curso. [46]
La mayoría de las preguntas de matemáticas o de cálculo de materias como química , física o economía emplean un estilo que no entra en ninguna de las categorías anteriores, aunque algunos trabajos, en particular los trabajos de Maths Challenge en el Reino Unido , emplean opciones múltiples. En cambio, la mayoría de las preguntas de matemáticas plantean un problema o ejercicio matemático que requiere que el estudiante escriba una respuesta a mano alzada. Se otorgan puntos más por los pasos seguidos que por la respuesta correcta. Si la pregunta tiene varias partes, las partes posteriores pueden usar respuestas de secciones anteriores y se pueden otorgar puntos si se usó una respuesta incorrecta anterior pero se siguió el método correcto y se devuelve una respuesta que es correcta (dada la entrada incorrecta).
Los trabajos matemáticos de nivel superior pueden incluir variaciones de verdadero/falso, donde se le da al candidato una afirmación y se le pide que verifique su validez mediante una prueba directa o enunciando un contraejemplo .
Aunque no son tan populares como el examen a libro cerrado, los exámenes a libro abierto (o de notas abiertas) están ganando popularidad lentamente. Un examen a libro abierto permite al examinado acceder a los libros de texto y a todas sus notas mientras realiza el examen. [47] Las preguntas que se hacen en los exámenes a libro abierto suelen ser más reflexivas e intelectuales que las preguntas de un examen a libro cerrado. En lugar de probar qué hechos conocen los examinados, los exámenes a libro abierto los obligan a aplicar los hechos a una pregunta más amplia. El principal beneficio que se observa en los exámenes a libro abierto es que son una mejor preparación para el mundo real, donde uno no tiene que memorizar y tiene todo lo que necesita a su disposición. [48]
Una prueba oral es una prueba que se responde de forma oral (verbal). El profesor o el evaluador de la prueba oral formulará verbalmente una pregunta a un estudiante, quien luego la responderá con palabras.
Una prueba de aptitud física es una prueba diseñada para medir la fuerza física , la agilidad y la resistencia . Se emplean comúnmente en instituciones educativas como parte del plan de estudios de educación física , en medicina como parte de las pruebas de diagnóstico y como requisitos de elegibilidad en campos que se centran en la capacidad física, como el ejército o la policía . A lo largo del siglo XX, emergió evidencia científica que demostraba la utilidad del entrenamiento de fuerza y el ejercicio aeróbico para mantener la salud general, y más agencias comenzaron a incorporar pruebas de aptitud física estandarizadas. En los Estados Unidos , el Consejo Presidencial sobre Aptitud Física Juvenil se estableció en 1956 como una forma de alentar y monitorear la aptitud física en los escolares.
Las pruebas comunes [49] [50] [51] incluyen la carrera cronometrada o la prueba de aptitud física de varias etapas (comúnmente conocida como la "prueba del pitido"), y la cantidad de flexiones de brazos , abdominales y dominadas que el individuo puede realizar. Se pueden utilizar pruebas más especializadas para evaluar la capacidad para realizar un trabajo o función en particular. Muchos gimnasios, organizaciones privadas y organizadores de eventos tienen sus propias pruebas de aptitud física. Utilizan técnicas militares desarrolladas por el ejército británico y pruebas modernas como Illinois Agility Run y Cooper Test. [52]
El cronometraje con cronómetro era común hasta hace unos años, cuando se demostró que el cronometraje manual era inexacto e inconsistente. [53] El cronometraje electrónico es el nuevo estándar para promover la precisión y la consistencia y reducir los sesgos. [ cita requerida ]
Una prueba de desempeño es una evaluación que requiere que el examinado realice una tarea o actividad en la práctica, en lugar de simplemente responder preguntas que hacen referencia a partes específicas. El objetivo es garantizar una mayor fidelidad a lo que se está evaluando.
Un ejemplo es un examen práctico de manejo para obtener una licencia de conducir. En lugar de responder preguntas simples de opción múltiple sobre la conducción de un automóvil, se le pide al estudiante que conduzca uno mientras se lo evalúa.
Las pruebas de desempeño se utilizan comúnmente en el lugar de trabajo y en aplicaciones profesionales, como la certificación y la obtención de licencias profesionales . Cuando se utilizan para la selección de personal, las pruebas pueden denominarse muestras de trabajo. Un ejemplo de obtención de licencias sería el de los cosmetólogos a los que se les exige que demuestren un corte de pelo o una manicura en una persona viva. La prueba Group-Bourdon es una de las diversas pruebas psicométricas que deben aprobar los conductores de trenes en prácticas en el Reino Unido. [54]
Algunas pruebas de desempeño son simulaciones. Por ejemplo, la evaluación para obtener la certificación como técnico oftálmico incluye dos componentes: un examen de opción múltiple y una simulación de habilidades computarizada. El examinado debe demostrar la capacidad de completar siete tareas que se realizan comúnmente en el trabajo, como la retinoscopia , que se simulan en una computadora.
Un examen parcial es un examen que se realiza cerca de la mitad de un período de calificación académica , o cerca de la mitad de un trimestre o semestre determinado . [55] Los exámenes parciales son un tipo de evaluación formativa o sumativa . [56]
Un examen final , anual , examen , entrevista final o simplemente final , es una prueba que se les da a los estudiantes al final de un curso de estudio o capacitación. Aunque el término puede usarse en el contexto del entrenamiento físico, se da con mayor frecuencia en el mundo académico. La mayoría de las escuelas secundarias , colegios y universidades realizan exámenes finales al final de un período académico en particular , generalmente un trimestre o semestre , o más tradicionalmente al final de un curso de grado completo.
El propósito de la prueba es hacer una revisión final de los temas tratados y evaluar el conocimiento de cada estudiante sobre la materia . Una prueba final es técnicamente una forma más amplia de una "prueba de unidad". Tienen el mismo propósito; las pruebas finales son simplemente más extensas. No todos los cursos o planes de estudio culminan en un examen final; los instructores pueden asignar un trabajo final o un proyecto final en algunos cursos. La ponderación del examen final también varía. Puede ser el factor más importante (o el único) en la calificación del curso del estudiante; en otros casos, puede tener el mismo peso que un examen parcial, o el estudiante puede estar exento. Sin embargo, no todas las pruebas finales deben ser acumulativas, ya que algunas simplemente cubren el material presentado desde el último examen. Por ejemplo, un curso de microbiología solo podría cubrir hongos y parásitos en el examen final si esta fuera la política del profesor, y todos los demás temas presentados en el curso no se evaluarían en el examen final.
Antes del período de exámenes, la mayoría de los estudiantes de la Commonwealth tienen aproximadamente una semana de intensa revisión y estudio, conocida como swotvac .
En el Reino Unido , la mayoría de las universidades realizan una única serie de "exámenes finales" al final de toda la carrera. En Australia , el período de exámenes varía: las escuelas secundarias suelen asignar una o dos semanas para los exámenes finales, pero el período universitario, a veces llamado "semana de exámenes" o simplemente "exámenes", puede extenderse hasta un máximo de tres semanas.
La práctica varía mucho en los Estados Unidos ; los "exámenes finales" o el "período de exámenes finales" en el nivel universitario se realizan dos o tres semanas después del final del período académico, pero a veces los exámenes se administran en la última semana de instrucción. Algunas instituciones designan una "semana de estudio" o "período de lectura" entre el final de la instrucción y el comienzo de los exámenes finales, durante el cual no se pueden administrar exámenes. Los estudiantes de muchas instituciones conocen la semana anterior a los exámenes finales como " semana muerta ". La mayoría de los exámenes finales incorporan el material de lectura que se ha asignado a lo largo del período.
Aunque es algo habitual en las instituciones de educación superior francesas , no es habitual que se realicen exámenes finales en las escuelas secundarias francesas. Sin embargo, los estudiantes de secundaria franceses que deseen continuar sus estudios en el nivel universitario se presentarán a un examen nacional, conocido como Baccalauréat .
En algunos países y localidades que realizan exámenes estandarizados, es habitual que las escuelas realicen exámenes simulados , con formatos que imitan el examen real. A menudo se ve a estudiantes de diferentes escuelas intercambiar exámenes simulados como una forma de prepararse para el examen.
Un examen final para llevar a casa es un examen que se realiza al final de un período académico y que suele ser demasiado largo o complejo para completarse en una sola sesión como si fuera un examen final en clase. Por lo general, hay una fecha límite para completarlo, por ejemplo, una o dos semanas después del final del semestre. Un examen final para llevar a casa se diferencia de un trabajo final, ya que a menudo implica investigación, textos extensos y presentación de datos. [ cita requerida ]
En algunos casos, las escuelas aplican un calendario modificado para los exámenes finales a fin de que los estudiantes tengan más tiempo para realizarlos. Sin embargo, esto no es necesariamente así en todas las instituciones. [ cita requerida ]
Desde la perspectiva de un desarrollador de pruebas, existe una gran variabilidad con respecto al tiempo y el esfuerzo necesarios para preparar una prueba. Asimismo, desde la perspectiva de un examinado, también existe una gran variabilidad con respecto al tiempo y el esfuerzo necesarios para obtener una calificación o puntuación deseada en una prueba determinada. Cuando un desarrollador de pruebas elabora una prueba, la cantidad de tiempo y esfuerzo depende de la importancia de la prueba en sí, la competencia del examinado, el formato de la prueba, el tamaño de la clase, la fecha límite de la prueba y la experiencia del desarrollador de la prueba.
El proceso de construcción de pruebas se ha visto facilitado de varias maneras. Por un lado, muchos desarrolladores de pruebas fueron estudiantes en algún momento y, por lo tanto, pueden modificar o adoptar directamente preguntas de sus pruebas anteriores. En algunos países, los editores de libros a menudo proporcionan paquetes de enseñanza que incluyen bancos de pruebas a los instructores universitarios que adoptan sus libros publicados para sus cursos. [57] Estos bancos de pruebas pueden contener hasta cuatro mil preguntas de prueba de muestra que han sido revisadas por pares y probadas en el tiempo. El instructor que elija usar este banco de pruebas solo tendría que seleccionar un número fijo de preguntas de prueba de este banco de pruebas para construir una prueba.
Al igual que con las construcciones de pruebas, el tiempo que necesita un candidato para prepararse para una prueba depende de la frecuencia de la prueba, el desarrollador de la prueba y la importancia de la prueba. En general, las pruebas no estandarizadas que son cortas, frecuentes y no constituyen una parte importante de la calificación o puntuación general del curso del candidato no requieren que el candidato dedique mucho tiempo a prepararse para la prueba. [58] Por el contrario, las pruebas no estandarizadas que son largas, poco frecuentes y constituyen una parte importante de la calificación o puntuación general del curso del candidato generalmente requieren que el candidato dedique una gran cantidad de tiempo a prepararse para la prueba. Para prepararse para una prueba no estandarizada, los candidatos pueden confiar en sus libros de referencia, notas de clase o de conferencia, Internet y experiencia pasada. Los candidatos también pueden usar varias ayudas de aprendizaje para estudiar para las pruebas, como tarjetas didácticas y mnemotécnicas . [59] Los candidatos pueden incluso contratar tutores para que los guíen durante el proceso de modo que puedan aumentar la probabilidad de obtener una calificación o puntuación de prueba deseada. En países como el Reino Unido , la demanda de clases particulares ha aumentado significativamente en los últimos años. [60] Por último, los examinados pueden recurrir a copias anteriores de un examen de años o semestres anteriores para estudiar para un examen futuro. Estas pruebas anteriores pueden ser proporcionadas por un amigo o un grupo que tenga copias de exámenes anteriores o por los instructores y sus instituciones, o por el propio proveedor de la prueba (como una junta examinadora ). [61] [62]
A diferencia de una prueba no estandarizada, el tiempo que los examinados necesitan para prepararse para las pruebas estandarizadas es menos variable y, por lo general, considerable. Esto se debe a que las pruebas estandarizadas suelen ser uniformes en alcance, formato y dificultad y, a menudo, tienen consecuencias importantes con respecto al futuro de un examinado, como la elegibilidad del examinado para asistir a un programa universitario específico o ingresar a una profesión deseada. No es inusual que los examinados se preparen para las pruebas estandarizadas confiando en libros disponibles comercialmente que brindan una cobertura detallada de la prueba estandarizada o compilaciones de pruebas anteriores (por ejemplo, la serie de diez años en Singapur). En muchos países, los examinados incluso se inscriben en centros de preparación de exámenes o escuelas de refuerzo que brindan instrucciones extensas o complementarias a los examinados para ayudarlos a prepararse mejor para una prueba estandarizada. En Hong Kong, se ha sugerido que los tutores que dirigen dichos centros son celebridades por derecho propio. [63] Esto ha llevado a que la enseñanza privada sea una opción profesional popular para los recién graduados en las economías desarrolladas. [64] [65] Por último, en algunos países, los instructores y sus instituciones también han desempeñado un papel importante en la preparación de los examinados para una prueba estandarizada.
Hacer trampa en un examen es el proceso de utilizar medios o métodos no autorizados para obtener una puntuación o calificación deseada en un examen. Esto puede ir desde traer y utilizar notas durante un examen a libro cerrado, copiar la respuesta o la elección de respuestas de otro examinado durante un examen individual, hasta enviar a un representante pagado para que realice el examen. [66]
Se han empleado varios métodos comunes para combatir las trampas, entre ellos, el uso de varios supervisores o vigilantes durante un período de prueba para supervisar a los candidatos. Los desarrolladores de pruebas pueden construir múltiples variantes de la misma prueba para administrarlas a diferentes candidatos al mismo tiempo, o escribir pruebas con pocas opciones de opción múltiple, basándose en la teoría de que las respuestas completamente elaboradas son difíciles de imitar. [67] En algunos casos, los instructores pueden no administrar sus propias pruebas, sino que dejarán la tarea a otros instructores o vigilantes, lo que puede significar que los vigilantes no conozcan a los candidatos y, por lo tanto, puede ser necesaria alguna forma de identificación. Por último, los instructores o los proveedores de pruebas pueden comparar las respuestas de los presuntos tramposos en la prueba para determinar si se produjo un engaño.
{{cite book}}
: Mantenimiento de CS1: falta la ubicación del editor ( enlace )