stringtranslate.com

prueba estandarizada

Los jóvenes polacos se presentan a los exámenes Matura . La Matura está estandarizada para que las universidades puedan comparar fácilmente los resultados de los estudiantes de todo el país.

La prueba estandarizada es una prueba que se administra y califica de manera consistente o "estándar". Las pruebas estandarizadas están diseñadas de tal manera que las preguntas y las interpretaciones sean consistentes y se administren y califiquen de una manera estándar predeterminada. [1]

Cualquier examen en el que el mismo examen se aplica de la misma manera a todos los examinados y se califica de la misma manera para todos, es un examen estandarizado. Los exámenes estandarizados no necesitan ser exámenes de alto riesgo , exámenes de tiempo limitado, exámenes de opción múltiple , exámenes académicos o exámenes administrados a un gran número de examinados. Una prueba estandarizada puede ser cualquier tipo de prueba: una prueba escrita, una prueba oral o una prueba de desempeño de habilidades prácticas . Las preguntas pueden ser simples o complejas. El tema entre los estudiantes en edad escolar suele ser las habilidades académicas, pero se puede realizar una prueba estandarizada sobre casi cualquier tema, incluidos exámenes de manejo , creatividad , atletismo , personalidad , ética profesional u otros atributos.

Lo opuesto a las pruebas estandarizadas son las pruebas no estandarizadas , en las que se administran pruebas significativamente diferentes a diferentes examinados, o se asigna la misma prueba en condiciones significativamente diferentes (por ejemplo, a un grupo se le permite mucho menos tiempo para completar la prueba que al resto). siguiente grupo) o evaluado de manera diferente (por ejemplo, la misma respuesta se considera correcta para un estudiante, pero incorrecta para otro estudiante).

La mayoría de las pruebas y cuestionarios cotidianos que realizan los estudiantes durante la escuela cumplen con la definición de prueba estandarizada: todos en la clase toman la misma prueba, al mismo tiempo, en las mismas circunstancias, y todos los estudiantes son calificados por su maestro de la misma manera. forma. Sin embargo, el término prueba estandarizada se utiliza más comúnmente para referirse a pruebas que se administran a grupos más grandes, como una prueba que toman todos los adultos que desean adquirir una licencia para tener un tipo particular de trabajo, o todos los estudiantes de un determinado tipo de trabajo. edad. La mayoría de las pruebas estandarizadas son formas de evaluaciones sumativas (evaluaciones que miden el aprendizaje de los participantes al final de una unidad de instrucción).

Debido a que todos reciben el mismo examen y el mismo sistema de calificación, los exámenes estandarizados a menudo se perciben como más justos que los no estandarizados. A menudo se considera que estas pruebas son más justas y objetivas que un sistema en el que algunos estudiantes obtienen una prueba más fácil y otros una más difícil. Las pruebas estandarizadas están diseñadas para permitir una comparación confiable de los resultados entre todos los examinados, porque todos realizan la misma prueba. [2] Sin embargo, algunas personas critican tanto las pruebas en general como las pruebas estandarizadas en específico. Por ejemplo, algunas personas creen que es injusto hacer las mismas preguntas a todos los estudiantes, si las escuelas de algunos estudiantes no tienen los mismos estándares de aprendizaje .

Definición

Dos hombres realizan RCP a un muñeco de RCP
Dos hombres realizan una prueba estandarizada auténtica , no escrita y basada en criterios . Si realizan reanimación cardiopulmonar en el maniquí con la velocidad y presión correctas, aprobarán este examen.

La definición de prueba estandarizada ha cambiado algo con el tiempo. [3] En 1960, las pruebas estandarizadas se definían como aquellas en las que las condiciones y el contenido eran iguales para todos los que tomaban la prueba, independientemente de cuándo, dónde o quién la administraba o calificaba. Las pruebas estandarizadas tienen un método uniforme y consistente para calificar. [4] Esto significa que todos los estudiantes que respondan una pregunta del examen de la misma manera obtendrán la misma puntuación para esa pregunta. El propósito de esta estandarización es garantizar que los puntajes indiquen de manera confiable las habilidades o destrezas que se miden, y no otras cosas, como instrucciones diferentes sobre qué hacer si el examinado no sabe la respuesta a una pregunta. [3]

A principios del siglo XXI, el enfoque se desplazó de una estricta igualdad de condiciones hacia la igualdad equitativa de las condiciones de prueba. [3] Por ejemplo, un examinado con una muñeca rota podría escribir más lentamente debido a la lesión, y sería más equitativo y produciría una comprensión más confiable del conocimiento real del examinado, si a esa persona se le dieran algunos más. minutos para escribir las respuestas a una prueba de tiempo limitado. Cambiar las condiciones de la prueba de una manera que mejore la equidad con respecto a una discapacidad permanente o temporal, pero sin socavar el punto principal de la evaluación, se llama acomodación . Sin embargo, si el propósito de la prueba fuera ver qué tan rápido el estudiante podía escribir, entonces darle tiempo adicional al examinado se convertiría en una modificación del contenido y ya no sería una prueba estandarizada.

Historia

Porcelana

La evidencia más antigua de pruebas estandarizadas se produjo en China , durante la dinastía Han , [5] donde los exámenes imperiales cubrían las Seis Artes , que incluían música, tiro con arco, equitación, aritmética, escritura y conocimiento de los rituales y ceremonias tanto públicas como privadas. partes. Estos exámenes se utilizaron para seleccionar empleados para la burocracia estatal.

Posteriormente, se agregaron a las pruebas secciones sobre estrategias militares, derecho civil, ingresos e impuestos, agricultura y geografía. De esta forma, los exámenes estuvieron institucionalizados durante más de un milenio.

Hoy en día, las pruebas estandarizadas siguen siendo ampliamente utilizadas, sobre todo en el sistema Gaokao .

Reino Unido

Las pruebas estandarizadas se introdujeron en Europa a principios del siglo XIX, siguiendo el modelo de los exámenes de mandarín chino , [6] gracias a la defensa de los administradores coloniales británicos, el más "persistente" de los cuales fue el cónsul de Gran Bretaña en Guangzhou, China , Thomas Taylor Meadows . [6] Meadows advirtió sobre el colapso del Imperio Británico si no se implementaban inmediatamente pruebas estandarizadas en todo el imperio. [6]

Antes de su adopción, las pruebas estandarizadas no formaban tradicionalmente parte de la pedagogía occidental. Basándose en la tradición de debate escéptico y abierto heredada de la antigua Grecia, la academia occidental favoreció las evaluaciones no estandarizadas utilizando ensayos escritos por los estudiantes. Es por esto que la primera implementación europea de pruebas estandarizadas no ocurrió en Europa propiamente dicha, sino en la India británica . [7] Inspirados por el uso chino de pruebas estandarizadas, a principios del siglo XIX, los "gerentes de empresas británicos contrataban y ascendían a empleados basándose en exámenes competitivos para prevenir la corrupción y el favoritismo". [7] Esta práctica de pruebas estandarizadas fue adoptada posteriormente a finales del siglo XIX por el continente británico. Los debates parlamentarios que siguieron hicieron muchas referencias al "sistema mandarín chino". [6]

Fue desde Gran Bretaña que las pruebas estandarizadas se extendieron, no sólo por toda la Commonwealth británica , sino también a Europa y luego a Estados Unidos. [6] Su difusión fue impulsada por la Revolución Industrial . El aumento del número de estudiantes durante y después de la Revolución Industrial, como resultado de las leyes de educación obligatoria , disminuyó el uso de la evaluación abierta, que era más difícil de producir en masa y evaluar objetivamente debido a su naturaleza intrínsecamente subjetiva.

Un hombre clasifica objetos pequeños en una bandeja de madera.
Los soldados británicos realizaron pruebas estandarizadas durante la Segunda Guerra Mundial. Este nuevo recluta está clasificando piezas mecánicas para poner a prueba su comprensión de la maquinaria. Su uniforme no muestra ningún nombre, rango u otro signo que pueda sesgar la puntuación de su trabajo.

Durante la Segunda Guerra Mundial, el ejército británico desarrolló pruebas estandarizadas, como las Juntas de Selección de la Oficina de Guerra, para elegir candidatos para la formación de oficiales y otras tareas. [8] Las pruebas analizaron las habilidades mentales de los soldados, sus habilidades mecánicas, su capacidad para trabajar con otros y otras cualidades. Los métodos anteriores adolecían de prejuicios y daban como resultado la elección de los soldados equivocados para el entrenamiento de oficiales. [8]

Estados Unidos

Las pruebas estandarizadas han sido parte de la educación estadounidense desde el siglo XIX, pero la dependencia generalizada de las pruebas estandarizadas en las escuelas de ese país es en gran medida un fenómeno del siglo XX.

La inmigración a mediados del siglo XIX contribuyó al crecimiento de las pruebas estandarizadas en los Estados Unidos. [9] Se utilizaron pruebas estandarizadas cuando las personas ingresaron por primera vez a los EE. UU. para evaluar los roles sociales y encontrar poder y estatus social. [10]

La Junta de Examen de Ingreso a la Universidad comenzó a ofrecer pruebas estandarizadas para la admisión a universidades y colegios en 1901, cubriendo nueve materias. Esta prueba se implementó con la idea de crear admisiones estandarizadas para Estados Unidos en universidades de élite del noreste. Originalmente, la prueba también estaba destinada a los mejores internados , con el fin de alinear el plan de estudios entre escuelas. [11] Originalmente, la prueba estandarizada estaba compuesta de ensayos y no estaba destinada a pruebas generalizadas. [ cita necesaria ]

Durante la Primera Guerra Mundial , se desarrollaron las pruebas Alfa y Beta del Ejército para ayudar a ubicar a los nuevos reclutas en asignaciones apropiadas según sus niveles de inteligencia evaluados. [12] La primera edición de una prueba estandarizada moderna para el coeficiente intelectual , la prueba de inteligencia Stanford-Binet , apareció en 1916. Luego, el College Board diseñó el SAT (Prueba de aptitud académica) en 1926. La primera prueba SAT se basó en el coeficiente intelectual del ejército. pruebas, con el objetivo de determinar la inteligencia, las habilidades de resolución de problemas y el pensamiento crítico del examinado . [13] En 1959, Everett Lindquist ofreció el ACT (American College Testing) por primera vez. [14] A partir de 2020, el ACT incluye cuatro secciones principales con preguntas de opción múltiple para evaluar inglés, matemáticas, lectura y ciencias, además de una sección de escritura opcional. [15]

En la década de 1970, los estados individuales comenzaron a realizar pruebas a un gran número de niños y adolescentes a través de los sistemas de escuelas públicas. En la década de 1980, las escuelas estadounidenses realizaban evaluaciones a nivel nacional. [16] En 2012, 45 estados pagaron un promedio de 27 dólares por estudiante, y 669 millones de dólares en total, en pruebas académicas anuales a gran escala. [17] Sin embargo, los costos indirectos , como el pago a los maestros para que preparen a los estudiantes para las pruebas y el tiempo de clase dedicado a administrar las pruebas, exceden significativamente el costo directo de la prueba en sí. [17]

La necesidad del gobierno federal de hacer comparaciones significativas entre un sistema de educación pública altamente descentralizado (controlado localmente) alentó el uso de pruebas estandarizadas a gran escala. La Ley de Educación Primaria y Secundaria de 1965 exigía algunas pruebas estandarizadas en las escuelas públicas. La Ley Que Ningún Niño Se Quede Atrás de 2001 vinculó además algunos tipos de financiación de las escuelas públicas a los resultados de las pruebas estandarizadas. Según estas leyes federales, el plan de estudios escolar todavía lo establecía cada estado, pero el gobierno federal exigía que los estados evaluaran qué tan bien las escuelas y los maestros enseñaban el material elegido por el estado con pruebas estandarizadas. [18] Los resultados de los estudiantes en pruebas estandarizadas a gran escala se utilizaron para asignar fondos y otros recursos a las escuelas, y para cerrar escuelas con bajo rendimiento. La Ley Every Student Succeeds reemplazó a la NCLB a finales de 2015. [19] En ese momento, estas pruebas estandarizadas a gran escala se habían vuelto controvertidas en los Estados Unidos, no necesariamente porque todos los estudiantes estuvieran tomando las mismas pruebas y obteniendo la misma puntuación. de alguna manera, sino porque se habían convertido en pruebas de alto riesgo para los sistemas escolares y los docentes. [20]

En los últimos años, muchas universidades y facultades estadounidenses han abandonado el requisito de que los solicitantes presenten puntuaciones de exámenes estandarizados. [21]

Australia

Las pruebas estandarizadas del Programa Nacional de Evaluación de Australia - Alfabetización y Aritmética (NAPLAN) fueron iniciadas en 2008 por la Autoridad Australiana de Currículo, Evaluación e Informes, una autoridad independiente "responsable del desarrollo de un plan de estudios nacional, un programa de evaluación nacional y una recopilación de datos nacional". y presentación de informes que apoya el aprendizaje del siglo XXI para todos los estudiantes australianos". [22]

Las pruebas incluyen a todos los estudiantes de los años 3, 5, 7 y 9 de escuelas australianas que serán evaluados mediante pruebas nacionales. Los temas cubiertos en estas pruebas incluyen lectura, escritura, convenciones del lenguaje (ortografía, gramática y puntuación) y aritmética.

El programa presenta informes de nivel de los estudiantes diseñados para permitir a los padres ver el progreso de sus hijos a lo largo de su vida escolar y ayudar a los maestros a mejorar las oportunidades de aprendizaje individuales para sus estudiantes. Los datos a nivel de estudiantes y escuelas también se proporcionan al sistema escolar correspondiente en el entendido de que se pueden utilizar para dirigir apoyos y recursos específicos a las escuelas que más los necesitan. Los maestros y las escuelas utilizan esta información, junto con otra información, para determinar qué tan bien se están desempeñando sus estudiantes e identificar cualquier área de necesidad que requiera asistencia.

El concepto de evaluar el rendimiento de los estudiantes no es nuevo, aunque se puede decir que el enfoque australiano actual tiene sus orígenes en las estructuras de políticas educativas actuales tanto en Estados Unidos como en el Reino Unido. Existen varias diferencias clave entre la estrategia NAPLAN australiana y las del Reino Unido y Estados Unidos. A las escuelas que tengan un rendimiento deficiente en el contexto australiano se les ofrecerá asistencia financiera según la política actual del gobierno federal.

Colombia

En 1968 nace el Instituto Colombiano para la Evaluación de la Educación (ICFES) para regular la educación superior. Se implementó el anterior sistema de evaluación pública para la autorización de funcionamiento y reconocimiento legal de instituciones y programas universitarios.

Colombia cuenta con varias pruebas estandarizadas que evalúan el nivel de educación en el país. Estos exámenes son realizados por el ICFES.

Los estudiantes de tercer, quinto y noveno grado toman el examen "Saber 3°5°9°". Esta prueba actualmente se presenta en computadora en muestras controladas y censales.

Al salir del bachillerato los estudiantes presentan el “Sable 11” que les permite ingresar a diferentes universidades del país. Los estudiantes que estudian en casa pueden realizar este examen para graduarse de la escuela secundaria y obtener su certificado de grado y diploma.

Los estudiantes que salen de la universidad deben tomar el examen "Saber Pro".

Canadá

Canadá deja la educación y, como resultado, las pruebas estandarizadas, bajo la jurisdicción de las provincias. Cada provincia tiene su propio régimen de pruebas estandarizadas para toda la provincia, que van desde pruebas estandarizadas no obligatorias para los estudiantes en Saskatchewan hasta exámenes que equivalen al 40% de las calificaciones finales de la escuela secundaria en Terranova y Labrador. [23]

Diseño y puntuación

Diseño

Por lo general, una prueba académica importante incluye secciones calificadas tanto por humanos como por computadora.

Una prueba estandarizada puede estar compuesta por preguntas de opción múltiple, preguntas de verdadero o falso, preguntas de ensayo, evaluaciones auténticas o casi cualquier otra forma de evaluación. Los ítems de opción múltiple y verdadero-falso a menudo se eligen para las pruebas que toman miles de personas porque se pueden dar y calificar de manera económica, rápida y confiable mediante el uso de hojas de respuestas especiales que se pueden leer mediante una computadora o mediante dispositivos adaptables a computadora. pruebas . Algunas pruebas estandarizadas tienen componentes de respuesta corta o redacción de ensayos a los que evaluadores independientes les asignan una puntuación que utilizan rúbricas (reglas o pautas) y trabajos de referencia (ejemplos de trabajos para cada puntuación posible) para determinar la calificación que se le dará a una respuesta.

cualquier tema

Póster en la pared que muestra los comportamientos requeridos y los puntos que se deducirán por errores en inglés y chino.
Póster que muestra los estándares para aprobar los exámenes de conducción en Taiwán. Toda persona que quiere obtener una licencia de conducir realiza el mismo examen y obtiene la misma puntuación.

No todas las pruebas estandarizadas implican responder preguntas. Una evaluación auténtica de las habilidades atléticas podría consistir en correr durante un período de tiempo determinado o driblar un balón una distancia determinada. Los profesionales de la salud deben pasar pruebas que demuestren que pueden realizar procedimientos médicos. Los candidatos a licencias de conducir deben aprobar una prueba estandarizada que demuestre que pueden conducir un automóvil. La prueba estandarizada canadiense de aptitud física se ha utilizado en investigaciones médicas para determinar la aptitud física de los examinados. [24] [25]

Puntuación de máquinas y humanos

Algunas pruebas estandarizadas utilizan pruebas de opción múltiple, cuya calificación es relativamente económica, pero se puede utilizar cualquier forma de evaluación.

Desde finales del siglo XX, las pruebas estandarizadas a gran escala se han visto determinadas en parte por la facilidad y el bajo costo de calificar las pruebas de opción múltiple por computadora. La mayoría de las evaluaciones nacionales e internacionales no son evaluadas completamente por personas.

Las personas están acostumbradas a calificar elementos que no se pueden calificar fácilmente por computadora (como los ensayos). Por ejemplo, el Graduate Record Exam es una evaluación adaptativa por computadora que no requiere calificación por parte de las personas, excepto la parte escrita. [26]

La puntuación humana es relativamente costosa y a menudo variable, razón por la cual se prefiere la puntuación por computadora cuando sea posible. Por ejemplo, algunos críticos dicen que los empleados mal pagados obtendrán malas calificaciones en los exámenes. [27] El acuerdo entre los evaluadores puede variar entre el 60 y el 85 por ciento, dependiendo de la prueba y la sesión de calificación. Para pruebas a gran escala en las escuelas, algunos examinadores pagan para que dos o más evaluadores lean cada ensayo; si sus puntuaciones no coinciden, el trabajo se pasa a evaluadores adicionales. [27]

Aunque el proceso es más difícil que calificar pruebas de opción múltiple electrónicamente, los ensayos también se pueden calificar por computadora. En otros casos, los calificadores capacitados califican los ensayos y otras respuestas abiertas de acuerdo con una rúbrica de evaluación predeterminada. Por ejemplo, en Pearson, todos los calificadores de ensayos tienen títulos universitarios de cuatro años y la mayoría son profesores actuales o anteriores. [28]

Uso de rúbricas para la equidad.

El uso de una rúbrica tiene como objetivo aumentar la equidad cuando se evalúa el desempeño del estudiante. En las pruebas estandarizadas, el error de medición (un patrón consistente de errores y sesgos en la calificación de la prueba) es fácil de determinar. Cuando la puntuación depende de las preferencias individuales de los calificadores, las calificaciones de los estudiantes dependen de quién califica la prueba.

Las pruebas estandarizadas también eliminan el sesgo del calificador en la evaluación. Las investigaciones muestran que los profesores crean una especie de profecía autocumplida en su evaluación de los estudiantes, otorgando a aquellos que prevén que obtendrán puntuaciones más altas y otorgando calificaciones más bajas a aquellos que esperan que reprueben. [29] En la evaluación no estandarizada, los calificadores tienen más discreción individual y, por lo tanto, es más probable que produzcan resultados injustos debido a sesgos inconscientes .

Usar puntuaciones para comparaciones

Hay dos tipos de interpretaciones de puntuaciones de pruebas : una interpretación de puntuaciones basada en normas o una interpretación de puntuaciones basada en criterios . [4]

Cualquiera de estos sistemas se puede utilizar en pruebas estandarizadas. Lo importante de las pruebas estandarizadas es si a todos los estudiantes se les hacen preguntas equivalentes, en circunstancias razonablemente iguales, y se les califica de acuerdo con los mismos estándares.

una curva normal genérica, con desviaciones estándar marcadas
Se puede diseñar una prueba con referencia a normas para encontrar dónde se encuentra el examinado a lo largo de una curva normal .

Una evaluación normativa compara a cada examinado con otros examinados. Una prueba referenciada a normas (NRT) es un tipo de prueba, valoración o evaluación que produce una estimación de la posición del individuo examinado en una población predefinida. La estimación se deriva del análisis de las puntuaciones de las pruebas y otros datos relevantes de una muestra extraída de la población. Este tipo de prueba identifica si el examinado se desempeñó mejor o peor que otros estudiantes que tomaron esta prueba.

Comparar con otros hace que las pruebas estandarizadas con referencia a normas sean útiles para fines de admisión en la educación superior, donde una escuela intenta comparar estudiantes de todo el país o del mundo. La estandarización garantiza que todos los estudiantes sean evaluados por igual y la referencia a normas identifica cuáles son mejores o peores. Ejemplos de tales pruebas de referencia internacionales incluyen el Estudio Internacional de Tendencias en Matemáticas y Ciencias ( TIMMS ) y el Estudio Internacional de Progreso en Capacidad de Lectura ( PIRLS ).

El técnico posee una tarjeta codificada por colores con estándares de prueba de agua
Las pruebas de agua utilizan pruebas basadas en criterios, porque es más importante determinar si el agua local es segura para beber que compararla con el agua de un lugar diferente.

Una prueba basada en criterios (CRT) es un estilo de prueba que utiliza los puntajes de las pruebas para mostrar qué tan bien se desempeñaron los examinados en una tarea determinada, no qué tan bien se desempeñaron en comparación con otros examinados. La mayoría de las pruebas y cuestionarios escritos por profesores de escuela son pruebas basadas en criterios. En este caso, el objetivo es simplemente ver si el alumno puede responder correctamente a las preguntas. Por lo general, el maestro no intenta comparar el resultado de cada estudiante con el de otros estudiantes.

Estándares

Las consideraciones de validez y confiabilidad generalmente se consideran elementos esenciales para determinar la calidad de cualquier prueba estandarizada. Sin embargo, las asociaciones profesionales y practicantes frecuentemente han colocado estas preocupaciones dentro de contextos más amplios al desarrollar estándares y emitir juicios generales sobre la calidad de cualquier prueba estandarizada en su conjunto dentro de un contexto determinado.

Estándares de evaluación

En el campo de la evaluación , y en particular de la evaluación educativa , el Comité Conjunto sobre Estándares para la Evaluación Educativa [31] ha publicado tres conjuntos de estándares para las evaluaciones. Los Estándares de evaluación del personal [32] se publicaron en 1988, los Estándares de evaluación de programas (segunda edición) [33] se publicaron en 1994 y los Estándares de evaluación de estudiantes [34] se publicaron en 2003.

Cada publicación presenta y elabora un conjunto de estándares para su uso en una variedad de entornos educativos. Los estándares proporcionan pautas para diseñar, implementar, evaluar y mejorar la forma de evaluación identificada. Cada uno de los estándares ha sido colocado en una de cuatro categorías fundamentales para promover evaluaciones educativas que sean adecuadas, útiles, factibles y precisas. En estos conjuntos de estándares, las consideraciones de validez y confiabilidad se tratan en el tema de precisión. Sin embargo, las pruebas tienen como objetivo garantizar que las evaluaciones de los estudiantes proporcionen información sólida, precisa y creíble sobre el aprendizaje y el desempeño de los estudiantes; Las pruebas estandarizadas ofrecen información limitada sobre muchas formas de inteligencia y confiar en ellas perjudica a los estudiantes porque miden de manera inexacta su potencial de éxito. [35]

Estándares de prueba

Adultos jóvenes vestidos con uniformes azul claro se sientan en mesas con exámenes y lápices
Los miembros alistados del ejército toman una prueba estandarizada de opción múltiple en papel, con la esperanza de obtener un ascenso. Todos responden las mismas preguntas y se califican de la misma manera.

En el campo de la psicometría , los Estándares para pruebas educativas y psicológicas [36] colocan estándares sobre validez y confiabilidad, junto con errores de medición y cuestiones relacionadas con la adaptación de personas con discapacidades . El tercer y último tema principal cubre los estándares relacionados con las aplicaciones de pruebas, la acreditación y las pruebas en la evaluación de programas y las políticas públicas .

Validez estadística

Una de las principales ventajas de las pruebas estandarizadas a mayor escala es que los resultados pueden documentarse empíricamente; por lo tanto, se puede demostrar que las puntuaciones de las pruebas tienen un grado relativo de validez y confiabilidad , así como resultados que son generalizables y replicables. [37] Esto a menudo se contrasta con las calificaciones en un expediente académico, que son asignadas por maestros individuales. Al observar las calificaciones asignadas individualmente, puede resultar difícil tener en cuenta las diferencias en la cultura educativa entre las escuelas, la dificultad de las tareas de un maestro determinado, las diferencias en el estilo de enseñanza, la presión para inflar las calificaciones y otras técnicas y sesgos que afectan las calificaciones.

Otra ventaja es la agregación. Una prueba estandarizada bien diseñada proporciona una evaluación del dominio de un individuo de un dominio de conocimiento o habilidad que, en algún nivel de agregación, proporcionará información útil. Es decir, si bien las evaluaciones individuales pueden no ser lo suficientemente precisas para fines prácticos, las puntuaciones medias de las clases, escuelas, sucursales de una empresa u otros grupos bien pueden proporcionar información útil debido a la reducción del error que se logra al aumentar el tamaño de la muestra.

Pruebas estandarizadas anuales en la escuela.

Las pruebas estandarizadas son una forma muy común de determinar el rendimiento académico pasado y el potencial futuro de un estudiante.

La validez, la calidad o el uso de las pruebas, en particular las pruebas estandarizadas anuales comunes en la educación, han seguido siendo ampliamente apoyadas o criticadas. Al igual que los exámenes en sí, los apoyos y críticas a los exámenes suelen ser variados y pueden provenir de una variedad de fuentes, como padres, examinados, instructores, grupos empresariales, universidades o organismos de control gubernamentales.

Quienes apoyan las pruebas estandarizadas a gran escala en educación a menudo dan las siguientes razones para promover las pruebas en educación:

Los críticos de las pruebas estandarizadas en educación a menudo brindan las siguientes razones para revisar o eliminar las pruebas estandarizadas en educación:

un vehículo de una escuela de conducción
Si un maestro sabe que una materia en particular, como el estacionamiento en paralelo , no se está evaluando, puede optar por no dedicar tiempo de instrucción a esa materia. Esto es cierto independientemente de si la prueba está estandarizada o no.

Además, el éxito de los estudiantes se rastrea en función del desempeño relativo del maestro, lo que hace que el avance del maestro dependa del éxito del maestro con el desempeño académico del estudiante. Surgen preguntas éticas y económicas para los docentes cuando se enfrentan a estudiantes con un rendimiento claramente deficiente o poco cualificados y ante una prueba estandarizada.

En su libro Now You See It , Cathy Davidson critica las pruebas estandarizadas. Ella describe a los jóvenes como "niños de una línea de montaje en un modelo de línea de montaje", es decir, el uso de la prueba estandarizada como parte de un modelo educativo único para todos. También critica la estrechez de las habilidades que se evalúan y etiquetar a los niños sin estas habilidades como fracasados ​​o como estudiantes con discapacidades. [54] El engaño generalizado y organizado ha sido una cultura en crecimiento. [55]

Hay tres métricas mediante las cuales se miden los países con mejor desempeño en el TIMMS (los "países A+"): enfoque, coherencia y rigor. El enfoque se define como la cantidad de temas cubiertos en cada grado; la idea es que cuantos menos temas se traten en cada grado, más enfoque se podrá dar a cada tema. La definición de coherencia es adherirse a una secuencia de temas cubiertos que sigue la progresión natural o estructura lógica de las matemáticas. El CCSSM se comparó tanto con los estándares estatales actuales como con los estándares nacionales A+. Con la mayor cantidad de temas cubiertos en promedio, los estándares estatales actuales tuvieron el menor enfoque. [56] Los Estándares Básicos Comunes tienen como objetivo solucionar esta discrepancia ayudando a los educadores a centrarse en lo que los estudiantes necesitan aprender en lugar de distraerse con temas extraños. Fomentan que los materiales educativos pasen de cubrir una amplia gama de temas de manera superficial a unos pocos temas con mucha más profundidad. [57]

Tiempo y dinero

Las pruebas estandarizadas son una forma de medir el nivel educativo de los estudiantes y las escuelas a gran escala. Desde el jardín de infantes hasta el grado 12, la mayoría de los estudiantes estadounidenses participan en pruebas estandarizadas anuales. El estudiante promedio toma alrededor de 10 de estas pruebas por año (por ejemplo, una o dos pruebas de comprensión de lectura, una o dos pruebas de matemáticas, una prueba de escritura, una prueba de ciencias, etc.). [58] La cantidad promedio de pruebas toma aproximadamente el 2,3% del tiempo total de clase (lo que equivale a aproximadamente cuatro días escolares por año). [59]

Las pruebas estandarizadas son caras de administrar. Se ha informado que Estados Unidos gasta alrededor de 1.700 millones de dólares al año en estas pruebas. [60] En 2001, también se informó que sólo tres empresas (Harcourt Educational Measurement, CTB McGraw-Hill y Riverside Publishing) diseñan el 96% de las pruebas tomadas a nivel estatal. [61]

Decisiones educativas

La Academia Nacional de Ciencias recomienda que las decisiones educativas importantes no se basen únicamente en la puntuación de un único examen. [62] El uso de puntajes mínimos para el ingreso o la graduación no implica un estándar único, ya que los puntajes de las pruebas casi siempre se combinan con otros criterios mínimos como el número de créditos, cursos previos, asistencia, etc. como "criterios únicos" simplemente porque son los más difíciles, o se supone automáticamente el cumplimiento de otros criterios. Una excepción a esta regla es el GED , que ha permitido que muchas personas obtengan el reconocimiento de sus habilidades aunque no cumplieran con los criterios tradicionales. [ cita necesaria ]

Algunos profesores argumentarían que una única prueba estandarizada sólo mide el conocimiento actual de un estudiante y no refleja el progreso del estudiante desde el comienzo del año. [63] Un resultado creado por personas que no forman parte de la instrucción regular del estudiante, sino por profesionales que determinan lo que los estudiantes deben saber en diferentes edades. Además, los profesores coinciden en que el mejor creador y facilitador de pruebas son ellos mismos. Argumentan que son los más conscientes de las habilidades, capacidades y necesidades de los estudiantes que les permitirían tomar más tiempo en las materias o continuar con el plan de estudios regular.

Efectos sobre los estudiantes desfavorecidos

Monty Neill, director del Centro Nacional para Exámenes Justos y Abiertos, afirma que a los estudiantes que hablan inglés como segundo idioma, que tienen una discapacidad o que provienen de familias de bajos ingresos se les niega de manera desproporcionada un diploma debido a la puntuación de un examen. lo cual es injusto y perjudicial. A finales de la década de 1970, cuando comenzaron los exámenes de graduación en los Estados Unidos, por ejemplo, una demanda afirmó que muchos estudiantes negros no habían tenido una oportunidad justa en el material que se les examinaba en el examen de graduación porque habían asistido a escuelas segregadas por ley. "La interacción entre las escuelas de escasos recursos y las pruebas afecta más poderosamente a los estudiantes de color", como sostiene Neill: "Se les niegan diplomas o ascensos de grado de manera desproporcionada, y las escuelas a las que asisten son las que tienen más probabilidades de obtener malos resultados en las pruebas y enfrentarse a sanciones como la reestructuración." [64]

En la revista The Progressive, Barbara Miner explica los inconvenientes de las pruebas estandarizadas analizando tres libros diferentes. Como codirectora del Centro de Educación de la Universidad Rice y profesora de educación, Linda M. McNeil, en su libro Contradictions of School Reform: Educational Costs of Standardized Testing escribe: "La estandarización educativa perjudica la enseñanza y el aprendizaje y, a largo plazo, , reestratifica la educación por raza y clase." McNeil cree que la reforma educativa basada en exámenes impone estándares más altos para los estudiantes de color. Según Miner, McNeil "muestra cómo la reforma basada en pruebas centraliza el poder en manos de la élite corporativa y política, un hecho particularmente aterrador durante esta época de creciente influencia corporativa y conservadora sobre la reforma educativa". Esta reforma basada en exámenes ha simplificado el aprendizaje, especialmente para los estudiantes de color. [sesenta y cinco]

FairTest dice que las consecuencias negativas del mal uso de las pruebas incluyen expulsar a los estudiantes de la escuela, sacar a los maestros de la profesión y socavar la participación de los estudiantes y el clima escolar. [66]

Uso de pruebas estandarizadas en el acceso a la universidad

Las universidades revisan las pruebas estandarizadas como parte de la solicitud, junto con otras pruebas de respaldo, como declaraciones personales , calificaciones de la escuela secundaria , trabajos de cursos anteriores y cartas de recomendación . [67] Diferentes países tienen diferentes exámenes, como el SAT en los EE. UU., el Gaokao en China y el examen de ingreso conjunto en la India.

Nathan Kuncel, experto en educación superior, dice que las pruebas de admisión a la universidad y otras pruebas estandarizadas "ayudan a los abrumados funcionarios de admisiones a dividir enormes cantidades de solicitantes en grupos para una evaluación adicional. Las puntuaciones altas no garantizan la admisión a ningún lugar, y las puntuaciones bajas no descartan "Pero las escuelas se toman las pruebas en serio". [68]

Las investigaciones muestran que las pruebas predicen algo más que las calificaciones del primer año y el nivel de los cursos que es probable que tome un estudiante. La investigación longitudinal realizada por científicos muestra que los estudiantes con puntuaciones altas en los exámenes tienen más probabilidades de tomar el camino desafiante de la universidad. [69] Las pruebas también pueden indicar los resultados de los estudiantes más allá de la universidad, incluidas evaluaciones del profesorado, logros de investigación, obtención de títulos, desempeño en exámenes integrales y licencias profesionales. [70]

Dado que las calificaciones varían entre escuelas, e incluso para dos estudiantes de la misma escuela, la medida común proporcionada por la puntuación de la prueba es más útil como forma de comparar estudiantes.

Sin embargo, en un "metaanálisis" de abril de 1995 publicado en el Journal of Educational and Psychological Measurement , Todd Morrison y Melanie Morrison examinaron dos docenas de estudios de validez del examen requerido para acceder a casi cualquier programa de maestría o doctorado en Estados Unidos: el examen de posgrado. Exámenes de registro (GRE). Este estudio abarcó a más de 5.000 examinados durante los últimos 30 años. Los autores encontraron que los puntajes GRE representaron sólo el 6 por ciento de la variación en las calificaciones en la escuela de posgrado. El GRE parece ser "prácticamente inútil desde el punto de vista de la predicción", escribieron los autores. Estudios repetidos de la Prueba de Admisión a la Facultad de Derecho (LSAT) encuentran lo mismo.

Existe un debate sobre si la prueba indicará el éxito a largo plazo en el trabajo y la vida, ya que existen muchos otros factores, pero las habilidades fundamentales como la lectura, la escritura y las matemáticas están relacionadas con el desempeño laboral.

Una investigación longitudinal realizada en 2007 ha demostrado que los logros importantes en la vida, como publicar una novela o patentar una tecnología, también están asociados con las puntuaciones de los exámenes, incluso después de tener en cuenta las oportunidades educativas. Incluso existe una gran cantidad de evidencia de que estas habilidades están relacionadas con un liderazgo eficaz y logros creativos en el trabajo. Ser capaz de leer textos y darles sentido y tener un fuerte razonamiento cuantitativo son cruciales en la economía de la información moderna . [70]

Muchos argumentos sugieren que las habilidades obtenidas en las pruebas son útiles, pero sólo hasta cierto punto.

Sin embargo, un notable estudio longitudinal publicado en 2008 en la revista Psychological Science examinó a estudiantes que obtuvieron puntajes en el 1% superior a la edad de 13 años. Veinte años después, tenían, en promedio, logros muy altos, altos ingresos, importantes premios y logros profesionales que enorgullecerían a cualquier padre. [71]

Existe una correlación entre los resultados de los exámenes y la clase social, pero el éxito en los exámenes estandarizados y en la universidad no depende simplemente de la clase. Los estudios muestran que "las pruebas fueron válidas incluso cuando se controló por clase socioeconómica. Independientemente de sus antecedentes familiares, los estudiantes con buenos puntajes en los exámenes y calificaciones de la escuela secundaria obtienen mejores resultados en la universidad que los estudiantes con puntajes más bajos y expedientes académicos más débiles". [72]

Otra crítica relacionada con la clase social y las pruebas estandarizadas es que sólo las personas ricas reciben preparación y asesoramiento para las pruebas. Sin embargo, "los investigadores han realizado una combinación de estudios experimentales y estudios de campo controlados para probar esta pregunta. En general, han llegado a la conclusión de que las ganancias debidas a la preparación para el examen son más del orden de 5 a 20 puntos y no de 100 a 200 puntos afirmados por algunas empresas de preparación de exámenes". [73]

Más importante aún, muchas personas opinan que las pruebas impiden la diversidad en las admisiones, ya que las minorías obtienen puntuaciones más bajas en las pruebas en comparación con otros grupos representados. [74] Un estudio de 2012 examinó las escuelas donde las pruebas de admisión son opcionales para los solicitantes y las comparó con las escuelas que utilizan las pruebas, y el resultado muestra que "investigaciones recientes demuestran que las escuelas con pruebas opcionales han estado inscribiendo cuerpos estudiantiles cada vez más diversos. Pero el Lo mismo ocurre con las escuelas que requieren pruebas". [75]

Los opositores afirman que las pruebas estandarizadas son juicios mal utilizados y acríticos sobre la inteligencia y el desempeño, pero los partidarios argumentan que estos no son aspectos negativos de las pruebas estandarizadas, sino críticas a regímenes de pruebas mal diseñados. Argumentan que las pruebas deberían centrar, y de hecho lo hacen, los recursos educativos en los aspectos más importantes de la educación (impartir un conjunto predefinido de conocimientos y habilidades) y que otros aspectos son menos importantes o deberían agregarse al esquema de pruebas.

La evidencia muestra que los estudiantes negros e hispanos obtienen calificaciones más bajas que los blancos y asiáticos en promedio. Por lo tanto, las pruebas estándar de matemáticas y lectura, como el SAT, se han enfrentado a ataques cada vez mayores por parte de los progresistas. Sin embargo, un informe exhaustivo del Senado de profesores de la UC, encargado por Janet Napolitano y publicado en 2020, encontró que las pruebas no son discriminatorias y desempeñan un papel importante en la protección de la calidad educativa. [76]

El informe sugirió que el empeoramiento de la inflación de calificaciones , especialmente en las escuelas secundarias ricas, hace que una evaluación estándar sea especialmente importante. [76]

En cuanto a la intención de las escuelas de la UC de eliminar los exámenes estándar como el SAT y ACT en las admisiones universitarias, los exámenes subjetivos y personalizados, como ensayos y programas extracurriculares, pueden adaptarse fácilmente y ser perjudiciales para los estudiantes que no están familiarizados con el proceso. Las admisiones sin pruebas pueden estar aún más inclinadas a favor de las personas con buenos contactos. [77]

En enero de 2020, el senado de profesores de la Universidad de California recomendó que el sistema de la UC mantuviera pruebas estandarizadas como requisitos de admisión. [76] El informe dice que las pruebas estandarizadas de matemáticas y lectura son útiles para predecir el rendimiento universitario. Basado en datos de los estudiantes del sistema de la UC, el informe concluye que "los puntajes de las pruebas son actualmente mejores predictores del GPA del primer año que el promedio de calificaciones de la escuela secundaria". [76] El informe continúa: las puntuaciones también son buenas para predecir el GPA universitario total y la posibilidad de que un estudiante se gradúe. Si bien "el poder predictivo de los puntajes de las pruebas ha aumentado", agrega el informe, "el poder predictivo de las calificaciones de la escuela secundaria ha disminuido". [76]

Los resultados de los exámenes permiten a las escuelas de la UC "seleccionar a aquellos estudiantes de grupos subrepresentados que tienen más probabilidades de obtener calificaciones más altas y graduarse a tiempo". [76] "La intención original del SAT era identificar estudiantes que provenían de círculos externos relativamente privilegiados y que podrían tener el potencial para tener éxito en la universidad", dice el informe. [76] El creador del SAT, el Servicio de Pruebas Educativas (ETS), ahora afirma que el SAT no es una prueba de "aptitud" sino más bien una evaluación de "habilidades desarrolladas". [78]

Cuestiones de prueba no específicas de la estandarización

La mayoría de las pruebas se pueden clasificar en múltiples categorías. Por ejemplo, una prueba puede ser tanto estandarizada como de alto riesgo, o estandarizada y también de opción múltiple. Las quejas sobre las "pruebas estandarizadas" (todos los examinados toman la misma prueba, en condiciones razonablemente similares, obtienen la misma puntuación) a menudo se centran en preocupaciones no relacionadas con la estandarización y se aplican igualmente a las pruebas no estandarizadas. Por ejemplo, un crítico puede quejarse de que "las pruebas estandarizadas son todas pruebas de tiempo limitado", pero el foco de la crítica está en el límite de tiempo, y no en que todos tomen el mismo examen y califiquen sus respuestas de la misma manera.

Pruebas de alto riesgo

La prueba de alto riesgo es una prueba con una recompensa deseada por un buen desempeño. [4] Algunas pruebas estandarizadas, incluidas muchas de las pruebas utilizadas para el acceso a las universidades en todo el mundo, son pruebas de alto riesgo. La mayoría de las pruebas estandarizadas, como las pruebas ordinarias en el aula, son pruebas de bajo riesgo. [4]

La fuerte dependencia de pruebas estandarizadas de alto riesgo para la toma de decisiones suele ser controvertida. Una preocupación común con las pruebas de alto riesgo es que miden el desempeño durante un solo evento, cuando los críticos creen que una evaluación más holística sería apropiada. Los críticos a menudo proponen enfatizar medidas acumulativas o incluso no numéricas, como calificaciones en el aula o breves evaluaciones individuales (escritas en prosa) de los profesores. Los partidarios argumentan que los puntajes de las pruebas proporcionan un estándar claro y objetivo que sirve como un control valioso sobre la inflación de calificaciones . [79]

Pruebas referenciadas a normas

mujer cruzando la linea de meta
Una carrera a pie es una auténtica prueba normativa . El objetivo de la carrera es ver quién corre más rápido, en lugar de ver si todos pueden correr a una determinada velocidad.

Una prueba basada en normas es aquella que está diseñada y calificada de manera que algunos examinados obtengan calificaciones mejores o peores que otros. [4] La clasificación proporciona información sobre la clasificación relativa, lo que resulta útil cuando el objetivo es determinar quién es el mejor (por ejemplo, en las admisiones a universidades de élite). [4]

Desacuerdo con los estándares educativos.

Una prueba basada en criterios es más común y más práctica cuando el objetivo es saber si los examinados han aprendido el material requerido. [4]

Sin embargo, algunos críticos se oponen a las "pruebas estandarizadas" no porque se opongan a dar a los estudiantes la misma prueba en condiciones razonablemente similares y calificar las respuestas de la misma manera, sino porque se oponen al tipo de material que normalmente se evalúa en las escuelas. Aunque existen pruebas estandarizadas para atributos no académicos como las Pruebas de Pensamiento Creativo de Torrance , las escuelas rara vez ofrecen pruebas estandarizadas para medir la iniciativa, la creatividad, la imaginación, la curiosidad, la buena voluntad, la reflexión ética o una serie de otras disposiciones y atributos valiosos. [80] En cambio, las pruebas dadas por las escuelas tienden a centrarse menos en el desarrollo moral o del carácter, y más en habilidades académicas identificables individuales, como la comprensión lectora y la aritmética .

El teórico de la educación Bill Ayers ha comentado sobre las limitaciones de las pruebas estandarizadas y escribió que "las pruebas estandarizadas no pueden medir la iniciativa, la creatividad, la imaginación, el pensamiento conceptual, la curiosidad, el esfuerzo, la ironía, el juicio, el compromiso, los matices, la buena voluntad, la reflexión ética, o una serie de otras disposiciones y atributos valiosos. Lo que pueden medir y contar son habilidades aisladas, hechos y funciones específicos, conocimiento del contenido, los aspectos menos interesantes y menos significativos del aprendizaje". [81]

En su libro La vergüenza de la nación , Jonathan Kozol sostiene que los estudiantes sometidos a pruebas estandarizadas son víctimas de una "decapitación cognitiva". Kozol llega a esta conclusión después de hablar con muchos niños en escuelas del centro de la ciudad que no tienen ningún recuerdo espacial del tiempo, los períodos de tiempo y los eventos históricos. Este es especialmente el caso en las escuelas donde, debido a la escasez de fondos y a políticas estrictas de rendición de cuentas, las escuelas han eliminado materias como artes, historia y geografía; para centrarse en el contenido de las pruebas obligatorias. [82]

Examen de ansiedad

Algunas personas se ponen ansiosas al realizar un examen. Este fenómeno es más común en las pruebas de alto riesgo que en las de bajo riesgo. Las pruebas de alto riesgo (ya sean estandarizadas o no estandarizadas) pueden causar ansiedad.

Los propios estudiantes critican que las pruebas, aunque estandarizadas, son injustas para cada estudiante. Algunos estudiantes afirman que son "malos examinadores", lo que significa que se ponen nerviosos y desconcentrados en los exámenes. Por lo tanto, si bien la prueba es estándar y debe proporcionar resultados justos, los examinados afirman que están en desventaja y no tienen forma de demostrar sus conocimientos de otra manera, ya que no existe otra alternativa de prueba que permita a los estudiantes demostrar sus conocimientos y problemas. habilidades para resolver.

Algunos estudiantes tienen ansiedad ante los exámenes . Entre el diez y el cuarenta por ciento de los estudiantes experimentan este tipo de ansiedad. [83] Los niños que viven en la pobreza son los más afectados por la ansiedad ante los exámenes. [84] La ansiedad ante los exámenes se aplica tanto a las pruebas estandarizadas como a las no estandarizadas.

Pruebas de opción múltiple y formatos de prueba

parte de una prueba de opción múltiple
Las pruebas de opción múltiple pueden ser pruebas estandarizadas o no estandarizadas.

Una prueba de opción múltiple proporciona al examinado preguntas junto con una lista predeterminada de posibles respuestas. Es un tipo de pregunta cerrada . El examinado elige la respuesta correcta de la lista.

Muchos críticos de las pruebas estandarizadas se oponen al formato de opción múltiple, que se utiliza comúnmente para pruebas económicas a gran escala y que no es adecuado para algunos propósitos, como ver si el examinado puede escribir un párrafo. Sin embargo, las pruebas estandarizadas pueden utilizar cualquier formato de prueba, incluidas preguntas abiertas , siempre que todos los examinados realicen la misma prueba, en condiciones razonablemente similares, y sean evaluados de la misma manera.

Enseñando para la prueba

Enseñar para el examen es un proceso de limitar deliberadamente la instrucción para centrarse únicamente en el material que se medirá en el examen. Por ejemplo, si el maestro sabe que un próximo examen de historia no incluirá ninguna pregunta sobre la historia de la música o el arte, entonces podría "enseñar para el examen" omitiendo el material del libro de texto sobre música y arte. Los críticos también afirman que los exámenes estandarizados fomentan la " enseñanza para el examen " a expensas de la creatividad y la cobertura en profundidad de temas que no están en el examen. Los críticos dicen que enseñar para exámenes perjudica el aprendizaje de orden superior; transforma lo que los profesores pueden enseñar y limita en gran medida la cantidad de otra información que los estudiantes aprenden a lo largo de los años. [85] Si bien es posible utilizar una prueba estandarizada sin dejar que su contenido determine el plan de estudios y la instrucción, con frecuencia, lo que no se evalúa no se enseña, y la forma en que se evalúa la materia a menudo se convierte en un modelo de cómo enseñar la materia.

Las pruebas impuestas externamente, como las creadas por un departamento de educación para los estudiantes de su área, alientan a los profesores a limitar el formato curricular y enseñar según las pruebas. [86]

La remuneración basada en el desempeño es la idea de que a los docentes se les debe pagar más si los estudiantes obtienen buenos resultados en las pruebas y menos si obtienen malos resultados. [85] Cuando los maestros o las escuelas son recompensados ​​por un mejor desempeño en las pruebas, esas recompensas alientan a los maestros a " enseñar para la prueba " en lugar de proporcionar un plan de estudios rico y amplio. En 2007, un estudio cualitativo realizado por Au Wayne demostró que las pruebas estandarizadas restringen el plan de estudios y fomentan la instrucción centrada en el maestro en lugar del aprendizaje centrado en el estudiante . [87] El gobernador de Nueva Jersey, Chris Christie, propuso una reforma educativa en Nueva Jersey que presiona a los maestros no sólo a "enseñar para el examen", sino también a que sus estudiantes se desempeñen a costa potencial de su salario y seguridad laboral. La reforma pedía un pago basado en el desempeño que dependa del desempeño de los estudiantes en las pruebas estandarizadas y de sus logros educativos. [88]

Los críticos sostienen que el uso excesivo o indebido de estas pruebas perjudica la enseñanza y el aprendizaje al restringir el plan de estudios. Según el grupo FairTest , cuando las pruebas estandarizadas son el factor principal en la rendición de cuentas, las escuelas utilizan las pruebas para definir de manera estricta el currículo y enfocar la instrucción. La rendición de cuentas crea una inmensa presión para el desempeño y esto puede llevar al mal uso y a la mala interpretación de las pruebas estandarizadas. [66]

Crítica de las pruebas

Algunas personas critican las pruebas en general, independientemente de si están estandarizadas o no.

Ver también

Temas principales

Otros temas

Referencias

  1. ^ Popham, WJ (1999). "Por qué las pruebas estandarizadas no miden la calidad educativa". Liderazgo educacional . 56 (6): 8-15.
  2. ^ Phelps, Richard P. "Papel e importancia de las pruebas". educación no partidista.org . Consultado el 17 de mayo de 2016 .
  3. ^ abc Olson, Amy M.; Sabres, Darrell (octubre de 2008). "Pruebas estandarizadas". En Bueno, Thomas L. (ed.). Educación del siglo XXI: un manual de referencia . Publicaciones SAGE. págs. 423–430. doi :10.4135/9781412964012.n46. ISBN 9781452265995. S2CID  241229809.
  4. ^ abcdefghi Allen, G. Donald; Ross, Amanda (10 de noviembre de 2017). "Pruebas y etiquetas de bajo riesgo". Pedagogía y Contenidos en Matemática de Educación Media y Secundaria . Saltador. ISBN 978-94-6351-137-7.
  5. ^ "Servicio civil chino". Enciclopedia Británica . Consultado el 2 de mayo de 2015 .
  6. ^ abcde Mark y Boyer (1996), 9-10.
  7. ^ ab Kazin, Edwards y Rothman (2010), 142.
  8. ^ ab Trahair, Richard (1 de junio de 2015). Comportamiento, tecnología y desarrollo organizacional: Eric Trist y el Instituto Tavistock. Editores de transacciones. ISBN 9781412855495.
  9. ^ Johnson, Robert. "Pruebas estandarizadas." Enciclopedia de reforma educativa y disidencia. Publicaciones SAGE, INC. 2010. 853–856.Web.
  10. ^ Garrison, Mark J. Una medida del fracaso: los orígenes políticos de las pruebas estandarizadas. Albany: Universidad Estatal de Nueva York, 2009. Imprimir.
  11. ^ Darity, William Jr. "Enciclopedia Internacional de Ciencias Sociales". Enciclopedia de información básica . Aprendizaje de Gale Cengage . Consultado el 25 de enero de 2017 .
  12. ^ Gould, SJ, "A Nation of Morons", New Scientist (6 de mayo de 1982), 349–352.
  13. ^ Darity, William Jr. "Enciclopedia Internacional de Ciencias Sociales". Enciclopedias para información previa . Aprendizaje de Gale Cengage . Consultado el 25 de enero de 2017 .
  14. ^ Fletcher, Dan. "Pruebas estandarizadas". Tiempo. Time Inc., 11 de diciembre de 2009. Web. 09 de marzo de 2014.
  15. ^ "¿Qué hay en el ACT?". Secciones del examen ACT. Np, nd Web. 05 mayo 2014
  16. ^ Stiggins, Richard (2002). "Crisis de evaluación: la ausencia de evaluación PARA el aprendizaje" (PDF) . Phi Delta Kappan . 83 (10): 758–765. doi :10.1177/003172170208301010. S2CID  145683785.
  17. ^ ab Strauss, Valerie (11 de marzo de 2015). "Cinco razones por las que las pruebas estandarizadas no van a disminuir". El Washington Post . El Washington Post . Consultado el 26 de enero de 2017 .
  18. ^ "Historia y antecedentes de Ningún niño se queda atrás". Bright Hub Education 9 de junio de 2015. Web. 12 de octubre de 2015. http://www.brighthubeducation.com/student-assessment-tools/3140-history-of-the-no-child-left-behind-act/
  19. ^ "Ley Cada estudiante triunfa (ESSA) | Departamento de Educación de EE. UU.".
  20. ^ Claiborn, Charles. "Pruebas de alto riesgo". Enciclopedia sobre superdotación, creatividad y talento. Publicaciones SAGE, 2009. 9 de abril de 2014.
  21. ^ Valerie, Strauss (21 de junio de 2020). "Parece el principio del fin de la obsesión estadounidense por las pruebas estandarizadas para estudiantes". El Washington Post .
  22. ^ "Inicio: el plan de estudios australiano v8.1". www.australiancurriculum.edu.au . Consultado el 17 de mayo de 2016 .
  23. ^ Cowley, Pedro; MacPherson, Paige (2022). PRUEBAS DE ESTUDIANTES CANADIENSES K-12: Variabilidad regional, margen de mejora (PDF) . ISBN 978-0-88975-694-6. Consultado el 19 de diciembre de 2023 . {{cite book}}: |website=ignorado ( ayuda )
  24. ^ Horowitz, señor; Montgomery, DL (enero de 1993). "Perfil fisiológico de los bomberos comparado con las normas de la población canadiense". Revista Canadiense de Salud Pública . 84 (1): 50–52. ISSN  0008-4263. PMID  8500058.
  25. ^ Asociación Canadiense de Ciencias del Deporte; Programa de Acreditación y Certificación de Evaluación de Fitness; Sociedad Canadiense de Fisiología del Ejercicio; Fitness Canadá (1987). Prueba estandarizada canadiense de aptitud física (CSTF): de 15 a 69 años: manual de interpretación y asesoramiento . Gloucester, Ontario: Sociedad Canadiense de Fisiología del Ejercicio. ISBN 0-662-15736-2. OCLC  16048356.
  26. ^ Página web de ETS Archivada el 18 de junio de 2009 en Wayback Machine sobre la puntuación del GRE.
  27. ^ ab Houtz, Jolayne (27 de agosto de 2000) "Los temporales dedican solo unos minutos a calificar la prueba estatal. Un problema de matemáticas WASL puede tardar 20 segundos; un ensayo, 2.mw-parser-output .frac{white-space:nowrap}.mw -parser-output .frac .num,.mw-parser-output .frac .den{font-size:80%;line-height:0;vertical-align:super}.mw-parser-output .frac .den{ vertical-align:sub}.mw-parser-output .sr-only{border:0;clip:rect(0,0,0,0);clip-path:polygon(0px 0px,0px ​​0px,0px ​​0px); altura:1px;margen:-1px;desbordamiento:hidden;padding:0;position:absolute;width:1px}1⁄2 minutos" Archivado el 10 de marzo de 2007 en Wayback Machine . Seattle Times "En cuestión de minutos, un empleado temporal que gana 10 dólares la hora asigna una puntuación al examen de su hijo"
  28. ^ Rico, Motoko (22 de junio de 2015). "Calificar el núcleo común: no se requiere experiencia docente". Los New York Times . ISSN  0362-4331 . Consultado el 6 de octubre de 2015 .
  29. ^ Lee, Jussim (1989). "Expectativas de los profesores: profecías autocumplidas, sesgos perceptivos y precisión". Revista de Personalidad y Psicología Social . 57 (3): 469–480. doi :10.1037/0022-3514.57.3.469.
  30. ^ Dónde estamos: evaluación y responsabilidad basadas en estándares (Federación Estadounidense de Maestros) [1] Archivado el 24 de agosto de 2006 en Wayback Machine .
  31. ^ "Comité Conjunto sobre Estándares para la Evaluación Educativa". Archivado desde el original el 15 de octubre de 2009 . Consultado el 2 de mayo de 2015 .
  32. ^ Comité Conjunto de Estándares para la Evaluación Educativa. (1988). Los estándares de evaluación del personal: cómo evaluar los sistemas de evaluación de educadores. Archivado el 12 de diciembre de 2005 en Wayback Machine Newbury Park, CA: Sage Publications.
  33. ^ Comité Conjunto de Estándares para la Evaluación Educativa. (1994). Estándares de evaluación de programas, segunda edición. Archivado el 22 de febrero de 2006 en Wayback Machine Newbury Park, CA: Sage Publications.
  34. ^ Comité de Estándares para la Evaluación Educativa. (2003). Los estándares de evaluación de estudiantes: cómo mejorar las evaluaciones de los estudiantes. Archivado el 24 de mayo de 2006 en Wayback Machine Newbury Park, CA: Corwin Press.
  35. ^ Morgan, Hani (2016). "Confiar en pruebas estandarizadas de alto riesgo para evaluar escuelas y maestros: una mala idea". The Clearing House: una revista de estrategias, cuestiones e ideas educativas . 89 (2): 67–72. doi :10.1080/00098655.2016.1156628. S2CID  148015644.
  36. ^ "Los estándares para pruebas educativas y psicológicas". www.apa.org . Consultado el 2 de mayo de 2015 .
  37. ^ Kuncel, NR; Hezlett, SA (2007). "EVALUACIÓN: Las pruebas estandarizadas predicen el éxito de los estudiantes de posgrado". Ciencia . 315 (5815): 1080–81. doi : 10.1126/ciencia.1136618. PMID  17322046. S2CID  143260128.
  38. ^ abcd Phelps, Richard (2005). "Defender las pruebas estandarizadas" . Londres: Psychology Press. ISBN 978-0-8058-4912-7.
  39. ^ ab "Pros y contras de las pruebas estandarizadas". Aprendizaje de Oxford . 2014-10-29 . Consultado el 19 de febrero de 2018 .
  40. ^ "Pros y contras de las pruebas estandarizadas" (PDF) . Universidad de Colombia . Primavera de 2013. Archivado desde el original (PDF) el 27 de enero de 2018 . Consultado el 19 de febrero de 2018 .
  41. ^ ab Hirsch, Eric Jr. (1999). Las escuelas que necesitamos: y por qué no las tenemos . Nueva York: ancla. ISBN 978-0-385-49524-0.
  42. ^ "Crítica FairTest al SAT". fairtest.org. 20 de agosto de 2007.
  43. ^ "Las pruebas estandarizadas no siempre son el mejor indicador de éxito". 20 de agosto de 2007.
  44. ^ Paton, Graeme (6 de julio de 2010). "Las universidades critican la 'inflación de calificaciones' de los exámenes" . El Telégrafo diario . Londres. Archivado desde el original el 12 de enero de 2022.
  45. ^ Vasagar, Jeevan (2 de agosto de 2010). "Temores por los alumnos estatales, ya que las mejores universidades insisten en obtener A * en el nivel A". El guardián . Londres.
  46. ^ Finch, Julia (10 de marzo de 2010). "No saben leer, escribir, llevar el tiempo ni estar ordenados: veredicto del director de Tesco sobre los que abandonan la escuela". El guardián . Londres.
  47. ^ Setos, Larry V.; Laine, Richard D.; Greenwald, Rob (1994). "Hedges LV (1994) Un intercambio: Parte I *: ¿Importa el dinero? Un metaanálisis de estudios de los efectos de los aportes escolares diferenciales en los resultados de los estudiantes". Investigador Educativo . 23 (3): 5-14. doi :10.3102/0013189X023003005. S2CID  36771659.
  48. ^ Coughlan, Sean. Los pobres brillantes 'retenidos durante décadas', BBC , 16 de octubre de 2013. Recuperado el 17 de octubre de 2013.
  49. ^ "La neurociencia de la realización de exámenes estandarizados".
  50. ^ "Las pruebas estandarizadas no muestran lo que saben los niños". 10 de julio de 2017.
  51. ^ "Las pruebas estandarizadas no son una buena indicación de inteligencia fluida según una nueva investigación". 11 de enero de 2014.
  52. ^ "Las pruebas estandarizadas no miden la inteligencia ni la capacidad". 27 de septiembre de 2016.
  53. ^ "Observaciones: los puntajes de las pruebas estandarizadas no reflejan las habilidades de los estudiantes".
  54. ^ Davidson, Cathy (2011). Ahora ya lo ve: cómo la ciencia cerebral de la atención transformará la forma en que vivimos, trabajamos y aprendemos . Nueva York: vikingo.
  55. ^ Noticias de EE. UU. (2 de mayo de 2015). "Escándalo de trampa: los federales dicen que los maestros contrataron suplentes para realizar sus exámenes de certificación". Noticias NBC . Consultado el 2 de mayo de 2015 .
  56. ^ Schmidt, William H.; Houang, Richard T. (2012). "Coherencia curricular y estándares básicos comunes de matemáticas". Investigador Educativo . 41 (8): 294–308. doi :10.3102/0013189x12464517. S2CID  121779439.
  57. ^ Portero, A.; McMaken, J.; Hwang, J.; Yang, R. (2011). "Estándares básicos comunes: el nuevo plan de estudios previsto en EE. UU.". Investigador Educativo . 40 (7): 103–116. doi :10.3102/0013189x11405038. S2CID  51453603.
  58. ^ Layton, Lyndsey (24 de octubre de 2015). "Un estudio dice que las pruebas estandarizadas están abrumando a las escuelas públicas del país". El Washington Post . Consultado el 26 de julio de 2015 .
  59. ^ Doering, Christopher (25 de octubre de 2015). "El plan de Obama limita las pruebas estandarizadas a no más del 2% del tiempo de clase". EE.UU. Hoy en día . Consultado el 26 de julio de 2016 .
  60. ^ Kuczynski-Brown, Alex. "Las pruebas estandarizadas cuestan a los estados $ 1,7 mil millones al año, según un estudio". El Correo Huffington. TheHuffingtonPost.com, 29 de noviembre de 2012. Web. 7 de abril de 2014.
  61. ^ "Los cuatro grandes de la industria de las pruebas". Primera línea de PBS . PBS. 2001 . Consultado el 21 de enero de 2015 .
  62. ^ "Explorar todos los temas: prensa de las academias nacionales". Archivado desde el original el 18 de abril de 2008 . Consultado el 2 de mayo de 2015 .
  63. ^ "Pros y contras de las pruebas estandarizadas" (PDF) . Universidad de Colombia. 21 de noviembre de 2017.
  64. ^ Neill, Monty (otoño de 2009). Las pruebas estandarizadas son injustas y dañinas. Detroit: Farmington Hills, MI: Greenhaven Press. págs. 28–35. ISBN 9780737747812. Consultado el 4 de diciembre de 2016 .
  65. ^ Minero, Barbara (agosto de 2000). "Mentes estandarizadas: el alto precio de la cultura de las pruebas en Estados Unidos y lo que podemos hacer para cambiarla / Contradicciones de la reforma escolar: costos educativos de las pruebas estandarizadas". El Progresista . 64 : 40–43. ProQuest231959849  .
  66. ^ ab Holloway, JH (2001). "El uso y mal uso de las pruebas estandarizadas". Liderazgo educacional . 59 (1): 77.
  67. ^ Murphy, Sara C; Klieger, David M; Borneman, Mateo J; Kuncel, Nathan R. (2009). "El poder predictivo de las declaraciones personales en las admisiones: un metaanálisis y una advertencia". Colegio y Universidad . 84 : 83–86, 88.
  68. ^ Kuncel, Nathan; Sackett, Paul (8 de marzo de 2018). "La verdad sobre el SAT y ACT". El periodico de Wall Street .
  69. ^ Kuncel, Nathan; Hezlett, Sarah A. (2007). "Las pruebas estandarizadas predicen el éxito de los estudiantes de posgrado". Ciencia . 315 (5815): 1080–1. doi : 10.1126/ciencia.1136618. PMID  17322046. S2CID  143260128.
  70. ^ ab Kuncel, Nathan; Hezlett, Sarah A. (2007). "Las pruebas estandarizadas predicen el éxito de los estudiantes de posgrado". Ciencia . 315 (5815): 1080–1081. doi : 10.1126/ciencia.1136618. PMID  17322046. S2CID  143260128.
  71. ^ Parque, Gregorio; Lubinski, David; Benbow, Camilla P. (1 de octubre de 2008). "Las diferencias de capacidad entre personas que tienen títulos proporcionales son importantes para la creatividad científica". Ciencia psicológica . 19 (10): 957–961. doi :10.1111/j.1467-9280.2008.02182.x. PMID  19000201. S2CID  6443429.
  72. ^ Kuncel, Nathan; Arneson (2009). "¿El nivel socioeconómico explica la relación entre las pruebas de admisión y el rendimiento académico postsecundario?". Boletín psicológico : 1–22.
  73. ^ Connelly, Brian S.; Kuncel, Nathan (3 de noviembre de 2012). "Equilibrio de los grupos de tratamiento y control en cuasiexperimentos: una introducción a la puntuación de propensión". Psicología del Personal . 66 (2): 407–442. doi :10.1111/peps.12020.
  74. ^ Sofá, Michael; Frost, Marquesa; Santiago, J.; Hilton, Adriel (9 de septiembre de 2021). "Repensar las pruebas estandarizadas desde una perspectiva de acceso, equidad y rendimiento: ¿ha cambiado algo para los estudiantes afroamericanos?". Revista de iniciativas de investigación . 5 (3). ISSN  2168-9083.
  75. ^ Kuncel, Nathan; Sackett, Paul; Beatty, Adam S. (2 de agosto de 2012). "El papel del estatus socioeconómico en las relaciones entre los grados SAT y en las decisiones de admisión a la universidad". Ciencia psicológica . 23 (9): 1000–7. doi :10.1177/0956797612438732. PMID  22858524. S2CID  22703783.
  76. ^ abcdefg UNIVERSIDAD DE CALIFORNIA, SENADO ACADÉMICO (enero de 2020). "Informe del Grupo de Trabajo sobre Pruebas Estandarizadas del Consejo Académico de la UC" (PDF) .
  77. ^ El consejo editorial (17 de mayo de 2020). "California define las pruebas". El periodico de Wall Street .
  78. ^ Todd Morrison y Melanie Morrison. "Una evaluación metaanalítica de la validez predictiva ..." Revista de medición educativa y psicológica. 1995. Componenteshttp://epm.sagepub.com/content/55/2/309.abstract.
  79. ^ Buckley, Jack; Letukas, Lynn; Wildavsky, Ben (2017), Medición del éxito: exámenes, calificaciones y el futuro de las admisiones universitarias, Baltimore: Johns Hopkins University Press, pág. 344, ISBN 9781421424965
  80. ^ Kohn, Alfie (2000). El caso contra las pruebas estandarizadas: aumentar las puntuaciones, arruinar las escuelas . Portsmouth, Nueva Hampshire: Heinemann. ISBN 978-0325003252.
  81. ^ Enseñar: el viaje de un maestro, por William Ayers, Teachers College Press, 1993, ISBN 0-8077-3985-5 , ISBN 978-0-8077-3985-3 , pág. 116  
  82. ^ Kozol, Jonathan (2005). La vergüenza de la nación: la restauración de la escolarización del apartheid en Estados Unidos . Impresión: Casa aleatoria. págs. 118-119. ISBN 9781415924167.
  83. ^ Madera; Ciervo; Pequeño; Phillips (2016). "Ansiedad ante los exámenes y una prueba estandarizada de comprensión lectora de alto riesgo: una perspectiva de la genética del comportamiento". Merrill-Palmer trimestral . 62 (3): 233–251. doi :10.13110/merrpalmquar1982.62.3.0233. ISSN  0272-930X. PMC 5487000 . PMID  28674461. 
  84. ^ "Pruebas y sesgo de estrés". Escuela de Graduados en Educación de Harvard . 12 de febrero de 2019 . Consultado el 27 de octubre de 2022 .
  85. ^ ab Williams, María (2015). "Las pruebas estandarizadas están perjudicando el aprendizaje de los estudiantes". go.galegroup.com . Consultado el 28 de marzo de 2018 .
  86. ^ "Goswami U (1991) puesto a prueba: los efectos de las pruebas externas en los profesores. Investigador educativo 20: 8-11". Archivado desde el original el 2 de febrero de 2013.
  87. ^ Au, Wayne (1 de junio de 2007). "Pruebas de alto riesgo y control curricular: una metasíntesis cualitativa". Investigador Educativo . 36 (5): 258–267. doi :10.3102/0013189X07306523. ISSN  0013-189X. S2CID  507582.
  88. ^ Arco, Matt (12 de junio de 2015). "Discurso sobre educación de Christie en Iowa". Nueva Jersey.com . Consultado el 25 de julio de 2016 .

95.) Examinadores 1

96.) Examinadores 2

Otras lecturas

enlaces externos