Evaluación basada en estándares específicos
En un entorno educativo, la evaluación basada en estándares [1] es una evaluación que se basa en la evaluación de la comprensión del alumno con respecto a estándares acordados, también conocidos como "resultados". Los estándares establecen los criterios para la demostración exitosa de la comprensión de un concepto o habilidad. [2]
Descripción general
En el paradigma basado en estándares , [3] los estudiantes tienen la libertad de demostrar su comprensión de diversas maneras, incluyendo (pero no limitado a) respuestas seleccionadas (por ejemplo, pruebas de opción múltiple), construcciones físicas, respuestas escritas y desempeños. Por supuesto, estos no son nuevos tipos de evaluaciones, ni tampoco lo es el concepto de evaluación diferenciada . El profesor utiliza todas las observaciones y la información cuantitativa disponibles para resumir el aprendizaje con referencia a un estándar específico. Con estos datos, un profesor puede formular los pasos o acciones que se pueden tomar para obtener el dominio de un concepto en particular. Es decir, ayuda en la evaluación para el aprendizaje .
Uno de los aspectos clave de la evaluación basada en estándares es la retroalimentación posterior a la evaluación. La retroalimentación que recibe un estudiante de este tipo de evaluación no enfatiza una puntuación, un porcentaje o un promedio estadístico, sino información sobre las expectativas de desempeño en comparación con el estándar. Un enfoque basado en estándares no descarta necesariamente una calificación sumativa, un porcentaje o una medida de tendencia central (como una media o una mediana). Sin embargo, una evaluación que no haga referencia a un estándar ni brinde retroalimentación con respecto a él no estaría basada en estándares. Existe una gran cantidad de evidencia que señala la eficacia de una retroalimentación adecuada. [4]
Objetivo
El objetivo de la evaluación basada en estándares [5] es vincular la evidencia del aprendizaje con los resultados del aprendizaje (los estándares). Cuando los estándares son explícitos y claros, el alumno toma conciencia de sus logros con referencia a los estándares, y el docente puede utilizar los datos de la evaluación para dar retroalimentación significativa a los estudiantes sobre este progreso. La conciencia del propio aprendizaje permite a los estudiantes señalar un estándar específico de logro y, por lo tanto, fortalece la autorregulación y la metacognición, dos habilidades que generalmente se entienden como estrategias de aprendizaje efectivas. [6]
Marco del enfoque basado en estándares en la evaluación
Un enfoque común para la evaluación basada en estándares (SBA) es:
- Identificar un hecho clave o un cuerpo importante de conocimientos (por ejemplo, una teoría científica, una relación matemática), el contenido y los conceptos esenciales.
Ejemplo del paquete curricular de tercer grado de Columbia Británica (septiembre de 2010):
- "Se espera que los estudiantes vean y demuestren comprensión de textos visuales (por ejemplo, dibujos animados, ilustraciones, diagramas, carteles)" [7]
Ejemplo del documento curricular de Nueva Zelanda Estándares de matemáticas para los años 1 a 8 , al final del año 5:
- “En contextos que requieran resolver problemas o modelar situaciones, los estudiantes podrán crear, continuar y predecir más miembros de patrones secuenciales con dos variables” [8]
- Identificar los indicadores (es decir, evidencia) que los estudiantes mostrarán cuando hayan comprendido el concepto o contenido.
Respectivamente al ejemplo del paquete curricular de tercer grado de Columbia Británica:
- "describir mensajes e imágenes clave y detalles relevantes en respuesta a preguntas o actividades" [7]
- Elija una colección de evaluaciones que permitan a los estudiantes demostrar los indicadores.
- Utilizando una escala o rúbrica, se identifica el nivel de competencia del estudiante con respecto al estándar. Este progreso se pone a disposición del alumno para proporcionarle retroalimentación significativa. Toda retroalimentación debe poder brindar información sobre cómo se puede mejorar la competencia [4] y el educador debe ser consciente de los efectos de los elogios durante la retroalimentación. [9]
- Repetir la instrucción, la evaluación y la retroalimentación hasta que el estudiante logre un nivel predeterminado de dominio.
Señas de identidad
- Los estándares (es decir, los resultados del aprendizaje) deben ser visibles y comprensibles para los estudiantes.
- Las tareas, actividades y evaluaciones deben ser claras sobre qué estándar se está practicando.
- La evaluación formativa debe utilizarse para dar retroalimentación a los estudiantes sobre su progreso hacia un estándar.
- La evaluación en general debe estar bien diseñada, ser precisa y tener una alta validez para ser justa y accesible.
- Se deben utilizar ejemplos para que los estudiantes comprendan cómo se mide el logro en relación con un estándar.
- Se deben utilizar rúbricas para evaluar el desempeño y las respuestas elaboradas [10]
- Se debe utilizar la respuesta selectiva (por ejemplo, opción múltiple) para evaluar la comprensión y el conocimiento básicos (como en la taxonomía de Bloom ) de un estándar específico (o los conceptos prerrequisitos subyacentes asociados con el estándar).
Distinciones geográficas
Estados Unidos
Una prueba basada en estándares es una evaluación basada en la filosofía de la educación basada en resultados o en el desempeño. [11] La evaluación es una parte clave del movimiento de reforma de estándares. La primera parte es establecer estándares nuevos y más altos que se esperan de cada estudiante. Luego, el currículo debe estar alineado con los nuevos estándares. Finalmente, se debe evaluar al estudiante para ver si cumple con estos estándares de lo que todo estudiante "debe saber y ser capaz de hacer". En los Estados Unidos, un diploma de escuela secundaria que se otorga al aprobar un examen de graduación de la escuela secundaria [12] o un Certificado de dominio inicial se otorga solo cuando se alcanzan estos estándares. Se espera plenamente que todos los niños se vuelvan competentes en todas las áreas de habilidades académicas al final de un período, generalmente 10 años en los Estados Unidos, pero a veces más largo, después de la aprobación de un proyecto de ley de reforma educativa por una legislatura estatal. El gobierno federal de los Estados Unidos, bajo la ley No Child Left Behind , puede exigir además que todas las escuelas demuestren una mejora entre todos los estudiantes, incluso si ya son todos más competentes.
Clasificación holística
En lugar de utilizar computadoras para registrar las respuestas a las pruebas de opción múltiple, las rúbricas para las evaluaciones estatales, como en Carolina del Norte [13], piden a los evaluadores que observen todo el documento y emitan juicios. Los evaluadores no pueden contar los errores y las rúbricas no contienen mediciones numéricas de cuántos errores ortográficos o gramaticales constituyen un "1" o un "2". La sección de escritura analítica del examen GRE se califica utilizando una escala holística de seis puntos en incrementos de medio punto. [14] La calificación holística es una de las principales razones de desacuerdo entre los evaluadores, pero por esta razón algunas pruebas se califican más de una vez para verificar si hay acuerdo.
Ventajas
- Los estudiantes son comparados con un estándar que todos pueden alcanzar, en lugar de ser clasificados artificialmente en una curva de campana donde algunos estudiantes deben ser considerados fracasados y solo a unos pocos se les permite tener éxito.
- Los humanos, no las computadoras, pueden evaluar el valor total de una respuesta en lugar de imponer un correcto o incorrecto estricto que no esté abierto a interpretación.
- La respuesta libre utiliza y pone a prueba el pensamiento de orden superior , lo cual es importante en la mayoría de los nuevos estándares educativos .
- Se ha demostrado que las pruebas de opción múltiple calificadas por computadora tienen efectos nocivos para las minorías, negándoles oportunidades injustamente.
- Sólo una prueba basada en estándares está alineada con una reforma educativa basada en estándares, que se fundamenta en la creencia de que todos los estudiantes pueden tener éxito, no sólo unos pocos.
- Aprobar un examen de décimo grado y otorgar un Certificado de dominio inicial garantiza que todos los estudiantes se graduarán con las habilidades que necesitan para tener éxito en la economía de clase mundial del siglo XXI.
- Los estudiantes ya no serán engañados al pasarlos al siguiente grado sin obtener lo que todo niño del grado debe ser capaz de saber y hacer.
- Cuando todos los estudiantes aprueben todos los estándares, como es la creencia central de la reforma educativa basada en estándares , todos los estudiantes de todos los grupos demográficos obtendrán el mismo puntaje en las pruebas, eliminando la misteriosa brecha de logros que se ha demostrado anteriormente que existe entre todos los grupos en todas las pruebas. Sin embargo, hasta 2006, ninguna evaluación basada en estándares ha logrado aún este objetivo optimista (los críticos podrían decir que es imposible), aunque muchas muestran puntajes en aumento.
Contras
En comparación con una prueba de opción múltiple basada en normas , una prueba basada en estándares se puede reconocer por:
- Se determina una puntuación límite para distintos niveles de desempeño. No existen puntuaciones límite para las pruebas basadas en normas. No existe una puntuación de desaprobación en el examen SAT . Cada universidad o institución establece sus propios estándares de puntuación para la admisión o los premios.
- Se establecen distintos niveles de desempeño. Por lo general, son: superior al estándar, cumple con el estándar y por debajo del estándar. Estos niveles suelen establecerse en un proceso de evaluación comparativa, aunque dicho proceso no tenga en cuenta si los elementos de la prueba son adecuados para el nivel del grado.
- Las pruebas se califican de forma integral respecto de una respuesta escrita libremente, a menudo con imágenes, en lugar de calificarse como correcta o incorrecta entre múltiples opciones.
- Debido a esto, las pruebas son más caras de calificar, normalmente cuestan entre 25 y 30 dólares por prueba, en comparación con los 2 y 5 dólares, sin incluir el costo de desarrollo de la prueba, que suele ser diferente cada año para cada estado.
- Los exámenes son más difíciles de calificar porque, por lo general, se califican con un puñado de ejemplos y no más de uno o dos en cada nivel de puntuación. No se pueden calificar por computadora.
- Las pruebas son menos fiables. La concordancia puede estar entre el 60 y el 80 por ciento en una escala de 4 puntos y considerarse precisa.
- Los calificadores no necesitan credenciales de enseñanza, solo una licenciatura en cualquier campo, y generalmente se les paga entre $8 y $11 por hora por trabajo a tiempo parcial.
- Las tasas de fracaso, que llegan al 80 o 95 por ciento, no sólo no son inusuales, sino que son totalmente esperables y se anuncian cuando se presentan los programas de prueba a la prensa local. Con los criterios de graduación tradicionales, los afroamericanos habían alcanzado tasas de graduación nacionales que estaban a unos pocos puntos de los blancos. En 2006, la superintendente Terry Bergeson prometió a tres cuartas partes de los afroamericanos que no aprobaron el WASL que no obtendrían un diploma si no aprobaban las repeticiones del examen en dos años, a pesar de que ella había prometido anteriormente que "todos los estudiantes" obtendrían un diploma de primera clase.
- Las tasas de fracaso de los estudiantes de minorías y de educación especial suelen ser dos a cuatro veces más altas que las de los grupos mayoritarios, ya que las preguntas de respuesta extendida son más difíciles de responder que las de opción múltiple.
- El contenido suele ser difícil de responder rápidamente, incluso para los adultos, incluso en niveles tan bajos como el cuarto grado, especialmente en matemáticas. El profesor Don Orlich calificó la WASL como un "desastre", ya que las pruebas de matemáticas y ciencias se encuentran muy por encima del nivel de desarrollo normal de los estudiantes en muchos niveles.
- Las matemáticas tienen una alta proporción de estadística y geometría y un bajo contenido de aritmética simple.
- Las escuelas reciben una puntuación de cero para los estudiantes que no toman el examen.
- Aprobar un examen de este tipo en el décimo grado generalmente se considera un requisito para graduarse de la escuela secundaria.
- Aprobar dicha prueba, en lugar del percentil 50, se define como desempeño de nivel de grado .
- Una pregunta con una respuesta correcta puede calificarse como incorrecta si no muestra cómo se llegó a la respuesta. Una pregunta con una conclusión numérica incorrecta no necesariamente puede calificarse como incorrecta. [15]
- El primer año de la prueba CLAS en California no permitió calificaciones altas de '4' en matemáticas, ni siquiera en las escuelas con las puntuaciones más altas, con el fin de dejar espacio para la mejora [16]
- El proyecto de redacción de Carolina del Norte arrojó menos del 1 por ciento de las puntuaciones ejemplares de "4". En esos trabajos se empleaba un vocabulario y un conocimiento a un nivel que a veces superaba al de los estudiantes de último año de universidad y estaba muy por encima del público al que se dirigía un estudiante de secundaria. [17] Este nivel sería incluso más difícil que conseguir una puntuación en el SAT suficiente para entrar en una universidad privada de la Ivy League.
- Los puntajes generalmente aumentan mucho más rápido que los de pruebas estandarizadas como NAEP o SAT realizadas durante el mismo período de tiempo. [18]
Véase también
Referencias
- ^ Asociación, Grandes Escuelas (30 de enero de 2014). "Definición basada en estándares". El glosario de la reforma educativa . Consultado el 22 de mayo de 2018 .
- ^ Evaluación basada en estándares , consultado el 20 de febrero de 2016
- ^ "Líderes de su propio aprendizaje: Capítulo 8: Calificación basada en estándares | EL Education". eleducation.org . Consultado el 22 de mayo de 2018 .
- ^ de John Hattie , Power of Feedback (PDF) , consultado el 20 de febrero de 2016
- ^ Glavin, Chris (6 de febrero de 2014). "Evaluación basada en estándares | Académicos K12". www.k12academics.com . Consultado el 22 de mayo de 2018 .
- ^ Emily R. Lai, Metacognición: una revisión de la literatura (PDF) , consultado el 20 de febrero de 2016
- ^ ab Ministerio de Educación de Columbia Británica, Paquete curricular de tercer grado (PDF) , Ministerio de Educación, Columbia Británica , consultado el 21 de febrero de 2016
- ^ Ministerio de Educación de Nueva Zelanda, "Estándares de matemáticas para los años 1 a 8" (PDF) , New Zealand Curriculum Online , Ministerio de Educación , consultado el 21 de febrero de 2016
- ^ Carol Dwyer, "Usar elogios para mejorar la resiliencia y los resultados de aprendizaje de los estudiantes", American Psychological Association , consultado el 21 de marzo de 2016
- ^ Susan M. Brookhart, Cómo crear y utilizar rúbricas para la evaluación formativa y la calificación , consultado el 20 de febrero de 2016
- ^ [1] 18 de enero de 2006 La prueba basada en estándares traza un plan para generar conciencia Jackie Schlotfeldt Redactora del News-Bulletin Boletín del News-Bulletin del condado de Valencia "Con las Evaluaciones Basadas en Estándares de Nuevo México a poco más de un mes de distancia"
- ^ Glavin, Chris (6 de febrero de 2014). "Examen de graduación de la escuela secundaria | Académicos K12". www.k12academics.com . Consultado el 22 de mayo de 2018 .
- ^ AFT - Temas de actualidad - Reforma basada en estándares Guía de calificación holística enfocada en Carolina del Norte: Composición expositiva, séptimo grado, [2]
- ^ Actualización del GRE - marzo de 2006 La sección de escritura analítica del examen general seguirá calificándose utilizando la escala holística de seis puntos en incrementos de medio punto [3]
- ^ Problemas matemáticos publicados por WASL en 1997
- ^ Testimonio de Maureen DiMarco ante los legisladores del estado de Washington
- ^ En una sesión de calificación en Auburn en 2004, ningún calificador pudo identificar algunas de las palabras utilizadas en algunos trabajos.
- ^ Estudio de Rand sobre Kentucky KIRIS
Enlaces externos
- Federación Estadounidense de Maestros. Nuestra posición: evaluación basada en estándares y rendición de cuentas
- "Por qué el WASL es terrible", publicación distribuida por Ciudadanos Unidos por una Educación Responsable, Estado de Washington.
- Phelps, Richard P. El efecto de las pruebas en el rendimiento estudiantil, 1910-2010, International Journal of Testing, 10(1), 2012.
- Phelps, Richard P., Manual de evaluación estandarizada. (Nueva York, NY: Peter Lang, 2007)