La Evaluación Nacional del Progreso Educativo ( NAEP , por sus siglas en inglés) es la evaluación continua y representativa a nivel nacional más grande de lo que los estudiantes estadounidenses saben y pueden hacer en varias materias. NAEP es un proyecto ordenado por el Congreso administrado por el Centro Nacional de Estadísticas de Educación (NCES, por sus siglas en inglés) , dentro del Instituto de Ciencias de la Educación (IES, por sus siglas en inglés) del Departamento de Educación de los Estados Unidos . La primera administración nacional de NAEP ocurrió en 1969. [1] La Junta de Gobierno de la Evaluación Nacional (NAGB, por sus siglas en inglés) es una junta independiente y bipartidista que establece la política para NAEP y es responsable de desarrollar el marco y las especificaciones de la prueba. La Junta de Gobierno de la Evaluación Nacional, cuyos miembros son designados por el Secretario de Educación de los Estados Unidos , incluye gobernadores, legisladores estatales, funcionarios escolares locales y estatales, educadores, representantes comerciales y miembros del público en general. El Congreso creó la Junta de Gobierno de 26 miembros en 1988.
Los resultados de NAEP están diseñados para proporcionar datos a nivel de grupo sobre el rendimiento de los estudiantes en varias materias, y se publican como The Nation's Report Card. [2] No hay resultados para estudiantes, aulas o escuelas individuales. NAEP informa los resultados para diferentes grupos demográficos, incluidos el género, el nivel socioeconómico y la raza/etnia. Las evaluaciones se realizan con mayor frecuencia en matemáticas , lectura , ciencias y escritura . Otras materias como las artes , la educación cívica , la economía , la geografía , la alfabetización en tecnología e ingeniería (TEL) y la historia de los EE. UU. se evalúan periódicamente.
Además de evaluar el rendimiento de los estudiantes en diversas materias, NAEP también realiza encuestas a estudiantes, maestros y administradores escolares para ayudar a proporcionar información contextual. Las preguntas sobre la raza o etnia de los participantes, la asistencia a la escuela y las expectativas académicas ayudan a los responsables de las políticas, los investigadores y el público en general a comprender mejor los resultados de la evaluación.
Los maestros, directores, padres, legisladores e investigadores utilizan los resultados de la NAEP para evaluar el progreso de los estudiantes en todo el país y desarrollar formas de mejorar la educación en los Estados Unidos. La NAEP ha proporcionado datos sobre el desempeño de los estudiantes desde 1969. [3] [4]
La NAEP utiliza un procedimiento de muestreo que permite que la evaluación sea representativa de la diversidad geográfica, racial, étnica y socioeconómica de las escuelas y los estudiantes de los Estados Unidos. [ cita requerida ] También se proporcionan datos sobre los estudiantes con discapacidades y los estudiantes que están aprendiendo inglés. Las evaluaciones de la NAEP se administran a los estudiantes participantes utilizando los mismos cuadernillos de prueba y procedimientos, excepto las adaptaciones para estudiantes con discapacidades, [5] [6] por lo que los resultados de la NAEP se utilizan para la comparación de los estados y distritos urbanos que participan en la evaluación.
Existen dos sitios web de NAEP: el sitio web de NCES NAEP y el sitio web de The Nation's Report Card. El primer sitio detalla el programa NAEP de manera integral, mientras que el segundo se centra principalmente en las publicaciones de datos individuales.
La NAEP comenzó en 1964, con una subvención de la Carnegie Corporation para crear el Comité Exploratorio para la Evaluación del Progreso en Educación (ESCAPE). Las primeras evaluaciones nacionales se llevaron a cabo en 1969. Las evaluaciones voluntarias para los estados comenzaron en 1990 a modo de prueba y en 1996 se convirtieron en una característica permanente de la NAEP y se administraron cada dos años. En 2002, distritos urbanos seleccionados participaron en las evaluaciones a nivel estatal a modo de prueba y continúan como la Evaluación de Distritos Urbanos de Prueba (TUDA).
El desarrollo de un programa NAEP exitoso ha involucrado a muchas personas, entre ellas investigadores, funcionarios de educación estatales, contratistas, formuladores de políticas, estudiantes y maestros. [7]
Existen dos tipos de evaluaciones de NAEP: la NAEP principal y la NAEP de tendencia a largo plazo. Esta separación permite cumplir dos objetivos:
Las principales evaluaciones de NAEP se realizan en una variedad de materias con estudiantes de cuarto, octavo y duodécimo grado en todo el país. Las evaluaciones se realizan con mayor frecuencia en matemáticas, lectura, ciencias y escritura. Otras materias, como artes, educación cívica, economía, geografía, alfabetización en tecnología e ingeniería (TEL) e historia de los EE. UU., se evalúan periódicamente.
Estas evaluaciones siguen los marcos temáticos desarrollados por la NAGB y utilizan los últimos avances en metodología de evaluación. [8] En el marco de la NAEP principal, los resultados se informan a nivel nacional y, en algunos casos, a nivel estatal y distrital.
La NAEP nacional informa sobre el desempeño de los estudiantes y los factores relacionados con el desempeño educativo en el país y para grupos demográficos específicos de la población (por ejemplo, raza/etnia, género). Incluye a estudiantes de escuelas públicas y no públicas (privadas) y, según la materia, informa los resultados de los grados 4, 8 y 12.
Los resultados de la NAEP estatal están disponibles en algunas materias para los grados 4 y 8. Esto permite que los estados participantes monitoreen su propio progreso a lo largo del tiempo en matemáticas, lectura, ciencias y escritura. Luego pueden comparar los conocimientos y las habilidades de sus estudiantes con los de otros estados y con los de la nación.
Las evaluaciones que se realizan en los estados son exactamente las mismas que las que se realizan a nivel nacional. Tradicionalmente, la NAEP estatal se evaluaba solo en los grados 4 y 8. Sin embargo, un programa piloto de 2009 [9] permitió que 11 estados (Arkansas, Connecticut, Florida, Idaho, Illinois, Iowa, Massachusetts, New Hampshire, New Jersey, Dakota del Sur y Virginia Occidental) recibieran puntajes a nivel de duodécimo grado.
Hasta 1988, la NAEP informaba únicamente sobre el rendimiento académico de la nación en su conjunto y de los grupos demográficos dentro de la población. En 1988, el Congreso aprobó una ley que autorizaba una evaluación estatal de prueba voluntaria. Se seleccionaron muestras representativas separadas de estudiantes de cada estado o jurisdicción que aceptaron participar en la NAEP estatal. Se realizaron evaluaciones estatales de prueba en 1990, 1992 y 1994. A partir de la evaluación de 1996, el estatuto de autorización ya no consideró el componente estatal como una "prueba".
En 2001 se produjo un cambio significativo en la NAEP estatal con la reautorización de la Ley de Educación Primaria y Secundaria , también conocida como la legislación "Ningún niño se queda atrás" . Esta legislación exige que los estados que reciben fondos del Título I participen en las evaluaciones estatales de NAEP en matemáticas y lectura en los grados 4 y 8 cada dos años. La participación estatal en otras materias evaluadas por la NAEP estatal (ciencias y escritura) sigue siendo voluntaria.
Al igual que todas las evaluaciones NAEP, la NAEP estatal no proporciona puntajes individuales para los estudiantes o las escuelas evaluadas.
La Evaluación de prueba de distritos urbanos ( TUDA , por sus siglas en inglés) es un proyecto desarrollado para determinar la viabilidad de utilizar la NAEP para informar sobre el desempeño de los estudiantes de las escuelas públicas a nivel de distrito. Tal como lo autorizó el Congreso, la NAEP ha administrado las evaluaciones de matemáticas, lectura, ciencias y escritura a muestras de estudiantes en distritos urbanos seleccionados.
TUDA comenzó con seis distritos urbanos en 2002 y desde entonces se ha expandido a 27 distritos para el ciclo de evaluación de 2017.
La NAEP de tendencia a largo plazo se administra periódicamente a estudiantes de 9, 13 y 17 años a nivel nacional. Las evaluaciones de tendencia a largo plazo miden el desempeño de los estudiantes en matemáticas y lectura y permiten comparar el desempeño de los estudiantes de hoy con el de los estudiantes desde principios de la década de 1970.
Aunque tanto la evaluación de tendencia a largo plazo como la evaluación principal de NAEP evalúan matemáticas y lectura, existen varias diferencias entre ellas. En particular, las evaluaciones difieren en el contenido evaluado, la frecuencia con la que se administra la evaluación y la forma en que se informan los resultados. Estas y otras diferencias significan que los resultados de la evaluación de tendencia a largo plazo y la evaluación principal de NAEP no se pueden comparar directamente. [10]
Aunque la NAEP se administra desde la década de 1970, en 2021 los funcionarios del Departamento de Educación de EE. UU. decidieron posponer la evaluación en matemáticas y lectura debido a la pandemia de COVID-19. Las razones para posponerla incluyen la posibilidad de que haya muestras de estudiantes sesgadas, así como resultados debido a las diferentes opciones de aprendizaje a distancia y por preocupaciones de seguridad para los supervisores y los estudiantes. [11]
La NAGB establece el calendario de evaluaciones de NAEP. Consulte el calendario completo de evaluaciones para conocer todas las evaluaciones de NAEP desde 1968 y las que se planean hasta 2017.
Las evaluaciones principales de NAEP se realizan normalmente durante aproximadamente seis semanas entre fines de enero y principios de marzo de cada año. Las evaluaciones de tendencias a largo plazo se realizan normalmente cada cuatro años por grupo de edad entre octubre y mayo. Todas las evaluaciones son administradas por personal de campo contratado por NAEP en todo el país.
La NAEP se lleva a cabo en colaboración con los estados. El programa NAEP proporciona fondos para un NSC de tiempo completo en cada estado. Él o ella actúa como enlace entre la NAEP, la agencia educativa del estado y las escuelas seleccionadas para participar.
Los NSC brindan muchos servicios importantes para el programa NAEP y son responsables de:
Si bien la mayoría de las evaluaciones de NAEP se realizan en formato de papel y lápiz, NAEP está evolucionando para abordar el cambiante panorama educativo a través de su transición a evaluaciones digitales. NAEP está utilizando la última tecnología disponible para realizar evaluaciones a los estudiantes y, a medida que la tecnología evolucione, también lo hará la forma en que se realizan las evaluaciones de desempeño. El objetivo es que todas las evaluaciones de NAEP no utilicen papel para fines de la década. La evaluación de escritura de 2011 fue la primera que se realizó completamente por computadora.
En 2009, se administraron TIC como parte de la evaluación científica en papel y lápiz. La administración por computadora permite medir los conocimientos, procesos y habilidades científicas que no se pueden evaluar en otros modos. Las tareas incluyeron la realización de investigaciones que incluyen observaciones de fenómenos que de otro modo llevarían mucho tiempo, la modelización de fenómenos a gran escala o invisibles a simple vista y la investigación de amplios documentos de recursos.
Este estudio especial sobre pruebas de varias etapas, implementado en 2011, investigó el uso de los principios de las pruebas adaptativas en el contexto de NAEP. Se le proporcionó a una muestra de estudiantes una evaluación de matemáticas en línea que se adapta a su nivel de habilidad. Todos los ítems del estudio son ítems existentes de NAEP.
El marco de evaluación TEL describe la alfabetización tecnológica y de ingeniería como la capacidad de utilizar, comprender y evaluar la tecnología, así como de comprender los principios y las estrategias tecnológicas necesarias para desarrollar soluciones y alcanzar objetivos. Las tres áreas de la evaluación son:
Los estudiantes de octavo grado de todo el país tomaron la evaluación en el invierno de 2014. Los resultados de esta evaluación se publicaron en mayo de 2016.
En 2011, la NAEP cambió su evaluación de escritura (en los grados 8 y 12) de papel y lápiz a una administración basada en computadora para medir la capacidad de los estudiantes para escribir usando una computadora. La evaluación aprovecha muchas características de la tecnología digital actual y las tareas se entregan en formatos multimedia, como videos cortos y audio. Además, en un esfuerzo por incluir a la mayor cantidad posible de estudiantes, el sistema de evaluación de escritura basado en computadora ha incorporado varias características de diseño universal, como texto a voz, tamaño de fuente ajustable y corrector ortográfico electrónico. En 2012, la NAEP puso a prueba la evaluación basada en computadora para estudiantes de cuarto grado.
Además de las evaluaciones, NAEP coordina una serie de estudios especiales relacionados que a menudo implican procesos especiales de recopilación de datos, análisis secundarios de los resultados de NAEP y evaluaciones de procedimientos técnicos.
Las brechas de rendimiento se producen cuando un grupo de estudiantes supera a otro grupo y la diferencia en las puntuaciones medias de los dos grupos es estadísticamente significativa (es decir, mayor que el margen de error). En los informes iniciales publicados, NAEP destaca las brechas de rendimiento entre los grupos de estudiantes. Sin embargo, NAEP también ha publicado una serie de informes y resúmenes de datos que destacan la brecha de rendimiento. Algunos ejemplos incluyen la Composición escolar y la Brecha de rendimiento entre negros y blancos y la Brecha de rendimiento entre hispanos y blancos y la Brecha de rendimiento entre negros y blancos. [12] Estas publicaciones utilizan las puntuaciones de NAEP en matemáticas y/o lectura para estos grupos para proporcionar resúmenes de datos o iluminar patrones y cambios en estas brechas a lo largo del tiempo. Los informes de investigación, como la Composición escolar y la Brecha de rendimiento entre negros y blancos, también incluyen advertencias y precauciones para la interpretación de los datos.
El HSTS explora la relación entre el rendimiento de NAEP de grado 12 y las carreras académicas de la escuela secundaria mediante un estudio de los planes de estudio que se siguen en las escuelas secundarias de nuestro país y los patrones de toma de cursos de los estudiantes de la escuela secundaria a través de una colección de transcripciones. Estudios recientes han puesto énfasis en la educación STEM y su correlación con el rendimiento de los estudiantes en las evaluaciones de matemáticas y ciencias de NAEP. [ cita requerida ]
El Estudio de Tendencias Internacionales en Matemáticas y Ciencias (TIMSS, por sus siglas en inglés) es una evaluación internacional de la Asociación Internacional para la Evaluación del Logro Educativo (IEA, por sus siglas en inglés) que mide el aprendizaje de los estudiantes en matemáticas y ciencias. El NCES inició el estudio de vinculación NAEP-TIMSS para que los estados y distritos seleccionados puedan comparar el desempeño de sus propios estudiantes con los puntos de referencia internacionales. El estudio de vinculación se llevó a cabo en 2011 en octavo grado en matemáticas y ciencias. El NCES "proyectará" las puntuaciones a nivel estatal y distrital en TIMSS en ambas materias utilizando datos de NAEP.
El NIES es un estudio de dos partes diseñado para describir la situación de la educación de los estudiantes indios americanos y nativos de Alaska en los Estados Unidos. La primera parte del estudio consta de los resultados de las evaluaciones de matemáticas y lectura de los grados 4 y 8. La segunda parte presenta los resultados de una encuesta realizada a estudiantes indios americanos y nativos de Alaska, sus maestros y los administradores de sus escuelas. Las encuestas se centran en las experiencias culturales de los estudiantes dentro y fuera de la escuela.
En virtud de la reautorización de la Ley de Educación Elemental y Secundaria (ESEA) de 1965, en 2001, los estados desarrollan sus propias evaluaciones y establecen sus propios estándares de competencia para medir el rendimiento de los estudiantes. Cada estado controla sus propios programas de evaluación, incluido el desarrollo de sus propios estándares, lo que da como resultado una gran variación entre los estados en las prácticas de evaluación de los estudiantes a nivel estatal. Esta variación crea un desafío para comprender los niveles de rendimiento de los estudiantes en todo Estados Unidos. Desde 2003, el NCES ha apoyado la investigación que compara los estándares de competencia de NAEP con los de los estados individuales. Las evaluaciones estatales se colocan en una escala común definida por las puntuaciones de NAEP, lo que permite comparar los estándares de competencia de los estados no solo con NAEP, sino también entre sí. El NCES ha publicado el informe Mapping State Proficiency Standards utilizando datos estatales de matemáticas y lectura en 2003, 2005, 2007, 2009 y, más recientemente, 2013. [13]
A lo largo de los años, el NCES ha llevado a cabo una serie de estudios relacionados con diferentes aspectos del programa NAEP. A continuación, se enumeran algunos estudios recientes:
El uso intensivo de pruebas de hipótesis estadísticas por parte de la NAEP ha suscitado algunas críticas relacionadas con la interpretación de los resultados. Por ejemplo, el Informe Nacional de Calificaciones informó que "los varones superan a las mujeres en los tres grados en 2005" como resultado de las puntuaciones de las pruebas de ciencias de 100.000 estudiantes en cada grado. [14] Hyde y Linn criticaron esta afirmación, porque la diferencia media era de sólo 4 de 300 puntos, lo que implica un tamaño de efecto pequeño y distribuciones muy superpuestas. Argumentan que "las pequeñas diferencias en el rendimiento en la NAEP y otros estudios reciben una amplia publicidad, lo que refuerza sesgos sutiles y persistentes". [15]
La elección de la NAEP de qué respuestas marcar como correctas o incorrectas también ha sido criticada, un problema que ocurre también en otros países. [16] Por ejemplo, una pregunta de historia preguntaba sobre la sentencia Brown v. Board of Education de 1954 , y se refería explícitamente a la decisión de 1954 que identificó el problema, no a la decisión de 1955 que ordenó la desegregación. La NAEP pidió a los estudiantes que "describan las condiciones que esta decisión de 1954 fue diseñada para corregir". Marcaron como incorrectas a los estudiantes que mencionaron la segregación sin mencionar la desegregación. De hecho, la pregunta solo preguntaba sobre las condiciones existentes, no sobre los remedios, y en cualquier caso la decisión de 1954 no ordenó la desegregación. [17] [18] El país esperó hasta la decisión Brown II de 1955 para escuchar sobre "toda la velocidad deliberada". Otra pregunta de historia marcó incorrectamente a los estudiantes que sabían que Estados Unidos luchó contra los rusos, así como contra los chinos y los norcoreanos en la Guerra de Corea . Otras preguntas publicadas sobre matemáticas y escritura han recibido críticas similares. Las respuestas matemáticas han penalizado a los estudiantes que entienden raíces cuadradas negativas , intereses de préstamos y errores en la extrapolación de un gráfico más allá de los datos. [19] [20]
La afirmación de la NAEP de que mide el pensamiento crítico también ha sido criticada. Los investigadores de la UCLA descubrieron que los estudiantes podían elegir las respuestas correctas sin pensar críticamente. [21]
NAEP califica cada prueba mediante un método estadístico, establece puntos de corte para los estándares "básicos" y "competentes" y ofrece ejemplos de lo que los estudiantes de cada nivel lograron en la prueba. El proceso para diseñar las pruebas y los estándares ha sido criticado por la Western Michigan University (1991), la National Academy of Education (1993), la Government Accountability Office (1993), la National Academy of Sciences (1999), [22] [23] los American Institutes for Research y RTI International (2007), [24] Brookings Institution (2007 [25] y 2016 [24] ), el Buros Center for Testing (2009), [22] y las National Academies of Sciences, Engineering, and Medicine (2016). [24]
La interpretación de los resultados de NAEP ha sido difícil: la categoría de "competente" de NAEP en una prueba de lectura realizada a estudiantes de cuarto grado refleja a los estudiantes que obtienen buenos resultados en la prueba y están en el nivel de séptimo grado. [24] La categoría de "competente" de NAEP en una prueba de matemáticas realizada a estudiantes de octavo grado refleja a los estudiantes que obtienen buenos resultados en la prueba y están en el nivel de duodécimo grado. [25] El hecho de que pocos estudiantes de octavo grado sean competentes según este estándar y alcancen el nivel de duodécimo grado se ha malinterpretado para alegar que pocos estudiantes de octavo grado logran incluso el nivel de octavo grado. [26] NAEP dice: "Los estudiantes que pueden ser competentes en una materia, dado el uso común del término, podrían no satisfacer los requisitos de desempeño en el nivel de logro de NAEP" [24] James Harvey, autor principal de A Nation at Risk , dice: "Es difícil evitar concluir que la palabra fue elegida conscientemente para confundir a los responsables de las políticas y al público". [24]
{{cite news}}
: CS1 maint: multiple names: authors list (link)