Una clasificación es una relación entre un conjunto de elementos, a menudo registrados en una lista , de modo que, para dos elementos cualesquiera, el primero está "clasificado más alto que", "clasificado más bajo que" o "clasificado igual que" el segundo. [1] En matemáticas , esto se conoce como un orden débil o preorden total de objetos. No es necesariamente un orden total de objetos porque dos objetos diferentes pueden tener la misma clasificación. Las clasificaciones en sí mismas están totalmente ordenadas. Por ejemplo, los materiales están totalmente preordenados por dureza , mientras que los grados de dureza están totalmente ordenados. Si dos elementos tienen el mismo rango, se considera un empate.
Al reducir las medidas detalladas a una secuencia de números ordinales , las clasificaciones permiten evaluar información compleja según ciertos criterios. [2] Así, por ejemplo, un motor de búsqueda en Internet puede clasificar las páginas que encuentra según una estimación de su relevancia , lo que permite al usuario seleccionar rápidamente las páginas que probablemente quiera ver.
El análisis de datos obtenidos mediante clasificación generalmente requiere estadísticas no paramétricas .
No siempre es posible asignar clasificaciones de forma única. Por ejemplo, en una carrera o competencia, dos (o más) participantes pueden empatar por un lugar en la clasificación. [3] Al calcular una medida ordinal , dos (o más) de las cantidades que se clasifican pueden tener la misma medida. En estos casos, se puede adoptar una de las siguientes estrategias para asignar las clasificaciones.
Una forma abreviada y común de distinguir estas estrategias de clasificación es mediante los números de clasificación que se producirían para cuatro elementos, con el primer elemento clasificado por delante del segundo y el tercero (que se comparan de manera igual), que a su vez están clasificados por delante del cuarto. [4] Estos nombres también se muestran a continuación.
En la clasificación de competencias, los elementos que se comparan como iguales reciben el mismo número de clasificación y luego se deja un espacio en los números de clasificación. La cantidad de números de clasificación que se dejan fuera en este espacio es uno menos que la cantidad de elementos que se compararon como iguales. Equivalentemente, el número de clasificación de cada elemento es 1 más la cantidad de elementos clasificados por encima de él. Esta estrategia de clasificación se adopta con frecuencia para las competiciones, ya que significa que si dos (o más) competidores empatan en una posición en la clasificación, la posición de todos los clasificados por debajo de ellos no se ve afectada (es decir, un competidor solo queda segundo si exactamente una persona obtiene una puntuación mejor que él, tercero si exactamente dos personas obtienen una puntuación mejor que él, cuarto si exactamente tres personas obtienen una puntuación mejor que él, etc.).
Por lo tanto, si A se ubica por delante de B y C (que se comparan iguales), que a su vez se ubican por delante de D, entonces A obtiene el puesto número 1 ("primero"), B obtiene el puesto número 2 ("segundo conjunto"), C también obtiene el puesto número 2 ("segundo conjunto") y D obtiene el puesto número 4 ("cuarto").
Este método es llamado “Bajo” por IBM SPSS [5] y “min” por el lenguaje de programación R [6] en sus métodos para manejar empates.
En ocasiones, la clasificación de la competencia se realiza dejando espacios en los números de clasificación antes de los conjuntos de elementos de igual clasificación (en lugar de después de ellos, como en la clasificación de la competencia estándar). La cantidad de números de clasificación que se dejan fuera en este espacio sigue siendo uno menos que la cantidad de elementos que se compararon como iguales. De manera equivalente, el número de clasificación de cada elemento es igual a la cantidad de elementos clasificados igual o por encima de él. Esta clasificación garantiza que un competidor solo quede en segundo lugar si obtiene una puntuación más alta que todos menos uno de sus oponentes, en tercer lugar si obtiene una puntuación más alta que todos menos dos de sus oponentes, etc.
Por lo tanto, si A se sitúa por delante de B y C (que son iguales en comparación), que a su vez se sitúan por delante de D, A obtiene el puesto número 1 ("primero"), B obtiene el puesto número 3 ("tercero compartido"), C también obtiene el puesto número 3 ("tercero compartido") y D obtiene el puesto número 4 ("cuarto"). En este caso, nadie obtendría el puesto número 2 ("segundo") y quedaría un hueco.
Este método es llamado “High” por IBM SPSS [5] y “max” por el lenguaje de programación R [6] en sus métodos para manejar empates.
En la clasificación densa, los elementos que se comparan de manera similar reciben el mismo número de clasificación y los elementos siguientes reciben el número de clasificación inmediatamente posterior. De manera equivalente, el número de clasificación de cada elemento es 1 más el número de elementos clasificados por encima de él que son distintos con respecto al orden de clasificación.
Por lo tanto, si A se ubica por delante de B y C (que se comparan iguales), que a su vez se ubican por delante de D, entonces A obtiene el puesto número 1 ("primero"), B obtiene el puesto número 2 ("segundo conjunto"), C también obtiene el puesto número 2 ("segundo conjunto") y D obtiene el puesto número 3 ("tercero").
Este método es llamado “Secuencial” por IBM SPSS [5] y “denso” por el lenguaje de programación R [7] en sus métodos para manejar empates.
En la clasificación ordinal, todos los elementos reciben números ordinales distintos, incluidos los elementos que son iguales en comparación. La asignación de números ordinales distintos a elementos que son iguales en comparación puede hacerse de forma aleatoria o arbitraria, pero generalmente es preferible utilizar un sistema que sea arbitrario pero consistente, ya que esto da resultados estables si la clasificación se realiza varias veces. Un ejemplo de un sistema arbitrario pero consistente sería incorporar otros atributos al orden de clasificación (como el orden alfabético del nombre del competidor) para garantizar que no haya dos elementos que coincidan exactamente.
Con esta estrategia, si A se ubica por delante de B y C (que son iguales en comparación), que a su vez se ubican por delante de D, entonces A obtiene el puesto número 1 ("primero") y D el puesto número 4 ("cuarto"), y B obtiene el puesto número 2 ("segundo") y C el puesto número 3 ("tercero"), o C obtiene el puesto número 2 ("segundo") y B el puesto número 3 ("tercero").
En el procesamiento de datos informáticos, la clasificación ordinal también se denomina "numeración de filas".
Este método corresponde a los métodos "primero", "último" y "aleatorio" del lenguaje de programación R [6] para manejar empates.
Los elementos que se comparan como iguales reciben el mismo número de clasificación, que es la media de lo que tendrían bajo la clasificación ordinal; equivalentemente, el número de clasificación de 1 más el número de elementos clasificados por encima de él más la mitad del número de elementos iguales a él. Esta estrategia tiene la propiedad de que la suma de los números de clasificación es la misma que bajo la clasificación ordinal. Por este motivo, se utiliza para calcular los recuentos de Borda y en pruebas estadísticas (ver a continuación).
Por lo tanto, si A se ubica por delante de B y C (que se comparan iguales), que a su vez se ubican por delante de D, entonces A obtiene el puesto número 1 ("primero"), B y C obtienen cada uno el puesto número 2,5 (promedio de "segundo/tercero conjunto") y D obtiene el puesto número 4 ("cuarto").
He aquí un ejemplo: supongamos que tiene el conjunto de datos 1.0, 1.0, 2.0, 3.0, 3.0, 4.0, 5.0, 5.0, 5.0.
Los rangos ordinales son 1, 2, 3, 4, 5, 6, 7, 8, 9.
Para v = 1,0, el rango fraccionario es el promedio de los rangos ordinales: (1 + 2) / 2 = 1,5. De manera similar, para v = 5,0, el rango fraccionario es (7 + 8 + 9) / 3 = 8,0.
Por lo tanto, los rangos fraccionarios son: 1,5, 1,5, 3,0, 4,5, 4,5, 6,0, 8,0, 8,0, 8,0.
Este método se denomina “Media” en IBM SPSS [5] y “promedio” en el lenguaje de programación R [6] en sus métodos para manejar empates.
En estadística , la clasificación es la transformación de datos en la que los valores numéricos u ordinales se reemplazan por su rango cuando se ordenan los datos.
Por ejemplo, si se observan los datos numéricos 3.4, 5.1, 2.6, 7.3, los rangos de estos elementos de datos serían 2, 3, 1 y 4 respectivamente.
Como otro ejemplo, los datos ordinales caliente, frío, cálido se reemplazarían por 3, 1, 2. En estos ejemplos, los rangos se asignan a los valores en orden ascendente, aunque también se pueden usar rangos descendentes.
Los rangos están relacionados con la lista indexada de estadísticas de orden , que consiste en el conjunto de datos original reorganizado en orden ascendente.Las tablas de clasificación se utilizan para comparar los logros académicos de diferentes instituciones. Los rankings de colegios y universidades ordenan las instituciones de educación superior mediante combinaciones de factores. Además de las instituciones completas, se clasifican programas, departamentos y escuelas específicos. Estas clasificaciones suelen ser realizadas por revistas, periódicos, gobiernos y académicos. Por ejemplo, las tablas de clasificación de las universidades británicas son publicadas anualmente por The Independent , The Sunday Times y The Times . [8] El objetivo principal de estas clasificaciones es informar a los posibles solicitantes sobre las universidades británicas basándose en una serie de criterios. De manera similar, en países como la India, se están desarrollando tablas de clasificación y una revista popular, Education World, las publicó basándose en datos de TheLearningPoint.net . [ cita requerida ]
Se ha denunciado que la clasificación de las escuelas de Inglaterra según unas directrices rígidas que no tienen en cuenta las condiciones sociales más amplias empeora aún más el problema de las escuelas en decadencia, ya que los padres más implicados evitan esas escuelas y dejan que sólo los hijos de padres poco ambiciosos puedan asistir a ellas. [9]
En el ámbito empresarial, las tablas de clasificación enumeran a los líderes en la actividad comercial dentro de una industria específica, clasificando a las empresas en función de diferentes criterios, incluidos los ingresos, las ganancias y otros indicadores clave de rendimiento relevantes (como la participación en el mercado y el cumplimiento de las expectativas de los clientes), lo que permite a las personas analizar rápidamente datos importantes. [10]
La metodología de clasificación basada en algunos índices específicos es uno de los sistemas más comunes utilizados por los responsables de las políticas y las organizaciones internacionales para evaluar el contexto socioeconómico de los países. Algunos ejemplos notables incluyen el Índice de Desarrollo Humano (Naciones Unidas), el Índice Doing Business ( Banco Mundial ), el Índice de Percepción de la Corrupción (Transparencia Internacional) y el Índice de Libertad Económica (Heritage Foundation). Por ejemplo, el Indicador Doing Business del Banco Mundial mide las regulaciones comerciales y su aplicación en 190 países. Los países se clasifican de acuerdo con diez indicadores que se sintetizan para producir la clasificación final. Cada indicador se compone de subindicadores; por ejemplo, el Indicador de Registro de la Propiedad se compone de cuatro subindicadores que miden el tiempo, los procedimientos, los costos y la calidad del sistema de registro de tierras. Este tipo de clasificaciones se basan en criterios subjetivos para asignar la puntuación. A veces, los parámetros adoptados pueden producir discrepancias con las observaciones empíricas, por lo que pueden surgir sesgos potenciales y paradojas de la aplicación de estos criterios. [11]
{{cite journal}}
: Requiere citar revista |journal=
( ayuda )