stringtranslate.com

Clasificación

Generalmente se entiende que clasificación significa la asignación de objetos a ciertas clases o categorías preexistentes. Esto lo distingue del paso anterior en el que se establecen las clases mismas, a menudo mediante agrupaciones en las que se agrupan objetos similares. [1] Los ejemplos incluyen una prueba de embarazo, identificar correos electrónicos no deseados y decidir si se le otorga a alguien un permiso de conducir.

La clasificación es parte de muchos tipos diferentes de actividades y se estudia desde muchos puntos de vista diferentes, incluidos la medicina , la filosofía , el derecho , la antropología , la biología , la taxonomía , la cognición , las comunicaciones , la organización del conocimiento , la psicología , la estadística , el aprendizaje automático , la biblioteconomía y las matemáticas .

Además de "categoría", los sinónimos o casi sinónimos de "clase" incluyen "tipo", "especie", "orden", "concepto", "taxón", "grupo" y "división".

El significado de la palabra "clasificación" (y sus sinónimos) puede adoptar uno de varios significados relacionados. Puede abarcar tanto la clasificación como la creación de clases, como por ejemplo en 'la tarea de categorizar páginas en Wikipedia'; esta actividad general se incluye en Taxonomía . Puede referirse exclusivamente al esquema subyacente de clases (que de otro modo podría denominarse taxonomía). O puede referirse a la etiqueta que el clasificador le da a un objeto.

Clasificación binaria vs multiclase

El trabajo metodológico destinado a mejorar la precisión de un clasificador se divide comúnmente entre casos en los que hay exactamente dos clases ( clasificación binaria ) y casos en los que hay tres o más clases ( clasificación multiclase ).

Evaluación de precisión

A diferencia de la teoría de la decisión , se supone que un clasificador repite la tarea de clasificación una y otra vez. Y a diferencia de una lotería , se supone que cada clasificación puede ser acertada o errónea; En la teoría de la medición, la clasificación se entiende como la medición frente a una escala nominal . De este modo es posible intentar medir la precisión de un clasificador.

Medir la precisión de un clasificador permite elegir entre dos clasificadores alternativos. Esto es importante tanto al desarrollar un clasificador como al elegir qué clasificador implementar. Sin embargo, existen muchos métodos diferentes para evaluar la precisión de un clasificador y ningún método general para determinar qué método debe usarse en qué circunstancias. Diferentes campos han adoptado enfoques diferentes, incluso en la clasificación binaria. En el reconocimiento de patrones , la tasa de error es popular. El coeficiente de Gini y la estadística KS se utilizan ampliamente en la industria de la calificación crediticia. La sensibilidad y la especificidad se utilizan ampliamente en epidemiología y medicina. La precisión y la recuperación se utilizan ampliamente en la recuperación de información. [2]

La precisión del clasificador depende en gran medida de las características de los datos a clasificar. No existe un clasificador único que funcione mejor en todos los problemas dados (un fenómeno que puede explicarse mediante el teorema de no comer gratis ).

Ver también

Referencias

  1. ^ https://www.theclassificationsociety.org/about/
  2. ^ Mano de David (2012). "Evaluación del rendimiento de los métodos de clasificación". Revista estadística internacional . 80 (3): 400–414.

enlaces externos