Elaboración de perfiles (ciencias de la información)

En ciencias de la información , la elaboración de perfiles se refiere al proceso de construcción y aplicación de perfiles de usuario generados por el análisis de datos computarizados .

Se trata del uso de algoritmos u otras técnicas matemáticas que permiten descubrir patrones o correlaciones en grandes cantidades de datos, agregados en bases de datos . Cuando estos patrones o correlaciones se utilizan para identificar o representar personas, se les puede llamar perfiles . Más allá de una discusión sobre tecnologías de elaboración de perfiles o elaboración de perfiles de población , la noción de elaboración de perfiles en este sentido no se trata solo de la construcción de perfiles, sino que también se refiere a la aplicación de perfiles grupales a individuos, e.g. ej., en los casos de calificación crediticia , discriminación de precios o identificación de riesgos de seguridad (Hildebrandt & Gutwirth 2008) (Elmer 2004).

La elaboración de perfiles se utiliza en la prevención del fraude , la inteligencia ambiental y el análisis del consumidor . Los métodos estadísticos de elaboración de perfiles incluyen el descubrimiento de conocimientos en bases de datos (KDD).

El proceso de elaboración de perfiles

El proceso técnico de elaboración de perfiles se puede dividir en varios pasos:

Fundamentación preliminar: el proceso de elaboración de perfiles comienza con una especificación del dominio del problema aplicable y la identificación de los objetivos del análisis.
Recopilación de datos : el conjunto de datos o base de datos objetivo para el análisis se forma seleccionando los datos relevantes a la luz del conocimiento del dominio existente y la comprensión de los datos.
Preparación de datos : los datos se preprocesan para eliminar el ruido y reducir la complejidad mediante la eliminación de atributos.
Minería de datos : los datos se analizan con el algoritmo o heurística desarrollado para adaptarse a los datos, el modelo y los objetivos.
Interpretación: Los patrones extraídos son evaluados en cuanto a su relevancia y validez por especialistas y/o profesionales en el dominio de la aplicación (por ejemplo, excluyendo correlaciones espurias).
Aplicación: Los perfiles construidos se aplican, por ejemplo, a categorías de personas, para probar y ajustar los algoritmos.
Decisión institucional: La institución decide qué acciones o políticas aplicar a grupos o individuos cuyos datos coinciden con un perfil relevante.

La recopilación, preparación y extracción de datos pertenecen a la fase en la que se encuentra en construcción el perfil. Sin embargo, la elaboración de perfiles también se refiere a la aplicación de perfiles, es decir, el uso de perfiles para la identificación o categorización de grupos o personas individuales. Como se puede observar en el paso seis (aplicación), el proceso es circular. Existe un circuito de retroalimentación entre la construcción y la aplicación de perfiles. La interpretación de los perfiles puede llevar a un ajuste reiterado (posiblemente en tiempo real) de pasos previos específicos en el proceso de elaboración de perfiles. La aplicación de perfiles a personas cuyos datos no se utilizaron para construir el perfil se basa en el cruce de datos, lo que proporciona nuevos datos que permiten realizar ajustes adicionales. El proceso de elaboración de perfiles es dinámico y adaptativo. Un buen ejemplo de la naturaleza dinámica y adaptativa de la elaboración de perfiles es el Proceso Estándar Intersectorial para Minería de Datos ( CRISP-DM ).

Tipos de prácticas de elaboración de perfiles

Para aclarar la naturaleza de las tecnologías de elaboración de perfiles, es necesario hacer algunas distinciones cruciales entre los diferentes tipos de prácticas de elaboración de perfiles, además de la distinción entre la construcción y la aplicación de perfiles. Las principales distinciones son aquellas entre perfiles ascendentes y descendentes (o aprendizaje supervisado y no supervisado), y entre perfiles individuales y grupales.

Aprendizaje supervisado y no supervisado.

Los perfiles se pueden clasificar según la forma en que han sido generados (Fayyad, Piatetsky-Shapiro & Smyth 1996) (Zarsky & 2002-3) . Por un lado, se pueden generar perfiles probando una correlación hipotética. Esto se llama creación de perfiles de arriba hacia abajo o aprendizaje supervisado . Esto es similar a la metodología de la investigación científica tradicional en que comienza con una hipótesis y consiste en probar su validez. El resultado de este tipo de elaboración de perfiles es la verificación o refutación de la hipótesis. También se podría hablar de perfiles deductivos. Por otro lado, los perfiles se pueden generar explorando una base de datos, utilizando el proceso de minería de datos para detectar patrones en la base de datos que no se habían planteado como hipótesis previamente. En cierto modo, se trata de generar hipótesis: encontrar correlaciones que uno no esperaba o en las que ni siquiera había pensado. Una vez que se hayan extraído los patrones, entrarán en el ciclo (descrito anteriormente) y se probarán con el uso de nuevos datos. A esto se le llama aprendizaje no supervisado .

Dos cosas son importantes con respecto a esta distinción. En primer lugar, los algoritmos de aprendizaje no supervisados parecen permitir la construcción de un nuevo tipo de conocimiento, no basado en hipótesis desarrolladas por un investigador ni en relaciones causales o motivacionales, sino exclusivamente en correlaciones estocásticas. En segundo lugar, los algoritmos de aprendizaje no supervisados parecen permitir un tipo inductivo de construcción de conocimiento que no requiere justificación teórica o explicación causal (Custers 2004).

Algunos autores afirman que si la aplicación de perfiles basados en el reconocimiento computarizado de patrones estocásticos "funciona", es decir, permite predicciones fiables de comportamientos futuros, la explicación teórica o causal de estos patrones ya no importa (Anderson 2008). Sin embargo, la idea de que los algoritmos "ciegos" proporcionen información confiable no implica que la información sea neutral. En el proceso de recopilación y agregación de datos en una base de datos (los primeros tres pasos del proceso de construcción del perfil), se realizan traducciones de eventos de la vida real a datos legibles por máquina . Luego, estos datos se preparan y limpian para permitir la computabilidad inicial. Los posibles sesgos deberán localizarse en estos puntos, así como en la elección de los algoritmos que se desarrollen. No es posible extraer una base de datos para todas las posibles correlaciones lineales y no lineales, lo que significa que las técnicas matemáticas desarrolladas para buscar patrones determinarán los patrones que se puedan encontrar. En el caso de la elaboración de perfiles automáticos, el sesgo potencial no está informado por prejuicios de sentido común o lo que los psicólogos llaman estereotipos, sino por las técnicas informáticas empleadas en los pasos iniciales del proceso. Estas técnicas son en su mayoría invisibles para aquellos a quienes se aplican los perfiles (porque sus datos coinciden con los perfiles del grupo relevante).

Perfiles individuales y grupales

Los perfiles también deben clasificarse según el tipo de materia a la que se refieren. Este sujeto puede ser un individuo o un grupo de personas. Cuando un perfil se construye con los datos de una sola persona, se denomina perfilado individual (Jaquet-Chiffelle 2008). Este tipo de elaboración de perfiles se utiliza para descubrir las características particulares de un determinado individuo, para permitir una identificación única o la prestación de servicios personalizados. Sin embargo, el servicio personalizado suele basarse también en la elaboración de perfiles grupales, que permiten categorizar a una persona como un determinado tipo de persona, basándose en el hecho de que su perfil coincide con un perfil que se ha construido sobre la base de cantidades masivas de datos sobre cantidades masivas de otras personas. Un perfil de grupo puede referirse al resultado de la minería de datos en conjuntos de datos que hacen referencia a una comunidad existente que se considera a sí misma como tal, como un grupo religioso, un club de tenis, una universidad, un partido político, etc. En ese caso puede describir previamente patrones desconocidos de comportamiento u otras características de dicho grupo (comunidad). Un perfil de grupo también puede referirse a una categoría de personas que no forman una comunidad, pero que comparten patrones de comportamiento u otras características previamente desconocidas (Custers 2004). En ese caso, el perfil del grupo describe comportamientos específicos u otras características de una categoría de personas, como por ejemplo mujeres con ojos azules y pelo rojo, o adultos con brazos y piernas relativamente cortos. Se puede encontrar que estas categorías se correlacionan con riesgos para la salud, capacidad de ingresos, tasas de mortalidad, riesgos crediticios, etc.

Si un perfil individual se aplica al individuo del que se extrajo, entonces se trata de un perfil individual directo. Si un perfil de grupo se aplica a un individuo cuyos datos coinciden con el perfil, entonces se trata de un perfil individual indirecto, porque el perfil se generó utilizando datos de otras personas. De manera similar, si un perfil de grupo se aplica al grupo del que se extrajo, entonces se trata de un perfil de grupo directo (Jaquet-Chiffelle 2008). Sin embargo, en la medida en que la aplicación de un perfil de grupo a un grupo implica la aplicación del perfil de grupo a miembros individuales del grupo, tiene sentido hablar de perfil de grupo indirecto, especialmente si el perfil de grupo no es distributivo.

Perfiles distributivos y no distributivos

Los perfiles de grupo también pueden dividirse en términos de su carácter distributivo (Vedder 1999). Un perfil de grupo es distributivo cuando sus propiedades se aplican por igual a todos los miembros de su grupo: todos los solteros son solteros, o todas las personas con un gen específico tienen un 80% de posibilidades de contraer una enfermedad específica. Un perfil es no distributivo cuando el perfil no se aplica necesariamente a todos los miembros del grupo: el grupo de personas con un código postal específico tiene una capacidad de ganancia promedio de XX, o la categoría de personas con ojos azules tiene una probabilidad promedio del 37% a contraer una enfermedad específica. Tenga en cuenta que en este caso la posibilidad de que un individuo tenga una capacidad de ingresos particular o contraiga la enfermedad específica dependerá de otros factores, por ejemplo, sexo, edad, antecedentes de los padres, salud previa, educación. Debería ser obvio que, aparte de los perfiles tautológicos como el de los solteros, la mayoría de los perfiles grupales generados mediante técnicas informáticas no son distributivos. Esto tiene implicaciones de gran alcance para la precisión de la elaboración de perfiles individuales indirectos basados en la comparación de datos con perfiles grupales no distributivos. Aparte del hecho de que la aplicación de perfiles precisos puede ser injusta o causar una estigmatización indebida, la mayoría de los perfiles grupales no serán precisos.

Aplicaciones

En el sector financiero, las instituciones utilizan tecnologías de elaboración de perfiles para la prevención del fraude y la calificación crediticia . Los bancos quieren minimizar los riesgos al otorgar crédito a sus clientes. Sobre la base del grupo extenso, a los clientes se les asigna un determinado valor de puntuación que indica su solvencia. Las instituciones financieras como los bancos y las compañías de seguros también utilizan perfiles grupales para detectar fraudes o blanqueo de dinero . Las bases de datos con transacciones se buscan con algoritmos para encontrar comportamientos que se desvían del estándar, indicando transacciones potencialmente sospechosas. ^[1]

En el contexto del empleo, los perfiles pueden resultar útiles para rastrear a los empleados mediante el seguimiento de su comportamiento en línea , para detectar fraudes por parte de ellos y para desplegar recursos humanos agrupando y clasificando sus habilidades. (Leopold y Meints 2008) ^[2]

La elaboración de perfiles también se puede utilizar para apoyar a las personas en el trabajo, y también para el aprendizaje, interviniendo en el diseño de sistemas hipermedia adaptativos que personalizan la interacción. Por ejemplo, esto puede resultar útil para apoyar la gestión de la atención (Nabeth 2008).

En ciencia forense , existe la posibilidad de vincular diferentes bases de datos de casos y sospechosos y extraerlas en busca de patrones comunes. Esto podría usarse para resolver casos existentes o con el fin de establecer perfiles de riesgo de posibles sospechosos (Geradts & Sommer 2008) (Harcourt 2006).

Perfil del consumidor

La elaboración de perfiles del consumidor es una forma de análisis de clientes , donde los datos de los clientes se utilizan para tomar decisiones sobre la promoción de productos , el precio de los productos y la publicidad personalizada . ^[3] Cuando el objetivo es encontrar el segmento de clientes más rentable, la analítica del consumidor se basa en datos demográficos , datos sobre el comportamiento del consumidor , datos sobre los productos adquiridos, método de pago y encuestas para establecer perfiles de consumidores. Para establecer modelos predictivos en base a bases de datos existentes , se utiliza el método estadístico Descubrimiento de Conocimiento en Bases de Datos (KDD). KDD agrupa datos de clientes similares para predecir el comportamiento futuro del consumidor. Otros métodos para predecir el comportamiento del consumidor son la correlación y el reconocimiento de patrones . Los perfiles de consumidores describen a los clientes en función de un conjunto de atributos ^[4] y, por lo general, los consumidores se agrupan según sus ingresos , nivel de vida , edad y ubicación. Los perfiles de los consumidores también pueden incluir atributos de comportamiento que evalúan la motivación de un cliente en el proceso de decisión del comprador . Ejemplos bien conocidos de perfiles de consumidores son la clasificación geodemográfica de hogares Mosaic de Experian , Acorn de CACI y Personicx de Acxiom . ^[5]

Inteligencia Ambiental

En un entorno construido con inteligencia ambiental, los objetos cotidianos tienen sensores incorporados y sistemas integrados que permiten que los objetos reconozcan y respondan a la presencia y las necesidades de los individuos. La inteligencia ambiental se basa en la elaboración de perfiles automatizados y en diseños de interacción entre humanos y computadoras . ^[6] Los sensores monitorean las acciones y los comportamientos de un individuo, generando, recopilando, analizando, procesando y almacenando datos personales . Los primeros ejemplos de electrónica de consumo con inteligencia ambiental incluyen aplicaciones móviles , realidad aumentada y servicios basados en la ubicación . ^[7]

Riesgos y problemas

Las tecnologías de elaboración de perfiles han planteado una serie de cuestiones éticas, legales y de otro tipo, incluidas la privacidad , la igualdad , el debido proceso , la seguridad y la responsabilidad . Numerosos autores han advertido contra las posibilidades de una nueva infraestructura tecnológica que podría surgir sobre la base de tecnologías de elaboración de perfiles semiautónomos (Lessig 2006) (Solove 2004) (Schwartz 2000).

La privacidad es una de las principales cuestiones planteadas. Las tecnologías de elaboración de perfiles hacen posible un seguimiento de gran alcance del comportamiento y las preferencias de un individuo. Los perfiles pueden revelar información personal o privada sobre personas de la que ni siquiera ellos mismos son conscientes (Hildebrandt y Gutwirth 2008).

Las tecnologías de elaboración de perfiles son por su propia naturaleza herramientas discriminatorias. Permiten tipos incomparables de clasificación y segmentación social que podrían tener efectos injustos. Las personas que aparecen en el perfil pueden tener que pagar precios más altos, ^[8] podrían perder ofertas u oportunidades importantes y pueden correr mayores riesgos porque satisfacer sus necesidades es menos rentable (Lyon 2003). En la mayoría de los casos, no serán conscientes de ello, ya que las prácticas de elaboración de perfiles son en su mayoría invisibles y los propios perfiles suelen estar protegidos por propiedad intelectual o secreto comercial. Esto plantea una amenaza a la igualdad y la solidaridad de los ciudadanos. A mayor escala, podría provocar la segmentación de la sociedad. ^[9]

Uno de los problemas que subyacen a las posibles violaciones de la privacidad y la no discriminación es que el proceso de elaboración de perfiles suele ser invisible para quienes están siendo perfilados. Esto crea dificultades en el sentido de que resulta difícil, si no imposible, impugnar la solicitud de un perfil de grupo particular. Esto perturba los principios del debido proceso: si una persona no tiene acceso a información sobre la base de la cual se le niegan beneficios o se le atribuyen ciertos riesgos, no puede cuestionar la forma en que se le trata (Steinbock 2005).

Los perfiles pueden usarse contra personas cuando terminan en manos de personas que no tienen derecho a acceder o utilizar la información. Un tema importante relacionado con estas violaciones de seguridad es el robo de identidad .

Cuando la aplicación de perfiles causa daño, la responsabilidad por este daño debe determinarse quién debe rendir cuentas. ¿Debe responsabilizarse el programador de software, el proveedor de servicios de elaboración de perfiles o el usuario perfilado? Esta cuestión de responsabilidad es especialmente compleja en el caso de que la aplicación y las decisiones sobre perfiles también se hayan automatizado como en la Computación Autonómica o las decisiones de inteligencia ambiental de decisiones automatizadas basadas en perfiles.

Ver también

Busque perfil en Wikcionario, el diccionario gratuito.

Referencias

Anderson, Chris (2008). "El fin de la teoría: la avalancha de datos hace obsoleto el método científico". Revista cableada . 16 (7).
Custers, BHM (2004). "El poder del conocimiento" (Documento). Tilburg: Wolf Legal Publishers.
Elmer, G. (2004). "Máquinas de elaboración de perfiles. Mapeo de la economía de la información personal" (Documento). Prensa del MIT.
Fayyad, UM; Piatetsky-Shapiro, G.; Smith, P. (1996). "De la minería de datos al descubrimiento de conocimientos en bases de datos" (PDF) . Revista AI . 17 (3): 37–54. Archivado desde el original (PDF) el 16 de diciembre de 2009 . Consultado el 9 de febrero de 2009 .
Geradts, Zenón; Verano, Peter (2008). "D6.7c: elaboración de perfiles forenses" (PDF) . Entregables de FIDIS . 6 (7c).
Harcourt, BE (2006). "Contra la predicción. Elaboración de perfiles, vigilancia y castigo en una era actuarial" (Documento). The University of Chicago Press, Chicago y Londres.
Hildebrandt, Mireille; Gutwirth, Serge (2008). Perfilar al ciudadano europeo. Perspectivas interdisciplinarias . Springer, Dordrecht. doi :10.1007/978-1-4020-6914-7. ISBN 978-1-4020-6913-0.
Jaquet-Chiffelle, David-Olivier (2008). "Respuesta: Elaboración de perfiles directos e indirectos a la luz de las personas virtuales. Para: Definición de perfiles: ¿un nuevo tipo de conocimiento?". En Hildebrandt, Mireille; Gutwirth, Serge (eds.). Perfilar al ciudadano europeo . Springer Países Bajos. págs. 17–45. doi :10.1007/978-1-4020-6914-7_2.
Kephart, JO; Ajedrez, DM (2003). "La visión de la informática autónoma" (PDF) . Computadora . 36 (1 de enero): 96-104. CiteSeerX 10.1.1.70.613 . doi :10.1109/MC.2003.1160055. Archivado desde el original (PDF) el 10 de agosto de 2014.
Leopoldo, N.; Meints, M. (2008). "Elaboración de perfiles en situaciones laborales (fraude)". En Hildebrandt, Mireille; Gutwirth, Serge (eds.). Perfilar al ciudadano europeo . Springer Países Bajos. págs. 217-237. doi :10.1007/978-1-4020-6914-7_12. ISBN 978-1-4020-6913-0.
Lessig, L. (2006). "Código 2.0" (Documento). Libros básicos, Nueva York.
Lyon, D. (2003). "Vigilancia como clasificación social: privacidad, riesgo y discriminación digital" (Documento). Rutledge.
Nabeth, Thierry (2008). "Perfil de usuario para apoyo a la atención en la escuela y el trabajo". En Hildebrandt, Mireille; Gutwirth, Serge (eds.). Perfilar al ciudadano europeo . Springer Países Bajos. págs. 185-200. doi :10.1007/978-1-4020-6914-7_10. ISBN 978-1-4020-6913-0.
Schwartz, P. (2000). "Más allá del código de Lessig para la privacidad en Internet: filtros del ciberespacio, control de la privacidad y prácticas justas de información". Revisión de la ley de Wisconsin . 743 : 743–788.
Solove, DJ (2004). La persona digital. Tecnología y privacidad en la era de la información . Nueva York, Prensa de la Universidad de Nueva York.
Steinbock, D. (2005). "Cotejo de datos, minería de datos y debido proceso". Revisión de la ley de Georgia . 40 (1): 1–84.
Vedder, A. (1999). "KDD: El desafío al individualismo". Ética y Tecnología de la Información . 1 (4): 275–281. doi :10.1023/A:1010016102284. S2CID 10377988.
Weiser, M. (1991). "La computadora del siglo XXI". Científico americano . 265 (3): 94-104. doi : 10.1038/scientificamerican0991-94.
Zarsky, T. (2002). ""¡Mine su propio negocio!": Argumentando las implicaciones de la extracción de datos o la información personal en el foro de opinión pública". Revista de Derecho y Tecnología de Yale . 5 (4): 17–47.

Notas y otras referencias

^ Canhoto, AI (2007). "Comportamiento de elaboración de perfiles: la construcción social de categorías en la detección de delitos financieros, disertación en la London School of Economics" (PDF) . lse.ac.uk.
^ Centro de información sobre privacidad electrónica. "EPIC - Privacidad en el lugar de trabajo". epic.org . {{cite web}}: |author=tiene nombre genérico ( ayuda )
^ Reyes, Mateo (2020). Comportamiento del consumidor y marketing . IntechAbierto. pag. 10.ISBN 9781789238556.
^ Reyes, Mateo (2020). Comportamiento del consumidor y marketing . IntechAbierto. pag. 11.ISBN 9781789238556.
^ Reyes, Mateo (2020). Comportamiento del consumidor y marketing . IntechAbierto. pag. 12.ISBN 9781789238556.
^ De Hert, Paul; Leenes, Ronald; Gutwirth, Serge; Pollet, Yves (2011). Computadoras, privacidad y protección de datos: un elemento de elección . Springer Países Bajos. pag. 80.ISBN 9789400706415.
^ De Hert, Paul; Leenes, Ronald; Gutwirth, Serge; Pollet, Yves (2011). Computadoras, privacidad y protección de datos: un elemento de elección . Springer Países Bajos. pag. 80.ISBN 9789400706415.
^ Odlyzko, A. (2003). "Privacidad, economía y discriminación de precios en Internet, AM Odlyzko. ICEC2003: Quinta Conferencia Internacional sobre Comercio Electrónico, N. Sadeh, ed., ACM, págs. 355–366" (PDF) .
^ Gandy, O. (2002). «Minería de datos y vigilancia en el entorno post 11-S, Presentación en IAMCR, Barcelona» (PDF) . asc.upenn.edu .