Un término de representación es una palabra, o una combinación de palabras, que representan semánticamente el tipo de datos (dominio de valor) de un elemento de datos. Aquellos familiarizados con los diccionarios de datos suelen denominar a un término de representación una palabra de clase . La norma ISO/IEC 11179-5:2005 define un término de representación como una designación de una instancia de una clase de representación. Tal como se utiliza en la norma ISO/IEC 11179 , el término de representación es la parte del nombre de un elemento de datos que proporciona un puntero semántico al tipo de datos subyacente. Una clase de representación es una clase de representaciones. Esta clase de representación proporciona una forma de clasificar o agrupar elementos de datos .
Un término de representación puede considerarse como un atributo de un elemento de datos en un registro de metadatos que clasifica el elemento de datos según el tipo de datos almacenados en el elemento de datos. [1]
Los términos de representación suelen estar "aprobados" por la organización o el organismo de normalización que los utiliza. Por ejemplo, la ONU publica su lista aprobada como parte de la Especificación técnica de componentes básicos del CEFACT/ONU. El Marco universal de elementos de datos utiliza un subconjunto de términos de representación del CCTS y asigna códigos numéricos a los utilizados.
Un dominio de valor expresa el conjunto de valores permitidos para un elemento de datos. El término de representación (y, por lo general, el término del tipo de datos correspondiente) comprende una taxonomía para los dominios de valor dentro de un conjunto de datos. Esta taxonomía es la clase de representación. Por lo tanto, el término de representación se puede utilizar para controlar la proliferación de dominios de valor al garantizar que los dominios de valor equivalentes utilicen el mismo término de representación.
Cuando una persona o un agente de software analiza dos registros de metadatos separados para encontrar la equivalencia de propiedades , el término de representación se puede utilizar como guía. Por ejemplo, si el sistema A tiene un elemento de datos como PersonGenderCode y el sistema B tiene un elemento de datos como PersonSexCode, el sufijo de código podría ayudar a los dos sistemas a hacer coincidir solo los elementos de datos que tienen el sufijo "Code". Sin embargo, una taxonomía de términos de propiedad (es decir, "Sexo" o "Género") es mucho más eficiente en este sentido.
El término de representación se puede utilizar de muchas maneras para realizar inferencias sobre conjuntos de datos. Los términos de representación informan al observador de cualquier flujo de datos sobre los tipos de datos y dan una indicación de cómo se puede utilizar el elemento de datos. Esto es fundamental al asignar registros de metadatos a elementos de datos externos. Por ejemplo, si le envían un registro sobre una persona, puede buscar cualquier sufijo "ID" para comprender cómo el sistema remoto puede diferenciar dos registros distintos.
Los términos de representación también se utilizan para hacer inferencias sobre los requisitos de una propiedad. Por ejemplo, si un flujo de datos tuviera el elemento de datos PersonBirthDateAndTime, sabría que tanto la fecha como la hora están disponibles y son relevantes, no solo la fecha. Si la hora de nacimiento fuera opcional, se deberían utilizar elementos de datos separados, como PersonBirthDate y PersonBirthTime.
Al crear un almacén de datos, un analista de negocios analiza los términos de representación para encontrar rápidamente las dimensiones y medidas de un tema con el fin de crear cubos OLAP. Por ejemplo:
La especificación técnica conjunta de componentes básicos ISO/ONU define formalmente tanto el conjunto permitido de términos de representación como el conjunto correspondiente de tipos de datos. La norma ISO 15000-5 es una capa de implementación de la norma ISO 11179 y expresa normativamente un conjunto de reglas para definir semánticamente modelos de datos conceptuales y físicos/lógicos para una amplia variedad de usos. En la norma ISO 15000-5, el término de representación proporciona un mecanismo para armonizar los dominios de valor de los elementos de datos candidatos antes de agregarlos al modelo o modelos de datos generales. La norma ISO 15000-5 está siendo utilizada por varios gobiernos, organizaciones de desarrollo de normas y el sector privado como base para el modelado de datos.
Algunas normas informales, como el Marco Universal de Elementos de Datos (que hace referencia a un Término de Representación como una "Palabra de Propiedad"), asignan identificadores enteros únicos a cada Término de Representación. Esto permite que las herramientas de mapeo de metadatos mapeen un conjunto de elementos de datos en otros vocabularios de metadatos. Se puede encontrar un ejemplo de estos mapeos en Identificador de palabra de propiedad . Tenga en cuenta que, a partir de noviembre de 2005, los conceptos UDEF no han sido ampliamente adoptados.
Por ejemplo, si un fragmento de datos XML tuviera lo siguiente:
<Persona> <IDPersona> 123-45-6789 </IDPersona> <NombreDeLaPersona> Juan </NombreDeLaPersona> <NombreDeLaPersona> Smith </NombreDeLaPersona> <FechaDeNacimientoDePersona> 14-08-1990 </FechaDeNacimientoDePersona></Persona>
En el ejemplo anterior, los términos de representación son "ID" para <PersonID>, el sufijo "Nombre" para el nombre y apellido, y "Fecha" para <PersonBirthDate>.
Los siguientes son ejemplos de Términos de Representación que se han utilizado para el intercambio de mensajes electrónicos en sistemas como NIEM o GJXDM 3.0: [nota: las restricciones expresadas aquí se limitan a esas especificaciones y no representan un consenso universal]
[Nota] Este es un conjunto extremadamente limitado de la amplia gama de normas que especifican el uso de términos de representación.