Un recurso web es cualquier recurso identificable (digital, físico o abstracto) presente o conectado a la World Wide Web . [1] [2] [3] Los recursos se identifican utilizando identificadores uniformes de recursos (URI). [1] [4] En la Web semántica , los recursos web y sus propiedades semánticas se describen utilizando el marco de descripción de recursos (RDF). [5]
El concepto de recurso web ha evolucionado a lo largo de la historia de la Web, desde la noción inicial de documentos o archivos estáticos direccionables hasta una definición más genérica y abstracta, que ahora abarca cualquier "cosa" o entidad que pueda identificarse, nombrarse, direccionarse o manejarse, de cualquier manera, en la Web en general o en cualquier sistema de información en red. Los aspectos declarativos de un recurso (identificación y denominación) y sus aspectos funcionales (direccionamiento y manejo técnico) no estaban claramente diferenciados en las primeras especificaciones de la Web, y la propia definición del concepto ha sido objeto de un largo y aún abierto debate que involucra cuestiones técnicas, sociales, lingüísticas y filosóficas difíciles y a menudo arcanas.
En las primeras especificaciones de la web (1990-1994), el término recurso apenas se utiliza. La web está diseñada como una red de objetos direccionables más o menos estáticos, básicamente archivos y documentos, vinculados mediante localizadores uniformes de recursos (URL). Un recurso web se define implícitamente como algo que se puede identificar. La identificación tiene dos propósitos distintos: nombrar y direccionar; este último solo depende de un protocolo. Es notable que la RFC 1630 no intente definir en absoluto la noción de recurso; de hecho, apenas utiliza el término, además de su aparición en identificador uniforme de recursos (URI), localizador uniforme de recursos (URL) y nombre uniforme de recursos (URN), y aún habla de "objetos de la red".
El documento RFC 1738 (diciembre de 1994) especifica con más detalle las URL, y el término "universal" se cambia por "uniforme". El documento hace un uso más sistemático del término "recurso " para referirse a objetos que están "disponibles" o "pueden localizarse y accederse" a través de Internet. Una vez más, el término " recurso" en sí no está definido explícitamente.
La primera definición explícita de recurso se encuentra en RFC 2396, en agosto de 1998:
Un recurso puede ser cualquier cosa que tenga identidad. Algunos ejemplos conocidos son un documento electrónico, una imagen, un servicio (por ejemplo, "el informe meteorológico de hoy en Los Ángeles") y una colección de otros recursos. No todos los recursos son "recuperables" en red; por ejemplo, los seres humanos, las corporaciones y los libros encuadernados de una biblioteca también pueden considerarse recursos. El recurso es la correspondencia conceptual con una entidad o un conjunto de entidades, no necesariamente la entidad que corresponde a esa correspondencia en un momento determinado. Por lo tanto, un recurso puede permanecer constante incluso cuando su contenido (las entidades a las que corresponde actualmente) cambia con el tiempo, siempre que la correspondencia conceptual no se modifique en el proceso.
Aunque los ejemplos de este documento todavía se limitaban a entidades físicas, la definición abrió la puerta a recursos más abstractos. Si se le asigna una identidad a un concepto, y esta identidad se expresa mediante un URI (Identificador uniforme de recursos, un superconjunto de URL) bien formado, entonces un concepto también puede ser un recurso.
En enero de 2005, el RFC 3986 hace que esta extensión de la definición sea completamente explícita: "... los conceptos abstractos pueden ser recursos, como los operadores y operandos de una ecuación matemática, los tipos de una relación (por ejemplo, "padre" o "empleado"), o valores numéricos (por ejemplo, cero, uno e infinito)."
El lenguaje RDF, que se publicó por primera vez en 1999, se diseñó inicialmente para describir recursos, es decir, para declarar metadatos de recursos de una manera estándar. Una descripción RDF de un recurso es un conjunto de tripletas (sujeto, predicado, objeto), donde el sujeto representa el recurso que se va a describir, el predicado un tipo de propiedad relevante para este recurso y el objeto puede ser un dato u otro recurso. El predicado en sí se considera un recurso y se identifica mediante una URI. Por lo tanto, las propiedades como "título", "autor" se representan en RDF como recursos, que se pueden utilizar, de manera recursiva, como el sujeto de otras tripletas. Basándose en este principio recursivo, los vocabularios RDF, como RDF Schema (RDFS), Web Ontology Language (OWL) y Simple Knowledge Organization System, acumularán definiciones de recursos abstractos como clases, propiedades, conceptos, todos ellos identificados mediante URI.
RDF también especifica la definición de recursos anónimos o nodos en blanco , que no están absolutamente identificados por URI.
Las URL , en particular las URI HTTP , se utilizan con frecuencia para identificar recursos abstractos, como clases, propiedades u otro tipo de conceptos. Se pueden encontrar ejemplos en las ontologías RDFS u OWL . Dado que dichas URI están asociadas con el protocolo HTTP, surgió la pregunta de qué tipo de representación, si es que hay alguna, se debería obtener para dichos recursos a través de este protocolo, normalmente utilizando un navegador web, y si la sintaxis de la propia URI podría ayudar a diferenciar los recursos "abstractos" de los recursos "de información". Las especificaciones de URI como RFC 3986 dejaron a la especificación del protocolo la tarea de definir las acciones realizadas sobre los recursos y no proporcionan ninguna respuesta a esta pregunta. Se ha sugerido que una URI HTTP que identifique un recurso en el sentido original, como un archivo, documento o cualquier tipo de los denominados recursos de información, debería ser una URI "slash" - en otras palabras, no debería contener un identificador de fragmento , mientras que una URI utilizada para identificar un concepto o un recurso abstracto debería ser una URI "hash" que utilice un identificador de fragmento.
Por ejemplo: http://www.example.org/catalogue/widgets.html
identificaría y localizaría una página web (quizás proporcionando una descripción legible por humanos de los widgets vendidos por Silly Widgets, Inc.) mientras que http://www.example.org/ontology#Widget
identificaría el concepto abstracto o la clase "Widget" en esta ontología de la empresa, y no recuperaría necesariamente ningún recurso físico a través del protocolo HTTP . Pero se ha respondido que tal distinción es imposible de aplicar en la práctica, y los vocabularios estándar famosos proporcionan contraejemplos ampliamente utilizados. Por ejemplo, los conceptos Dublin Core como "título", "editor", "creador" se identifican mediante URL con "barra" como http://purl.org/dc/elements/1.1/title
.
La cuestión general de qué tipo de recursos debe o no identificar la URL HTTP se conocía anteriormente en el W3C como la cuestión httpRange-14, siguiendo su nombre en la lista definida por el (TAG). El TAG proporcionó en 2005 una respuesta final a esta cuestión, haciendo que la distinción entre un "recurso de información" y un recurso "no informativo" dependa del tipo de respuesta dada por el servidor a una solicitud "GET":
Esto permite que los vocabularios (como Dublin Core , FOAF y Wordnet ) sigan utilizando la barra en lugar del hash por razones pragmáticas. Si bien este compromiso parece haber alcanzado un consenso en la comunidad de la Web Semántica, algunos de sus miembros destacados, como Pat Hayes, han expresado sus inquietudes tanto sobre su viabilidad técnica como sobre su fundamento conceptual. Según el punto de vista de Patrick Hayes, la distinción misma entre "recurso de información" y "otro recurso" es imposible de encontrar y es mejor no especificarla en absoluto, y la ambigüedad del recurso de referencia es inherente a las URI como a cualquier mecanismo de denominación.
En RDF, "cualquiera puede declarar cualquier cosa sobre cualquier cosa". Los recursos se definen mediante descripciones formales que cualquiera puede publicar, copiar, modificar y publicar en la web. Si el contenido de un recurso web en el sentido clásico (una página web o un archivo en línea) es claramente propiedad de su editor, que puede reclamar propiedad intelectual sobre él, un recurso abstracto puede definirse mediante una acumulación de descripciones RDF, no necesariamente controladas por un editor único y no necesariamente coherentes entre sí. Es una cuestión abierta saber si un recurso debe tener una definición autorizada con un propietario claro y confiable y, en este caso, cómo hacer que esta descripción sea técnicamente distinta de otras descripciones. Una cuestión paralela es cómo se puede aplicar la propiedad intelectual a tales descripciones.