stringtranslate.com

URL

Un localizador uniforme de recursos ( URL ), conocido coloquialmente como dirección en la Web , [1] es una referencia a un recurso que especifica su ubicación en una red informática y un mecanismo para recuperarlo. Una URL es un tipo específico de Identificador uniforme de recursos (URI), [2] [3] aunque mucha gente usa los dos términos indistintamente. [4] [a] Las URL se utilizan con mayor frecuencia para hacer referencia a páginas web ( HTTP / HTTPS ), pero también se utilizan para transferencia de archivos ( FTP ), correo electrónico ( mailto ), acceso a bases de datos ( JDBC ) y muchas otras aplicaciones.

La mayoría de los navegadores web muestran la URL de una página web encima de la página en una barra de direcciones . Una URL típica podría tener el formato http://www.example.com/index.html, que indica un protocolo ( http), un nombre de host ( www.example.com) y un nombre de archivo ( index.html).

Historia

Los localizadores uniformes de recursos fueron definidos en RFC  1738 en 1994 por Tim Berners-Lee , el inventor de la World Wide Web , y el grupo de trabajo URI del Internet Engineering Task Force (IETF), [7] como resultado de la colaboración iniciada en el Sesión de IETF Living Documents sobre pájaros del mismo plumaje en 1992. [7] [8]

El formato combina el sistema preexistente de nombres de dominio (creado en 1985) con la sintaxis de ruta de archivo , donde se utilizan barras para separar directorios y nombres de archivos . Ya existían convenciones en las que los nombres de los servidores podían tener como prefijo las rutas completas de los archivos, precedidos por una doble barra ( //). [9]

Más tarde, Berners-Lee lamentó el uso de puntos para separar las partes del nombre de dominio dentro de los URI , deseando haber usado barras diagonales en todas partes, [9] y también dijo que, dados los dos puntos que siguen al primer componente de un URI, los dos las barras diagonales antes del nombre de dominio eran innecesarias. [10]

Los primeros colaboradores de WorldWideWeb , incluido Berners-Lee, propusieron originalmente el uso de UDI: identificadores universales de documentos. Un primer borrador (1993) de la Especificación HTML [11] hacía referencia a los localizadores de recursos "universales". Esto se eliminó en algún momento entre junio de 1994 ( RFC 1630) y octubre de 1994 (draft-ietf-uri-url-08.txt). [12] En su libro Weaving the Web , Berners-Lee enfatiza su preferencia por la inclusión original de "universal" en la expansión en lugar de la palabra "uniforme", a la que luego se cambió, y da un breve relato de la argumento que condujo al cambio.

Sintaxis

Cada URL HTTP se ajusta a la sintaxis de un URI genérico. La sintaxis genérica de URI consta de cinco componentes organizados jerárquicamente en orden de importancia decreciente de izquierda a derecha: [13]

URI = esquema ":" ["//" autoridad] ruta ["?" consulta] [fragmento "#"]

Un componente no está definido si tiene un delimitador asociado y el delimitador no aparece en el URI; los componentes del esquema y la ruta siempre están definidos. [14] Un componente está vacío si no tiene caracteres; el componente del esquema siempre no está vacío. [13]

El componente de autoridad consta de subcomponentes :

autoridad = [información de usuario "@"] host [":" puerto]

Esto se representa en un diagrama de sintaxis como:

diagrama de sintaxis URI

La URI comprende:

Por convención, en los URI http y https , la última parte de una ruta se denominapathinfo y es opcional. Está compuesto por cero o más segmentos de ruta que no se refieren a un nombre de recurso físico existente (por ejemplo, un archivo, un programa de módulo interno o un programa ejecutable) sino a una parte lógica (por ejemplo, un comando o una parte calificadora) que tiene que pasarse por separado a la primera parte de la ruta que identifica un módulo o programa ejecutable administrado por unservidor web; esto se usa a menudo para seleccionar contenido dinámico (un documento, etc.) o para adaptarlo según lo solicitado (ver también:CGIy PATH_INFO, etc.).
Ejemplo:
URI:"http://www.example.com/questions/3456/my-document"
donde: "/questions"es la primera parte de la ruta (un módulo o programa ejecutable) y "/3456/my-document"es la segunda parte de la ruta denominada pathinfo , que se pasa al módulo ejecutable o programa denominado "/questions"para seleccionar el documento solicitado.
Un URI http o https que contiene una parte de información de ruta sin una parte de consulta también puede denominarse " URL limpia " cuya última parte puede ser un " slug ".

Un navegador web normalmente eliminará la referencia a una URL realizando una solicitud HTTP al host especificado, de forma predeterminada en el puerto número 80. Las URL que utilizan el httpsesquema requieren que las solicitudes y respuestas se realicen a través de una conexión segura al sitio web .

URL internacionalizada

Los usuarios de Internet están distribuidos por todo el mundo utilizando una amplia variedad de idiomas y alfabetos, y esperan poder crear URL en sus propios alfabetos locales. Un identificador de recursos internacionalizado (IRI) es una forma de URL que incluye caracteres Unicode . Todos los navegadores modernos admiten IRI. Las partes de la URL que requieren un tratamiento especial para diferentes alfabetos son el nombre de dominio y la ruta. [20] [21]

El nombre de dominio en el IRI se conoce como Nombre de Dominio Internacionalizado (IDN). El software web e Internet convierte automáticamente el nombre de dominio en punycode utilizable por el Sistema de nombres de dominio ; por ejemplo, la URL china http://例子.卷筒纸se convierte en http://xn--fsqu00a.xn--3lr804guic/. Indica xn--que el carácter no era originalmente ASCII . [22]

El usuario también puede especificar el nombre de la ruta URL en el sistema de escritura local. Si aún no está codificado, se convierte a UTF-8 y cualquier carácter que no forme parte del conjunto de caracteres básico de la URL se escapa como hexadecimal usando codificación porcentual ; por ejemplo, la URL japonesa http://example.com/引き割り.htmlse convierte en http://example.com/%E5%BC%95%E3%81%8D%E5%89%B2%E3%82%8A.html. La computadora de destino decodifica la dirección y muestra la página. [20]

URL relativas al protocolo

Los enlaces relativos al protocolo (PRL), también conocidos como URL relativos al protocolo (PRURL), son URL que no tienen ningún protocolo especificado. Por ejemplo, //example.comutilizará el protocolo de la página actual, normalmente HTTP o HTTPS. [23] [24]

Ver también

Notas

  1. ^ Una URL implica el medio para acceder a un recurso indicado y se indica mediante un protocolo o mecanismo de acceso, lo que no ocurre con todos los URI. [5] [4] Así http://www.example.comes una URL, mientras que www.example.comno lo es. [6]
  2. ^ Los procedimientos para registrar nuevos esquemas de URI se definieron originalmente en 1999 mediante RFC  2717 y ahora están definidos por RFC 7595, publicado en junio de 2015. [15]
  3. ^ Para los URI relacionados con recursos en la World Wide Web, algunos navegadores web permiten .0eliminar partes de la notación decimal con puntos o utilizar direcciones IP enteras sin formato. [17]
  4. ^ El histórico RFC  1866 (obsoleto por RFC 2854) anima a los autores de CGI a admitir ';' además de '&'. [19]

Citas

  1. ^ W3C (2009).
  2. ^ "Barras diagonales y inversas en las URL". zzz.buzz . Archivado desde el original el 4 de septiembre de 2018 . Consultado el 19 de septiembre de 2018 .
  3. ^ RFC 3986 (2005).
  4. ^ ab Grupo de interés de planificación conjunto W3C/IETF URI (2002).
  5. ^ RFC 2396 (1998).
  6. ^ Miessler, Daniel. "La diferencia entre URL y URI". Archivado desde el original el 17 de marzo de 2017 . Consultado el 16 de marzo de 2017 .
  7. ^ ab W3C (1994).
  8. ^ IETF (1992).
  9. ^ ab Berners-Lee (2015).
  10. ^ Noticias de la BBC (2009).
  11. ^ Berners-Lee, Tim ; Connolly, Daniel "Dan" (marzo de 1993). Lenguaje de marcado de hipertexto (borrador RFCxxx) (Informe técnico). pag. 28. Archivado desde el original el 23 de octubre de 2017 . Consultado el 23 de octubre de 2017 .
  12. ^ Berners-Lee, Tim ; Master, Larry ; McCahill, Mark Perry (octubre de 1994). Localizadores uniformes de recursos (URL) (Informe técnico).(Este borrador de Internet se publicó como estándar propuesto RFC, RFC 1738 (1994)) Citado en Ang, CS; Martín, DC (enero de 1995). Interfaz de componente constituyente ++ (informe técnico). Biblioteca y Centro para la Gestión del Conocimiento de la UCSF. Archivado desde el original el 23 de octubre de 2017 . Consultado el 23 de octubre de 2017 .
  13. ^ ab RFC 3986 (2005), §3.
  14. ^ RFC 3986 (2005), §5.2.1.
  15. ^ IETF (2015).
  16. ^ RFC 3986 (2005), §3.2.2.
  17. ^ Lorenzo (2014).
  18. ^ RFC 2396 (1998), §3.3.
  19. ^ RFC 1866 (1995), §8.2.1.
  20. ^ ab W3C (2008).
  21. ^ W3C (2014).
  22. ^ IANA (2003).
  23. ^ Glaser, JD (10 de marzo de 2014). Desarrollo seguro para aplicaciones móviles: cómo diseñar y codificar aplicaciones móviles seguras con PHP y JavaScript (1ª ed.). Prensa CRC . pag. 193.ISBN 978-1-48220903-7. Consultado el 12 de octubre de 2015 .
  24. ^ Schafer, Steven M. (2011). Biblia HTML, XHTML y CSS (1ª ed.). John Wiley e hijos . pag. 124.ISBN 978-1-11808130-3. Consultado el 12 de octubre de 2015 .

Referencias

enlaces externos