La World Wide Web ( WWW o simplemente la Web ) es un sistema de información que permite compartir contenido a través de Internet a través de métodos fáciles de usar que buscan atraer a usuarios más allá de los especialistas en TI y los aficionados. [1] Permite acceder a documentos y otros recursos web a través de Internet de acuerdo con reglas específicas del Protocolo de transferencia de hipertexto (HTTP). [2]
La Web fue inventada por el informático inglés Tim Berners-Lee mientras trabajaba en el CERN en 1989 y se abrió al público en 1991. Fue concebida como un "sistema de información enlazado universal". [3] [4] Los documentos y otros contenidos multimedia se ponen a disposición de la red a través de servidores web y se puede acceder a ellos mediante programas como los navegadores web . Los servidores y recursos de la World Wide Web se identifican y localizan a través de cadenas de caracteres llamadas localizadores uniformes de recursos (URL).
El tipo de documento original y aún muy común es una página web formateada en lenguaje de marcado de hipertexto (HTML). Este lenguaje de marcado admite texto sin formato , imágenes , contenidos de video y audio incrustados y scripts (programas cortos) que implementan una interacción compleja con el usuario. El lenguaje HTML también admite hipervínculos (URL incrustadas) que brindan acceso inmediato a otros recursos web. La navegación web , o navegación web, es la práctica común de seguir dichos hipervínculos en varios sitios web. Las aplicaciones web son páginas web que funcionan como software de aplicación . La información en la Web se transfiere a través de Internet mediante HTTP. Múltiples recursos web con un tema común y, por lo general, un nombre de dominio común conforman un sitio web . Un solo servidor web puede proporcionar varios sitios web, mientras que algunos sitios web, especialmente los más populares, pueden ser proporcionados por varios servidores. El contenido del sitio web es proporcionado por una gran cantidad de empresas, organizaciones, agencias gubernamentales y usuarios individuales ; y comprende una enorme cantidad de información educativa, de entretenimiento, comercial y gubernamental.
La Web se ha convertido en la plataforma de sistemas de información dominante en el mundo . [5] [6] [7] [8] Es la herramienta principal que miles de millones de personas en todo el mundo utilizan para interactuar con Internet. [2]
La Web fue inventada por el informático inglés Tim Berners-Lee mientras trabajaba en el CERN . [9] [10] Su motivación era el problema de almacenar, actualizar y encontrar documentos y archivos de datos en esa organización grande y en constante cambio, así como distribuirlos a colaboradores fuera del CERN. En su diseño, Berners-Lee descartó el enfoque de estructura de árbol común , utilizado por ejemplo en el sistema de documentación CERNDOC existente y en el sistema de archivos Unix , así como los enfoques que se basaban en etiquetar archivos con palabras clave , como en el sistema VAX/NOTES. En su lugar, adoptó conceptos que había puesto en práctica con su sistema privado ENQUIRE (1980) construido en el CERN. Cuando se dio cuenta del modelo de hipertexto de Ted Nelson (1965), en el que los documentos se pueden vincular de formas sin restricciones a través de hipervínculos asociados con "puntos calientes" incrustados en el texto, ayudó a confirmar la validez de su concepto. [11] [12]
El modelo fue popularizado posteriormente por el sistema HyperCard de Apple . A diferencia de Hypercard, el nuevo sistema de Berners-Lee desde el principio estaba pensado para soportar enlaces entre múltiples bases de datos en computadoras independientes y permitir el acceso simultáneo de muchos usuarios desde cualquier computadora en Internet. También especificó que el sistema debería eventualmente manejar otros medios además del texto, como gráficos, voz y video. Los enlaces podrían hacer referencia a archivos de datos mutables, o incluso iniciar programas en su computadora servidor. También concibió "pasarelas" que permitirían el acceso a través del nuevo sistema a documentos organizados de otras maneras (como los sistemas de archivos de computadora tradicionales o Usenet ). Finalmente, insistió en que el sistema debería estar descentralizado, sin ningún control central o coordinación sobre la creación de enlaces. [3] [13] [9] [10]
Berners-Lee presentó una propuesta al CERN en mayo de 1989, sin darle un nombre al sistema. [3] Consiguió implementar un sistema funcional a finales de 1990, incluyendo un navegador llamado WorldWideWeb (que se convirtió en el nombre del proyecto y de la red) y un servidor HTTP funcionando en el CERN. Como parte de ese desarrollo, definió la primera versión del protocolo HTTP, la sintaxis básica de URL e implícitamente convirtió a HTML en el formato de documento principal. [14] La tecnología se lanzó fuera del CERN a otras instituciones de investigación a partir de enero de 1991, y luego a todo Internet el 23 de agosto de 1991. La Web fue un éxito en el CERN y comenzó a extenderse a otras instituciones científicas y académicas. En los dos años siguientes, se crearon 50 sitios web . [15] [16]
En 1993, el CERN puso a disposición el protocolo y el código web sin pagar regalías, lo que permitió su uso generalizado. [17] [18] Después de que la NCSA lanzara el navegador web Mosaic más tarde ese año, la popularidad de la Web creció rápidamente a medida que surgieron miles de sitios web en menos de un año. [19] [20] Mosaic era un navegador gráfico que podía mostrar imágenes en línea y enviar formularios que eran procesados por el servidor HTTPd . [21] [22] Marc Andreessen y Jim Clark fundaron Netscape al año siguiente y lanzaron el navegador Navigator , que introdujo Java y JavaScript en la Web. Rápidamente se convirtió en el navegador dominante. Netscape se convirtió en una empresa pública en 1995, lo que desencadenó un frenesí por la Web y comenzó la burbuja punto-com . [23] Microsoft respondió desarrollando su propio navegador, Internet Explorer , iniciando las guerras de navegadores . Al combinarlo con Windows, se convirtió en el navegador dominante durante 14 años. [24]
Berners-Lee fundó el Consorcio World Wide Web (W3C), que creó XML en 1996 y recomendó reemplazar HTML por XHTML más estricto . [25] Mientras tanto, los desarrolladores comenzaron a explotar una característica de IE llamada XMLHttpRequest para crear aplicaciones Ajax y lanzaron la revolución de la Web 2.0 . Mozilla , Opera y Apple rechazaron XHTML y crearon el WHATWG , que desarrolló HTML5 . [26] En 2009, el W3C concedió y abandonó XHTML. [27] En 2019, cedió el control de la especificación HTML al WHATWG. [28]
La World Wide Web ha sido fundamental para el desarrollo de la era de la información y es la herramienta principal que miles de millones de personas utilizan para interactuar en Internet . [29] [30] [31] [8]
Tim Berners-Lee afirma que World Wide Web se escribe oficialmente como tres palabras separadas, cada una en mayúscula, sin guiones intermedios. [32] No obstante, a menudo se la llama simplemente Web , y también a menudo web ; consulte Capitalización de Internet para obtener más detalles. En chino mandarín, World Wide Web se traduce comúnmente a través de una coincidencia fonosemántica con wàn wéi wǎng (万维网), que satisface www y literalmente significa "red de 10,000 dimensiones", una traducción que refleja el concepto de diseño y la proliferación de la World Wide Web.
El uso del prefijo www ha ido disminuyendo, especialmente cuando las aplicaciones web buscaron ponerle marca a sus nombres de dominio y hacerlos fácilmente pronunciables. A medida que la Web móvil se hizo más popular, [ cita requerida ] servicios como Gmail .com, Outlook.com , Myspace .com, Facebook .com y Twitter .com se mencionan con mayor frecuencia sin agregar "www." (o, de hecho, ".com") al dominio. [33]
En inglés, www se suele leer como double-u double-u double-u . [34] Algunos usuarios lo pronuncian dub-dub-dub , particularmente en Nueva Zelanda. [35] Stephen Fry , en su serie de podcasts "Podgrams", lo pronuncia wuh wuh wuh . [36] El escritor inglés Douglas Adams bromeó una vez en The Independent on Sunday (1999): "La World Wide Web es la única cosa que conozco cuya forma abreviada lleva tres veces más tiempo pronunciar que su abreviatura". [37]
Los términos Internet y World Wide Web se utilizan a menudo sin mucha distinción. Sin embargo, los dos términos no significan lo mismo. Internet es un sistema global de redes informáticas interconectadas a través de telecomunicaciones y redes ópticas . En cambio, la World Wide Web es una colección global de documentos y otros recursos , vinculados por hipervínculos y URI . Se accede a los recursos web mediante HTTP o HTTPS , que son protocolos de Internet a nivel de aplicación que utilizan los protocolos de transporte de Internet. [2]
La visualización de una página web en la World Wide Web normalmente comienza escribiendo la URL de la página en un navegador web o siguiendo un hipervínculo a esa página o recurso. A continuación, el navegador web inicia una serie de mensajes de comunicación en segundo plano para obtener y mostrar la página solicitada. En la década de 1990, el uso de un navegador para ver páginas web (y para pasar de una página web a otra mediante hipervínculos) pasó a conocerse como "navegación", "navegación web" (por "navegación por canales ") o "navegación por la Web". Los primeros estudios de este nuevo comportamiento investigaron los patrones de los usuarios en el uso de los navegadores web. Un estudio, por ejemplo, encontró cinco patrones de usuario: navegación exploratoria, navegación por ventanas, navegación evolucionada, navegación limitada y navegación dirigida. [38]
El siguiente ejemplo demuestra el funcionamiento de un navegador web al acceder a una página en la URLhttp://ejemplo.org/inicio.htmlEl navegador resuelve el nombre del servidor de la URL (ejemplo.org) en una dirección de Protocolo de Internet utilizando el Sistema de nombres de dominio (DNS) distribuido globalmente . Esta búsqueda devuelve una dirección IP como 203.0.113.4 o 2001:db8:2e::7334 . A continuación, el navegador solicita el recurso enviando una solicitud HTTP a través de Internet a la computadora en esa dirección. Solicita el servicio desde un número de puerto TCP específico que es bien conocido para el servicio HTTP de modo que el host receptor pueda distinguir una solicitud HTTP de otros protocolos de red a los que pueda prestar servicio. HTTP normalmente utiliza el número de puerto 80 y para HTTPS normalmente utiliza el número de puerto 443 . El contenido de la solicitud HTTP puede ser tan simple como dos líneas de texto:
GET /home.html HTTP / 1.1 Host : ejemplo.org
La computadora que recibe la solicitud HTTP la envía al software del servidor web que escucha las solicitudes en el puerto 80. Si el servidor web puede cumplir con la solicitud, envía una respuesta HTTP al navegador indicando que la operación se ha realizado correctamente:
HTTP / 1.1 200 OK Tipo de contenido : texto/html; conjunto de caracteres=UTF-8
Seguido del contenido de la página solicitada. El lenguaje de marcado de hipertexto ( HTML ) para una página web básica podría verse así:
< html > < head > < title > Example.org – La World Wide Web </ title > </ head > < body > < p > La World Wide Web, abreviada como WWW y conocida comúnmente como... </ p > </ body > </ html >
El navegador web analiza el HTML e interpreta el marcado ( , para párrafo, etc.) que rodea las palabras para dar formato al texto en la pantalla. Muchas páginas web utilizan HTML para hacer referencia a las URL de otros recursos, como imágenes, otros medios integrados, secuencias de comandos que afectan el comportamiento de la página y hojas de estilo en cascada que afectan el diseño de la página. El navegador realiza solicitudes HTTP adicionales al servidor web para estos otros tipos de medios de Internet . A medida que recibe su contenido del servidor web, el navegador muestra progresivamente la página en la pantalla según lo especificado por su HTML y estos recursos adicionales.<title>
<p>
El lenguaje de marcado de hipertexto (HTML) es el lenguaje de marcado estándar para crear páginas web y aplicaciones web . Junto con las hojas de estilo en cascada (CSS) y JavaScript , forma una tríada de tecnologías fundamentales para la World Wide Web. [39]
Los navegadores web reciben documentos HTML de un servidor web o de un almacenamiento local y los convierten en páginas web multimedia. HTML describe la estructura de una página web semánticamente y originalmente incluía indicaciones para la apariencia del documento.
Los elementos HTML son los componentes básicos de las páginas HTML. Con las construcciones HTML, se pueden incrustar imágenes y otros objetos, como formularios interactivos , en la página representada. HTML proporciona un medio para crear documentos estructurados al indicar la semántica estructural del texto, como encabezados, párrafos, listas, enlaces , citas y otros elementos. Los elementos HTML se delimitan mediante etiquetas , escritas con corchetes angulares . Las etiquetas como y introducen directamente el contenido en la página. Otras etiquetas, como rodean y proporcionan información sobre el texto del documento y pueden incluir otras etiquetas como subelementos. Los navegadores no muestran las etiquetas HTML, sino que las utilizan para interpretar el contenido de la página.<img />
<input />
<p>
HTML puede incorporar programas escritos en un lenguaje de programación como JavaScript , lo que afecta el comportamiento y el contenido de las páginas web. La inclusión de CSS define el aspecto y el diseño del contenido. El Consorcio World Wide Web (W3C), responsable de los estándares HTML y CSS, ha fomentado el uso de CSS en lugar de HTML de presentación explícito desde 1997. [40][update]
La mayoría de las páginas web contienen hipervínculos a otras páginas relacionadas y, tal vez, a archivos descargables, documentos fuente, definiciones y otros recursos web. En el código HTML subyacente, un hipervínculo tiene el siguiente aspecto:<a href="http://example.org/home.html">Example.org Homepage</a>.
Este conjunto de recursos útiles y relacionados, interconectados mediante enlaces de hipertexto, se denomina red de información. La publicación en Internet creó lo que Tim Berners-Lee llamó por primera vez WorldWideWeb (en su versión original CamelCase , que posteriormente fue descartada) en noviembre de 1990. [41]
La estructura de hipervínculos de la web se describe mediante el webgrafo : los nodos del webgrafo corresponden a las páginas web (o URL) y los bordes dirigidos entre ellos a los hipervínculos. Con el tiempo, muchos recursos web a los que apuntan los hipervínculos desaparecen, se reubican o se reemplazan con contenido diferente. Esto hace que los hipervínculos queden obsoletos, un fenómeno conocido en algunos círculos como "rotura de enlaces", y los hipervínculos afectados por ello suelen denominarse enlaces "muertos" . La naturaleza efímera de la web ha impulsado muchos esfuerzos para archivar sitios web. El Internet Archive , activo desde 1996, es el más conocido de estos esfuerzos.
Muchos nombres de host utilizados para la World Wide Web comienzan con www debido a la práctica de larga data de nombrar a los hosts de Internet según los servicios que brindan. El nombre de host de un servidor web a menudo es www , de la misma manera que puede ser ftp para un servidor FTP y news o nntp para un servidor de noticias de Usenet . Estos nombres de host aparecen como nombres de Sistema de nombres de dominio (DNS) o subdominios , como en www.example.com . El uso de www no es requerido por ningún estándar técnico o de política y muchos sitios web no lo usan; el primer servidor web fue nxoc01.cern.ch . [42] Según Paolo Palazzi, quien trabajó en CERN junto con Tim Berners-Lee, el uso popular de www como subdominio fue accidental; la página del proyecto World Wide Web estaba destinada a publicarse en www.cern.ch mientras que info.cern.ch estaba destinado a ser la página de inicio de CERN; Sin embargo, los registros DNS nunca se cambiaron y la práctica de anteponer www al nombre de dominio del sitio web de una institución se copió posteriormente. [43] [ se necesita una mejor fuente ] Muchos sitios web establecidos todavía usan el prefijo, o emplean otros nombres de subdominio como www2 , secure o en para fines especiales. Muchos de estos servidores web están configurados de modo que tanto el nombre de dominio principal (por ejemplo, ejemplo.com) como el subdominio www (por ejemplo, www.ejemplo.com) se refieran al mismo sitio; otros requieren una forma u otra, o pueden asignarse a diferentes sitios web. El uso de un nombre de subdominio es útil para equilibrar la carga del tráfico web entrante mediante la creación de un registro CNAME que apunta a un grupo de servidores web. Dado que, actualmente [¿ a partir de? ] , solo se puede usar un subdominio en un CNAME, no se puede lograr el mismo resultado utilizando la raíz del dominio desnudo. [44] [ dudoso – discutir ]
Cuando un usuario introduce un nombre de dominio incompleto en el campo de entrada de la barra de direcciones de un navegador web, algunos navegadores web automáticamente intentan añadir el prefijo "www" al principio y posiblemente ".com", ".org" y ".net" al final, dependiendo de lo que pueda faltar. Por ejemplo, introducir "microsoft" puede transformarse en http://www.microsoft.com/ y "openoffice" en http://www.openoffice.org . Esta característica comenzó a aparecer en las primeras versiones de Firefox , cuando todavía tenía el título provisional "Firebird" a principios de 2003, a partir de una práctica anterior en navegadores como Lynx . [45] [¿ Fuente poco fiable? ] Se informa de que Microsoft recibió una patente estadounidense por la misma idea en 2008, pero sólo para dispositivos móviles. [46]
Los especificadores de esquema http://
y https://
al comienzo de una URL web hacen referencia al Protocolo de transferencia de hipertexto o HTTP seguro , respectivamente. Especifican el protocolo de comunicación que se utilizará para la solicitud y la respuesta. El protocolo HTTP es fundamental para el funcionamiento de la World Wide Web, y la capa de cifrado adicional en HTTPS es esencial cuando los navegadores envían o recuperan datos confidenciales, como contraseñas o información bancaria. Los navegadores web suelen anteponer automáticamente http:// a las URL introducidas por el usuario, si se omite.
Una página web (también escrita como página web ) es un documento que es adecuado para la World Wide Web y los navegadores web . Un navegador web muestra una página web en un monitor o dispositivo móvil .
El término página web se refiere generalmente a lo que es visible, pero también puede referirse al contenido del archivo informático en sí, que suele ser un archivo de texto que contiene hipertexto escrito en HTML o un lenguaje de marcado comparable . Las páginas web típicas proporcionan hipertexto para navegar a otras páginas web a través de hipervínculos , a menudo denominados enlaces . Los navegadores web con frecuencia tendrán que acceder a múltiples elementos de recursos web , como leer hojas de estilo , scripts e imágenes, mientras presentan cada página web.
En una red, un navegador web puede recuperar una página web de un servidor web remoto . El servidor web puede restringir el acceso a una red privada, como una intranet corporativa. El navegador web utiliza el Protocolo de transferencia de hipertexto (HTTP) para realizar dichas solicitudes al servidor web .
Una página web estática se entrega exactamente como está almacenada, como contenido web en el sistema de archivos del servidor web . Por el contrario, una página web dinámica es generada por una aplicación web , normalmente controlada por un software del lado del servidor . Las páginas web dinámicas se utilizan cuando cada usuario puede requerir información completamente diferente, por ejemplo, sitios web bancarios, correo electrónico web, etc.
Una página web estática (a veces llamada página plana/página estacionaria ) es una página web que se entrega al usuario exactamente como está almacenada, a diferencia de las páginas web dinámicas que son generadas por una aplicación web .
En consecuencia, una página web estática muestra la misma información para todos los usuarios, desde todos los contextos, sujeta a las capacidades modernas de un servidor web para negociar el tipo de contenido o el idioma del documento cuando dichas versiones están disponibles y el servidor está configurado para hacerlo.
Una página web dinámica del lado del servidor es una página web cuya construcción está controlada por un servidor de aplicaciones que procesa secuencias de comandos del lado del servidor. En las secuencias de comandos del lado del servidor, los parámetros determinan cómo se desarrolla el ensamblaje de cada nueva página web, incluida la configuración de más procesamiento del lado del cliente.
Una página web dinámica del lado del cliente procesa la página web mediante JavaScript que se ejecuta en el navegador. Los programas JavaScript pueden interactuar con el documento a través del Modelo de objetos del documento o DOM para consultar el estado de la página y modificarlo. Las mismas técnicas del lado del cliente pueden actualizar o cambiar dinámicamente el DOM de la misma manera.
Una página web dinámica es recargada por el usuario o por un programa de computadora para cambiar algún contenido variable. La información de actualización puede provenir del servidor o de cambios realizados en el DOM de esa página. Esto puede o no truncar el historial de navegación o crear una versión guardada a la que volver, pero una actualización de una página web dinámica utilizando tecnologías Ajax no creará una página a la que volver ni truncará el historial de navegación web antes de la página mostrada. Al utilizar tecnologías Ajax, el usuario final obtiene una página dinámica administrada como una sola página en el navegador web , mientras que el contenido web real representado en esa página puede variar. El motor Ajax se encuentra solo en el navegador y solicita partes de su DOM, el DOM, para su cliente, desde un servidor de aplicaciones.
HTML dinámico, o DHTML, es el término general para las tecnologías y métodos utilizados para crear páginas web que no son páginas web estáticas , aunque ha caído en desuso desde la popularización de AJAX , un término que ahora rara vez se usa. [ cita requerida ] Las secuencias de comandos del lado del cliente, las secuencias de comandos del lado del servidor o una combinación de estas crean una experiencia web dinámica en un navegador.
JavaScript es un lenguaje de programación que fue desarrollado inicialmente en 1995 por Brendan Eich , entonces de Netscape , para su uso dentro de páginas web. [47] La versión estandarizada es ECMAScript . [47] Para hacer que las páginas web sean más interactivas, algunas aplicaciones web también utilizan técnicas de JavaScript como Ajax ( JavaScript asíncrono y XML ). El script del lado del cliente se entrega con la página que puede realizar solicitudes HTTP adicionales al servidor, ya sea en respuesta a acciones del usuario como movimientos o clics del mouse, o en función del tiempo transcurrido. Las respuestas del servidor se utilizan para modificar la página actual en lugar de crear una nueva página con cada respuesta, por lo que el servidor solo necesita proporcionar información incremental limitada. Se pueden manejar múltiples solicitudes Ajax al mismo tiempo, y los usuarios pueden interactuar con la página mientras se recuperan los datos. Las páginas web también pueden sondear regularmente al servidor para verificar si hay nueva información disponible. [48]
Un sitio web [49] es una colección de recursos web relacionados que incluyen páginas web y contenido multimedia , generalmente identificados con un nombre de dominio común y publicados en al menos un servidor web . Algunos ejemplos notables son wikipedia.org , google.com y amazon.com .
Se puede acceder a un sitio web a través de una red pública de Protocolo de Internet (IP), como Internet , o una red de área local (LAN) privada, haciendo referencia a un localizador uniforme de recursos (URL) que identifica el sitio.
Los sitios web pueden tener muchas funciones y pueden usarse de diversas maneras; un sitio web puede ser un sitio web personal , un sitio web corporativo para una empresa, un sitio web gubernamental, un sitio web de una organización, etc. Los sitios web suelen estar dedicados a un tema o propósito en particular, que van desde el entretenimiento y las redes sociales hasta la provisión de noticias y educación. Todos los sitios web de acceso público constituyen colectivamente la World Wide Web, mientras que los sitios web privados, como el sitio web de una empresa para sus empleados, suelen ser parte de una intranet .
Las páginas web, que son los componentes básicos de los sitios web, son documentos , generalmente compuestos de texto simple intercalados con instrucciones de formato de lenguaje de marcado de hipertexto ( HTML , XHTML ). Pueden incorporar elementos de otros sitios web con anclajes de marcado adecuados . Se accede a las páginas web y se transportan con el Protocolo de transferencia de hipertexto (HTTP), que opcionalmente puede emplear cifrado ( HTTP Secure , HTTPS) para brindar seguridad y privacidad al usuario. La aplicación del usuario, a menudo un navegador web , muestra el contenido de la página de acuerdo con sus instrucciones de marcado HTML en una terminal de visualización .
Los hipervínculos entre páginas web transmiten al lector la estructura del sitio y guían la navegación del sitio, que a menudo comienza con una página de inicio que contiene un directorio del contenido web del sitio . Algunos sitios web requieren el registro o suscripción del usuario para acceder al contenido. Entre los ejemplos de sitios web de suscripción se incluyen muchos sitios comerciales, sitios web de noticias, sitios web de revistas académicas , sitios web de juegos, sitios web de intercambio de archivos, foros de mensajes , correo electrónico basado en la web , sitios web de redes sociales , sitios web que brindan cotizaciones de precios en tiempo real para diferentes tipos de mercados, así como sitios que brindan varios otros servicios. Los usuarios finales pueden acceder a los sitios web en una variedad de dispositivos, incluidos computadoras de escritorio y portátiles , tabletas , teléfonos inteligentes y televisores inteligentes .
Un navegador web (comúnmente llamado navegador ) es un agente de usuario de software para acceder a información en la World Wide Web. Para conectarse al servidor de un sitio web y mostrar sus páginas, un usuario necesita tener un programa de navegador web. Este es el programa que el usuario ejecuta para descargar, formatear y mostrar una página web en su computadora.
Además de permitir a los usuarios encontrar, visualizar y navegar entre páginas web, un navegador web normalmente tendrá características como guardar marcadores, registrar el historial, administrar cookies (ver más abajo) y páginas de inicio, y puede tener funciones para registrar contraseñas para iniciar sesión en sitios web.
Los navegadores más populares son Chrome , Firefox , Safari , Internet Explorer y Edge .
Un servidor web es un software de servidor , o hardware dedicado a ejecutar dicho software, que puede satisfacer las solicitudes de los clientes de la World Wide Web. Un servidor web puede, en general, contener uno o más sitios web. Un servidor web procesa las solicitudes de red entrantes a través de HTTP y varios otros protocolos relacionados.
La función principal de un servidor web es almacenar, procesar y entregar páginas web a los clientes . [50] La comunicación entre el cliente y el servidor se lleva a cabo utilizando el Protocolo de transferencia de hipertexto (HTTP) . Las páginas entregadas son con mayor frecuencia documentos HTML , que pueden incluir imágenes , hojas de estilo y scripts además del contenido de texto.
Un agente de usuario , normalmente un navegador web o un rastreador web , inicia la comunicación al realizar una solicitud de un recurso específico mediante HTTP y el servidor responde con el contenido de ese recurso o un mensaje de error si no puede hacerlo. El recurso suele ser un archivo real en el almacenamiento secundario del servidor, pero este no es necesariamente el caso y depende de cómo se implemente el servidor web .
Si bien la función principal es entregar contenido, la implementación completa de HTTP también incluye formas de recibir contenido de los clientes. Esta función se utiliza para enviar formularios web , incluida la carga de archivos.
Muchos servidores web genéricos también admiten la creación de scripts del lado del servidor mediante Active Server Pages (ASP), PHP (preprocesador de hipertexto) u otros lenguajes de creación de scripts . Esto significa que el comportamiento del servidor web se puede crear en archivos separados, mientras que el software del servidor real permanece inalterado. Por lo general, esta función se utiliza para generar documentos HTML de forma dinámica ("sobre la marcha") en lugar de devolver documentos estáticos . El primero se utiliza principalmente para recuperar o modificar información de bases de datos . El segundo suele ser mucho más rápido y se almacena en caché con mayor facilidad, pero no puede ofrecer contenido dinámico .
Los servidores web también se encuentran frecuentemente integrados en dispositivos como impresoras , enrutadores , cámaras web y que sirven únicamente a una red local . El servidor web puede entonces usarse como parte de un sistema para monitorear o administrar el dispositivo en cuestión. Esto generalmente significa que no se debe instalar ningún software adicional en el equipo cliente, ya que solo se requiere un navegador web (que ahora está incluido en la mayoría de los sistemas operativos ).
Una cookie HTTP (también llamada cookie web , cookie de Internet , cookie del navegador o simplemente cookie ) es un pequeño fragmento de datos enviado desde un sitio web y almacenado en la computadora del usuario por el navegador web del usuario mientras el usuario navega. Las cookies fueron diseñadas para ser un mecanismo confiable para que los sitios web recuerden información con estado (como artículos agregados en el carrito de compras en una tienda en línea) o para registrar la actividad de navegación del usuario (incluido hacer clic en botones particulares, iniciar sesión o registrar qué páginas se visitaron en el pasado). También se pueden usar para recordar piezas arbitrarias de información que el usuario ingresó previamente en campos de formulario, como nombres, direcciones, contraseñas y números de tarjetas de crédito.
Las cookies cumplen funciones esenciales en la web moderna. Quizás lo más importante es que las cookies de autenticación son el método más común que utilizan los servidores web para saber si el usuario ha iniciado sesión o no, y con qué cuenta lo ha hecho. Sin un mecanismo de este tipo, el sitio no sabría si enviar una página que contenga información confidencial o exigir al usuario que se autentique iniciando sesión. La seguridad de una cookie de autenticación generalmente depende de la seguridad del sitio web que la emite y del navegador web del usuario, y de si los datos de la cookie están encriptados. Las vulnerabilidades de seguridad pueden permitir que un pirata informático lea los datos de una cookie , los utilice para obtener acceso a los datos del usuario o para obtener acceso (con las credenciales del usuario) al sitio web al que pertenece la cookie (consulte los ejemplos de secuencias de comandos entre sitios y falsificación de solicitudes entre sitios ). [51]
Las cookies de seguimiento, y especialmente las cookies de seguimiento de terceros, se utilizan comúnmente como formas de recopilar registros a largo plazo de los historiales de navegación de las personas, una posible preocupación por la privacidad que impulsó a los legisladores europeos [52] y estadounidenses a tomar medidas en 2011. [53] [54] La legislación europea exige que todos los sitios web dirigidos a los estados miembros de la Unión Europea obtengan el "consentimiento informado" de los usuarios antes de almacenar cookies no esenciales en sus dispositivos.
Jann Horn, investigador del Proyecto Zero de Google, describe las formas en que los intermediarios , como los proveedores de puntos de acceso Wi-Fi, pueden leer las cookies . En tales circunstancias, recomienda utilizar el navegador en modo de navegación privada (conocido ampliamente como modo incógnito en Google Chrome). [55]
Un motor de búsqueda web o motor de búsqueda de Internet es un sistema de software que está diseñado para realizar búsquedas web ( búsqueda en Internet ), lo que significa buscar en la World Wide Web de manera sistemática información particular especificada en una consulta de búsqueda web . Los resultados de la búsqueda generalmente se presentan en una línea de resultados, a menudo denominada páginas de resultados del motor de búsqueda (SERP). La información puede ser una mezcla de páginas web , imágenes, videos, infografías, artículos, trabajos de investigación y otros tipos de archivos. Algunos motores de búsqueda también extraen datos disponibles en bases de datos o directorios abiertos . A diferencia de los directorios web , que son mantenidos solo por editores humanos, los motores de búsqueda también mantienen información en tiempo real ejecutando un algoritmo en un rastreador web . El contenido de Internet que no es capaz de ser buscado por un motor de búsqueda web generalmente se describe como la web profunda .
La web profunda, [56] la web invisible , [57] o la web oculta [58] son partes de la World Wide Web cuyos contenidos no están indexados por los motores de búsqueda web estándar . El término opuesto a la web profunda es la web superficial , a la que puede acceder cualquier persona que utilice Internet. [59] Se atribuye al científico informático Michael K. Bergman la creación del término web profunda en 2001 como término de indexación de búsqueda. [60]
El contenido de la deep web está oculto detrás de formularios HTTP , [61] [62] e incluye muchos usos muy comunes como el correo web , la banca en línea y servicios por los que los usuarios deben pagar, y que están protegidos por un muro de pago , como el vídeo bajo demanda , algunas revistas y periódicos en línea, entre otros.
El contenido de la web profunda se puede localizar y acceder a él mediante una URL o dirección IP directa y puede requerir una contraseña u otro acceso de seguridad más allá de la página pública del sitio web.
Un caché web es un servidor ubicado en la red pública de Internet o en una empresa que almacena páginas web a las que se ha accedido recientemente para mejorar el tiempo de respuesta de los usuarios cuando se solicita el mismo contenido en un tiempo determinado después de la solicitud original. La mayoría de los navegadores web también implementan un caché de navegador escribiendo los datos obtenidos recientemente en un dispositivo de almacenamiento de datos local. Las solicitudes HTTP de un navegador pueden solicitar solo datos que hayan cambiado desde el último acceso. Las páginas web y los recursos pueden contener información de vencimiento para controlar el almacenamiento en caché para proteger los datos confidenciales, como en la banca en línea , o para facilitar la actualización frecuente de sitios, como los medios de comunicación. Incluso los sitios con contenido altamente dinámico pueden permitir que los recursos básicos se actualicen solo ocasionalmente. Los diseñadores de sitios web consideran que vale la pena recopilar recursos como datos CSS y JavaScript en unos pocos archivos para todo el sitio para que se puedan almacenar en caché de manera eficiente. Los firewalls empresariales a menudo almacenan en caché los recursos web solicitados por un usuario para el beneficio de muchos usuarios. Algunos motores de búsqueda almacenan en caché el contenido de los sitios web a los que se accede con frecuencia.
Para los delincuentes , la Web se ha convertido en un lugar para propagar malware y participar en una variedad de delitos cibernéticos , incluidos (pero no limitados a) robo de identidad , fraude , espionaje y recopilación de inteligencia . [63] Las vulnerabilidades basadas en la Web ahora superan en número a las preocupaciones de seguridad informática tradicionales, [64] [65] y, según lo medido por Google , aproximadamente una de cada diez páginas web puede contener código malicioso. [66] La mayoría de los ataques basados en la Web tienen lugar en sitios web legítimos y la mayoría, según lo medido por Sophos , están alojados en Estados Unidos, China y Rusia. [67] La más común de todas las amenazas de malware son los ataques de inyección SQL contra sitios web. [68] A través de HTML y URI, la Web era vulnerable a ataques como el cross-site scripting (XSS) que llegó con la introducción de JavaScript [69] y se exacerbó hasta cierto punto por el diseño web Web 2.0 y Ajax que favorece el uso de scripts. [70] Según una estimación de 2007, el 70% de todos los sitios web están expuestos a ataques XSS contra sus usuarios. [71] El phishing es otra amenaza común para la Web. En febrero de 2013, RSA (la división de seguridad de EMC) estimó que las pérdidas globales por phishing ascendieron a 1.500 millones de dólares en 2012. [72] Dos de los métodos de phishing más conocidos son Covert Redirect y Open Redirect.
Las soluciones propuestas varían. Las grandes empresas de seguridad como McAfee ya diseñan paquetes de gobernanza y cumplimiento normativo para cumplir con las regulaciones posteriores al 11 de septiembre [73] , y algunas, como Finjan , han recomendado la inspección activa en tiempo real del código de programación y de todo el contenido independientemente de su origen [63] . Algunos han argumentado que las empresas deben considerar la seguridad web como una oportunidad de negocio en lugar de un centro de costos [74] , mientras que otros piden una " gestión de derechos digitales omnipresente y siempre activa" aplicada en la infraestructura para reemplazar a los cientos de empresas que protegen los datos y las redes [75] . Jonathan Zittrain ha dicho que es mucho mejor que los usuarios compartan la responsabilidad de la seguridad informática que bloquear Internet [76] .
Cada vez que un cliente solicita una página web, el servidor puede identificar la dirección IP de la solicitud . Los servidores web suelen registrar las direcciones IP en un archivo de registro . Además, a menos que se configure lo contrario, la mayoría de los navegadores web registran las páginas web solicitadas en una función de historial visible y, por lo general, almacenan en caché gran parte del contenido localmente. A menos que la comunicación entre el servidor y el navegador utilice cifrado HTTPS, las solicitudes y respuestas web viajan en texto sin formato a través de Internet y pueden ser vistas, registradas y almacenadas en caché por sistemas intermedios. Otra forma de ocultar información de identificación personal es mediante el uso de una red privada virtual . Una VPN cifra el tráfico entre el cliente y el servidor VPN y enmascara la dirección IP original, lo que reduce la posibilidad de identificación del usuario.
Cuando una página web solicita y el usuario proporciona información de identificación personal (como su nombre real, dirección, dirección de correo electrónico, etc.), las entidades basadas en la web pueden asociar el tráfico web actual con esa persona. Si el sitio web utiliza cookies HTTP , autenticación de nombre de usuario y contraseña u otras técnicas de seguimiento, puede relacionar otras visitas web, anteriores y posteriores, con la información de identificación proporcionada. De esta manera, una organización basada en la web puede desarrollar y crear un perfil de las personas individuales que utilizan su sitio o sitios. Puede ser capaz de crear un registro para una persona que incluya información sobre sus actividades de ocio, sus intereses de compra, su profesión y otros aspectos de su perfil demográfico . Estos perfiles son de interés potencial para los vendedores, anunciantes y otros. Dependiendo de los términos y condiciones del sitio web y las leyes locales que se apliquen, la información de estos perfiles puede venderse, compartirse o pasarse a otras organizaciones sin que el usuario sea informado. Para muchas personas comunes, esto significa poco más que algunos correos electrónicos inesperados en su bandeja de entrada o alguna publicidad extrañamente relevante en una futura página web. Para otros, puede significar que el tiempo dedicado a satisfacer un interés inusual puede derivar en una avalancha de publicidad dirigida que puede resultar indeseable. Las agencias de seguridad pública, antiterrorismo y espionaje también pueden identificar, seleccionar y rastrear a individuos en función de sus intereses o inclinaciones en la Web.
Los sitios de redes sociales generalmente intentan que los usuarios usen sus nombres reales, intereses y ubicaciones, en lugar de seudónimos, ya que sus ejecutivos creen que esto hace que la experiencia de las redes sociales sea más atractiva para los usuarios. Por otro lado, las fotografías cargadas o las declaraciones sin reservas pueden identificar a una persona, que puede lamentar esta exposición. Los empleadores, las escuelas, los padres y otros familiares pueden verse influenciados por aspectos de los perfiles de redes sociales, como publicaciones de texto o fotos digitales, que la persona que publica no pretendía para estas audiencias. Los acosadores en línea pueden hacer uso de información personal para acosar o acechar a los usuarios. Los sitios web de redes sociales modernos permiten un control detallado de las configuraciones de privacidad para cada publicación, pero pueden ser complejas y no fáciles de encontrar o usar, especialmente para principiantes. [77] Las fotografías y los videos publicados en sitios web han causado problemas particulares, ya que pueden agregar la cara de una persona a un perfil en línea. Con la tecnología de reconocimiento facial moderna y potencial , puede ser posible relacionar esa cara con otras imágenes, eventos y escenarios previamente anónimos que se han fotografiado en otro lugar. Debido al almacenamiento en caché, la duplicación y la copia de imágenes, es difícil eliminar una imagen de la World Wide Web.
Los estándares web incluyen muchos estándares y especificaciones interdependientes, algunos de los cuales rigen aspectos de Internet , no solo de la World Wide Web. Incluso cuando no están enfocados en la web, dichos estándares afectan directa o indirectamente el desarrollo y la administración de sitios web y servicios web . Las consideraciones incluyen la interoperabilidad , la accesibilidad y la facilidad de uso de las páginas web y los sitios web.
Los estándares web, en el sentido más amplio, consisten en lo siguiente:
Los estándares web no son conjuntos fijos de reglas, sino conjuntos de especificaciones técnicas de tecnologías web en constante evolución. [84] Los estándares web son desarrollados por organizaciones de estándares —grupos de partes interesadas y a menudo competidoras encargadas de la tarea de estandarización—, no tecnologías desarrolladas y declaradas como estándares por una sola persona o empresa. Es crucial distinguir las especificaciones que están en desarrollo de las que ya alcanzaron el estado de desarrollo final (en el caso de las especificaciones del W3C , el nivel de madurez más alto).
Existen métodos para acceder a la Web en medios y formatos alternativos para facilitar su uso por parte de personas con discapacidades . Estas discapacidades pueden ser visuales, auditivas, físicas, relacionadas con el habla, cognitivas, neurológicas o alguna combinación de ellas. Las características de accesibilidad también ayudan a las personas con discapacidades temporales, como un brazo roto, o a los usuarios mayores a medida que sus capacidades cambian. [85] La Web recibe información, además de proporcionar información e interactuar con la sociedad. El Consorcio World Wide Web afirma que es esencial que la Web sea accesible, de modo que pueda proporcionar igualdad de acceso y de oportunidades a las personas con discapacidades. [86] Tim Berners-Lee señaló una vez: "El poder de la Web está en su universalidad. El acceso para todos, independientemente de la discapacidad, es un aspecto esencial". [85] Muchos países regulan la accesibilidad web como un requisito para los sitios web. [87] La cooperación internacional en la Iniciativa de Accesibilidad Web del W3C condujo a unas directrices sencillas que los autores de contenido web, así como los desarrolladores de software, pueden utilizar para hacer que la Web sea accesible a personas que pueden o no utilizar tecnología de asistencia . [85] [88]
La Actividad de Internacionalización del W3C asegura que la tecnología web funcione en todos los idiomas, escrituras y culturas. [89] A principios de 2004 o 2005, Unicode ganó terreno y finalmente, en diciembre de 2007, superó tanto a ASCII como a Europa occidental como el mapa de caracteres más utilizado en la Web . [90] Originalmente, el RFC 3986 permitía identificar recursos por URI en un subconjunto de US-ASCII. El RFC 3987 permite más caracteres (cualquier carácter en el Conjunto de Caracteres Universal ) y ahora un recurso puede identificarse por IRI en cualquier idioma. [91]
La World Wide Web es solo de Berners-Lee. Él la diseñó. Él la lanzó al mundo. Y él, más que nadie, ha luchado por mantenerla abierta, no propietaria y libre.[ página necesaria ]
JavaScript es parte de la tríada de tecnologías que todos los desarrolladores web deben aprender: HTML para especificar el contenido de las páginas web, CSS para especificar la presentación de las páginas web y JavaScript para especificar el comportamiento de las páginas web.
{{cite book}}
: CS1 maint: multiple names: authors list (link)