La World Wide Web ( WWW o simplemente la Web ) es un sistema de información que permite compartir contenidos a través de Internet a través de formas fáciles de usar destinadas a atraer a usuarios más allá de los especialistas en TI y los aficionados. [1] Permite acceder a documentos y otros recursos web a través de Internet de acuerdo con reglas específicas del Protocolo de transferencia de hipertexto (HTTP). [2]
La Web fue inventada por el informático inglés Tim Berners-Lee mientras estaba en el CERN en 1989 y se abrió al público en 1991. Fue concebida como un "sistema de información universal vinculado". [3] [4] Los documentos y otros contenidos multimedia se ponen a disposición de la red a través de servidores web y se puede acceder a ellos mediante programas como navegadores web . Los servidores y recursos de la World Wide Web se identifican y ubican mediante cadenas de caracteres denominadas localizadores uniformes de recursos (URL).
El tipo de documento original y aún muy común es una página web formateada en lenguaje de marcado de hipertexto (HTML). Este lenguaje de marcado admite texto sin formato , imágenes , contenidos de audio y vídeo incrustados y scripts (programas cortos) que implementan una interacción compleja del usuario. El lenguaje HTML también admite hipervínculos (URL incrustados) que brindan acceso inmediato a otros recursos web. La navegación web , o navegación web, es la práctica común de seguir dichos hipervínculos en varios sitios web. Las aplicaciones web son páginas web que funcionan como software de aplicación . La información de la Web se transfiere a través de Internet mediante HTTP. Múltiples recursos web con un tema común y normalmente un nombre de dominio común conforman un sitio web . Un único servidor web puede proporcionar varios sitios web, mientras que algunos sitios web, especialmente los más populares, pueden ser proporcionados por varios servidores. El contenido del sitio web es proporcionado por una gran variedad de empresas, organizaciones, agencias gubernamentales y usuarios individuales ; y comprende una enorme cantidad de información educativa, de entretenimiento, comercial y gubernamental.
La Web se ha convertido en la plataforma de sistemas de información dominante en el mundo . [5] [6] [7] [8] Es la herramienta principal que miles de millones de personas en todo el mundo utilizan para interactuar con Internet. [2]
La Web fue inventada por el informático inglés Tim Berners-Lee mientras trabajaba en el CERN . [9] [10] Lo motivaba el problema de almacenar, actualizar y encontrar documentos y archivos de datos en esa organización grande y en constante cambio, así como distribuirlos a colaboradores fuera del CERN. En su diseño, Berners-Lee descartó el enfoque de estructura de árbol común , utilizado por ejemplo en el sistema de documentación CERNDOC existente y en el sistema de archivos Unix , así como enfoques que dependían de etiquetar archivos con palabras clave , como en el sistema VAX/NOTES. En lugar de ello, adoptó conceptos que había puesto en práctica con su sistema privado INQUIRE (1980) construido en el CERN. Cuando se dio cuenta del modelo de hipertexto de Ted Nelson (1965), en el que los documentos pueden vincularse sin restricciones a través de hipervínculos asociados con "puntos calientes" incrustados en el texto, ayudó a confirmar la validez de su concepto. [11] [12]
El modelo fue posteriormente popularizado por el sistema HyperCard de Apple . A diferencia de Hypercard, el nuevo sistema de Berners-Lee desde el principio estaba destinado a soportar enlaces entre múltiples bases de datos en computadoras independientes y permitir el acceso simultáneo de muchos usuarios desde cualquier computadora en Internet. También especificó que el sistema debería eventualmente manejar otros medios además del texto, como gráficos, voz y video. Los enlaces podrían hacer referencia a archivos de datos mutables o incluso iniciar programas en su computadora servidor. También concibió "pasarelas" que permitirían el acceso a través del nuevo sistema a documentos organizados de otras formas (como los sistemas de archivos informáticos tradicionales o Usenet ). Finalmente, insistió en que el sistema debe ser descentralizado, sin ningún control central ni coordinación sobre la creación de enlaces. [3] [13] [9] [10]
Berners-Lee presentó una propuesta al CERN en mayo de 1989, sin dar nombre al sistema. [3] Implementó un sistema funcional a finales de 1990, incluido un navegador llamado WorldWideWeb (que se convirtió en el nombre del proyecto y de la red) y un servidor HTTP que se ejecuta en el CERN. Como parte de ese desarrollo, definió la primera versión del protocolo HTTP, la sintaxis básica de URL e implícitamente hizo de HTML el formato de documento principal. [14] La tecnología fue lanzada fuera del CERN a otras instituciones de investigación a partir de enero de 1991, y luego a todo Internet el 23 de agosto de 1991. La Web fue un éxito en el CERN y comenzó a extenderse a otras instituciones científicas y académicas. En los dos años siguientes, se crearon 50 sitios web . [15] [16]
El CERN puso a disposición el protocolo y el código web libres de regalías en 1993, lo que permitió su uso generalizado. [17] [18] Después de que la NCSA lanzara el navegador web Mosaic ese mismo año, la popularidad de la Web creció rápidamente a medida que surgieron miles de sitios web en menos de un año. [19] [20] Mosaic era un navegador gráfico que podía mostrar imágenes en línea y enviar formularios procesados por el servidor HTTPd . [21] [22] Marc Andreessen y Jim Clark fundaron Netscape al año siguiente y lanzaron el navegador Navigator , que introdujo Java y JavaScript en la Web. Rápidamente se convirtió en el navegador dominante. Netscape se convirtió en una empresa pública en 1995, lo que provocó un frenesí en la Web y comenzó la burbuja de las puntocom . [23] Microsoft respondió desarrollando su propio navegador, Internet Explorer , iniciando la guerra de los navegadores . Al combinarlo con Windows, se convirtió en el navegador dominante durante 14 años. [24]
Berners-Lee fundó el World Wide Web Consortium (W3C), que creó XML en 1996 y recomendó reemplazar HTML con XHTML más estricto . [25] Mientras tanto, los desarrolladores comenzaron a explotar una característica de IE llamada XMLHttpRequest para crear aplicaciones Ajax y lanzaron la revolución Web 2.0 . Mozilla , Opera y Apple rechazaron XHTML y crearon WHATWG que desarrolló HTML5 . [26] En 2009, el W3C admitió y abandonó XHTML. [27] En 2019, cedió el control de la especificación HTML al WHATWG. [28]
La World Wide Web ha sido fundamental para el desarrollo de la era de la información y es la principal herramienta que utilizan miles de millones de personas para interactuar en Internet . [29] [30] [31] [8]
Tim Berners-Lee afirma que World Wide Web se escribe oficialmente como tres palabras separadas, cada una en mayúscula, sin guiones intermedios. [32] Sin embargo, a menudo se le llama simplemente Web , y también a menudo la Web ; consulte Capitalización de Internet para obtener más detalles. En chino mandarín, la World Wide Web se traduce comúnmente mediante una coincidencia fono-semántica con wàn wéi wǎng (万维网), que satisface www y literalmente significa "red de 10.000 dimensiones", una traducción que refleja el concepto de diseño y la proliferación de la World Wide Web. Web.
El uso del prefijo www ha ido disminuyendo, especialmente cuando las aplicaciones web buscaban marcar sus nombres de dominio y hacerlos fácilmente pronunciables. A medida que la Web móvil creció en popularidad, [ cita necesaria ] servicios como Gmail .com, Outlook.com , Myspace .com, Facebook .com y Twitter .com se mencionan con mayor frecuencia sin agregar "www". (o, de hecho, ".com") al dominio. [33]
En inglés, www suele leerse como double-u double-u double-u . [34] Algunos usuarios lo pronuncian dub-dub-dub , particularmente en Nueva Zelanda. [35] Stephen Fry , en su serie de podcasts "Podgrams", lo pronuncia wuh wuh wuh . [36] El escritor inglés Douglas Adams bromeó una vez en The Independent on Sunday (1999): "La World Wide Web es lo único que conozco cuya forma abreviada tarda tres veces más en decirse que su abreviatura". [37]
Los términos Internet y World Wide Web se utilizan a menudo sin mucha distinción. Sin embargo, los dos términos no significan lo mismo. Internet es un sistema global de redes informáticas interconectadas a través de telecomunicaciones y redes ópticas . Por el contrario, la World Wide Web es una colección global de documentos y otros recursos , vinculados por hipervínculos y URI . Se accede a los recursos web mediante HTTP o HTTPS , que son protocolos de Internet a nivel de aplicación que utilizan los protocolos de transporte de Internet. [2]
La visualización de una página web en la World Wide Web normalmente comienza escribiendo la URL de la página en un navegador web o siguiendo un hipervínculo a esa página o recurso. Luego, el navegador web inicia una serie de mensajes de comunicación en segundo plano para buscar y mostrar la página solicitada. En la década de 1990, el uso de un navegador para ver páginas web (y pasar de una página web a otra a través de hipervínculos) pasó a conocerse como "navegar", "navegar por la web" (después de navegar por canales ) o "navegar por la Web". Los primeros estudios de este nuevo comportamiento investigaron los patrones de los usuarios en el uso de navegadores web. Un estudio, por ejemplo, encontró cinco patrones de usuario: navegación exploratoria, navegación por ventanas, navegación evolucionada, navegación limitada y navegación dirigida. [38]
El siguiente ejemplo demuestra el funcionamiento de un navegador web al acceder a una página en la URLhttp://ejemplo.org/home.html. El navegador resuelve el nombre del servidor de la URL (ejemplo.org) en una dirección de Protocolo de Internet utilizando el Sistema de nombres de dominio (DNS) distribuido globalmente. Esta búsqueda devuelve una dirección IP como 203.0.113.4 o 2001:db8:2e::7334 . Luego, el navegador solicita el recurso enviando una solicitud HTTP a través de Internet a la computadora en esa dirección. Solicita servicio desde un número de puerto TCP específico que es bien conocido para el servicio HTTP, de modo que el host receptor pueda distinguir una solicitud HTTP de otros protocolos de red que pueda estar atendiendo. HTTP normalmente usa el puerto número 80 y para HTTPS normalmente usa el puerto número 443 . El contenido de la solicitud HTTP puede ser tan simple como dos líneas de texto:
OBTENER /home.html HTTP / 1.1 Host : ejemplo.org
La computadora que recibe la solicitud HTTP la entrega al software del servidor web que escucha las solicitudes en el puerto 80. Si el servidor web puede cumplir con la solicitud, envía una respuesta HTTP al navegador indicando el éxito:
HTTP / 1.1 200 OK Tipo de contenido : texto/html; juego de caracteres = UTF-8
seguido del contenido de la página solicitada. El lenguaje de marcado de hipertexto ( HTML ) para una página web básica podría verse así:
< html > < head > < title > Ejemplo.org – La World Wide Web </ title > </ head > < body > < p > La World Wide Web, abreviada como WWW y comúnmente conocida... </ p > < / cuerpo > </ html >
El navegador web analiza el HTML e interpreta el marcado ( , para párrafo, etc.) que rodea las palabras para formatear el texto en la pantalla. Muchas páginas web utilizan HTML para hacer referencia a las URL de otros recursos, como imágenes, otros medios integrados, scripts que afectan el comportamiento de la página y hojas de estilo en cascada que afectan el diseño de la página. El navegador realiza solicitudes HTTP adicionales al servidor web para estos otros tipos de medios de Internet . A medida que recibe su contenido del servidor web, el navegador muestra progresivamente la página en la pantalla según lo especificado por su HTML y estos recursos adicionales.<title>
<p>
El lenguaje de marcado de hipertexto (HTML) es el lenguaje de marcado estándar para crear páginas web y aplicaciones web . Con Cascading Style Sheets (CSS) y JavaScript , forma una tríada de tecnologías fundamentales para la World Wide Web. [39]
Los navegadores web reciben documentos HTML desde un servidor web o desde un almacenamiento local y representan los documentos en páginas web multimedia. HTML describe semánticamente la estructura de una página web y originalmente incluía pistas para la apariencia del documento.
Los elementos HTML son los componentes básicos de las páginas HTML. Con las construcciones HTML, se pueden incrustar imágenes y otros objetos, como formularios interactivos, en la página renderizada. HTML proporciona un medio para crear documentos estructurados al denotar la semántica estructural de texto como títulos, párrafos, listas, enlaces , citas y otros elementos. Los elementos HTML están delimitados por etiquetas , escritas entre corchetes angulares . Etiquetas como e introducen contenido directamente en la página. Otras etiquetas, como las que rodean y proporcionan información sobre el texto del documento, pueden incluir otras etiquetas como subelementos. Los navegadores no muestran las etiquetas HTML, pero las utilizan para interpretar el contenido de la página.<img />
<input />
<p>
HTML puede incorporar programas escritos en un lenguaje de secuencias de comandos como JavaScript , lo que afecta el comportamiento y el contenido de las páginas web. La inclusión de CSS define la apariencia y el diseño del contenido. El Consorcio World Wide Web (W3C), mantenedor de los estándares HTML y CSS, ha fomentado el uso de CSS sobre HTML de presentación explícito desde 1997. [40][update]
La mayoría de las páginas web contienen hipervínculos a otras páginas relacionadas y quizás a archivos descargables, documentos fuente, definiciones y otros recursos web. En el HTML subyacente, un hipervínculo tiene este aspecto:<a href="http://example.org/home.html">Example.org Homepage</a>.
Esta colección de recursos útiles y relacionados, interconectados a través de enlaces de hipertexto, se denomina red de información. La publicación en Internet creó lo que Tim Berners-Lee llamó por primera vez WorldWideWeb (en su CamelCase original , que posteriormente fue descartado) en noviembre de 1990. [41]
La estructura de hipervínculos de la web se describe mediante el webgraph : los nodos del webgraph corresponden a las páginas web (o URL) y los bordes dirigidos entre ellos a los hipervínculos. Con el tiempo, muchos recursos web a los que apuntan hipervínculos desaparecen, se reubican o son reemplazados por contenido diferente. Esto hace que los hipervínculos queden obsoletos, un fenómeno al que en algunos círculos se hace referencia como enlace podrido, y los hipervínculos afectados por él a menudo se denominan enlaces "muertos" . La naturaleza efímera de la Web ha impulsado muchos esfuerzos para archivar sitios web. El Internet Archive , activo desde 1996, es el más conocido de estos esfuerzos.
Muchos nombres de host utilizados para la World Wide Web comienzan con www debido a la antigua práctica de nombrar los hosts de Internet según los servicios que brindan. El nombre de host de un servidor web suele ser www , del mismo modo que puede ser ftp para un servidor FTP y news o nntp para un servidor de noticias Usenet . Estos nombres de host aparecen como Sistema de nombres de dominio (DNS) o nombres de subdominio , como en www.example.com . El uso de www no es requerido por ningún estándar técnico o político y muchos sitios web no lo utilizan; El primer servidor web fue nxoc01.cern.ch . [42] Según Paolo Palazzi, que trabajó en el CERN junto con Tim Berners-Lee, el uso popular de www como subdominio fue accidental; la página del proyecto en la World Wide Web estaba destinada a publicarse en www.cern.ch, mientras que info.cern.ch debía ser la página de inicio del CERN; sin embargo, los registros DNS nunca se cambiaron y posteriormente se copió la práctica de anteponer www al nombre de dominio del sitio web de una institución. [43] [ se necesita una mejor fuente ] Muchos sitios web establecidos todavía usan el prefijo o emplean otros nombres de subdominio como www2 , seguro o en para fines especiales. Muchos de estos servidores web están configurados de manera que tanto el nombre de dominio principal (p. ej., ejemplo.com) como el subdominio www (p. ej., www.example.com) se refieran al mismo sitio; otros requieren un formulario u otro, o pueden asignarse a diferentes sitios web. El uso de un nombre de subdominio es útil para equilibrar la carga del tráfico web entrante mediante la creación de un registro CNAME que apunta a un grupo de servidores web. Desde, actualmente [ a partir de? ] , solo se puede usar un subdominio en un CNAME, no se puede lograr el mismo resultado usando la raíz del dominio simple. [44] [ dudoso – discutir ]
Cuando un usuario envía un nombre de dominio incompleto a un navegador web en el campo de entrada de su barra de direcciones, algunos navegadores web intentan agregar automáticamente el prefijo "www" al principio y posiblemente ".com", ".org" y ".net". " al final, dependiendo de lo que pueda faltar. Por ejemplo, al ingresar "microsoft" se puede transformar en http://www.microsoft.com/ y "openoffice" en http://www.openoffice.org . Esta característica comenzó a aparecer en las primeras versiones de Firefox , cuando todavía tenía el título provisional 'Firebird' a principios de 2003, a partir de una práctica anterior en navegadores como Lynx . [45] [ ¿ fuente poco confiable? ] Se informa que a Microsoft se le concedió una patente estadounidense por la misma idea en 2008, pero sólo para dispositivos móviles. [46]
Los especificadores de esquema http://
y https://
al inicio de un URI web se refieren al Protocolo de transferencia de hipertexto o HTTP seguro , respectivamente. Especifican el protocolo de comunicación que se utilizará para la solicitud y la respuesta. El protocolo HTTP es fundamental para el funcionamiento de la World Wide Web, y la capa de cifrado agregada en HTTPS es esencial cuando los navegadores envían o recuperan datos confidenciales, como contraseñas o información bancaria. Los navegadores web generalmente anteponen automáticamente http:// a los URI ingresados por el usuario, si se omiten.
Una página web (también escrita como página web ) es un documento adecuado para la World Wide Web y los navegadores web . Un navegador web muestra una página web en un monitor o dispositivo móvil .
El término página web suele referirse a lo que es visible, pero también puede referirse al contenido del propio archivo informático , que suele ser un archivo de texto que contiene hipertexto escrito en HTML o un lenguaje de marcado comparable . Las páginas web típicas proporcionan hipertexto para navegar a otras páginas web a través de hipervínculos , a menudo denominados enlaces . Los navegadores web frecuentemente tendrán que acceder a múltiples elementos de recursos web , como leer hojas de estilo , scripts e imágenes, mientras presentan cada página web.
En una red, un navegador web puede recuperar una página web desde un servidor web remoto . El servidor web puede restringir el acceso a una red privada como una intranet corporativa. El navegador web utiliza el Protocolo de transferencia de hipertexto (HTTP) para realizar dichas solicitudes al servidor web .
Una página web estática se entrega exactamente como está almacenada, como contenido web en el sistema de archivos del servidor web . Por el contrario, una página web dinámica es generada por una aplicación web , generalmente impulsada por software del lado del servidor . Las páginas web dinámicas se utilizan cuando cada usuario puede requerir información completamente diferente, por ejemplo, sitios web de bancos, correo electrónico web, etc.
Una página web estática (a veces llamada página plana/página estacionaria ) es una página web que se entrega al usuario exactamente como está almacenada, en contraste con las páginas web dinámicas que son generadas por una aplicación web .
En consecuencia, una página web estática muestra la misma información para todos los usuarios, desde todos los contextos, sujeta a las capacidades modernas de un servidor web para negociar el tipo de contenido o el idioma del documento donde dichas versiones están disponibles y el servidor está configurado para hacerlo.
Una página web dinámica del lado del servidor es una página web cuya construcción está controlada por un servidor de aplicaciones que procesa scripts del lado del servidor. En las secuencias de comandos del lado del servidor, los parámetros determinan cómo procede el ensamblaje de cada nueva página web, incluida la configuración de más procesamiento del lado del cliente.
Una página web dinámica del lado del cliente procesa la página web utilizando JavaScript que se ejecuta en el navegador. Los programas JavaScript pueden interactuar con el documento a través del Modelo de objetos de documento , o DOM, para consultar el estado de la página y modificarlo. Las mismas técnicas del lado del cliente pueden actualizar o cambiar dinámicamente el DOM de la misma manera.
Luego, el usuario o un programa informático recargan una página web dinámica para cambiar algún contenido variable. La información de actualización podría provenir del servidor o de cambios realizados en el DOM de esa página. Esto puede o no truncar el historial de navegación o crear una versión guardada para volver, pero una actualización dinámica de la página web que utiliza tecnologías Ajax no creará una página para volver ni truncará el historial de navegación web hacia adelante de la página mostrada. Al utilizar las tecnologías Ajax, el usuario final obtiene una página dinámica administrada como una sola página en el navegador web, mientras que el contenido web real representado en esa página puede variar. El motor Ajax se encuentra únicamente en el navegador y solicita partes de su DOM, el DOM, para su cliente, desde un servidor de aplicaciones.
HTML dinámico, o DHTML, es el término general para las tecnologías y métodos utilizados para crear páginas web que no son páginas web estáticas , aunque ha dejado de usarse desde la popularización de AJAX , un término que ahora rara vez se utiliza. [ cita necesaria ] Las secuencias de comandos del lado del cliente, las secuencias de comandos del lado del servidor o una combinación de ellas crean una experiencia web dinámica en un navegador.
JavaScript es un lenguaje de scripting que fue desarrollado inicialmente en 1995 por Brendan Eich , entonces de Netscape , para su uso dentro de páginas web. [47] La versión estandarizada es ECMAScript . [47] Para hacer que las páginas web sean más interactivas, algunas aplicaciones web también utilizan técnicas de JavaScript como Ajax ( JavaScript y XML asincrónicos ). La secuencia de comandos del lado del cliente se entrega con la página y puede realizar solicitudes HTTP adicionales al servidor, ya sea en respuesta a acciones del usuario, como movimientos o clics del mouse, o en función del tiempo transcurrido. Las respuestas del servidor se utilizan para modificar la página actual en lugar de crear una nueva página con cada respuesta, por lo que el servidor sólo necesita proporcionar información incremental limitada. Se pueden manejar múltiples solicitudes Ajax al mismo tiempo y los usuarios pueden interactuar con la página mientras se recuperan los datos. Las páginas web también pueden sondear periódicamente el servidor para comprobar si hay nueva información disponible. [48]
Un sitio web [49] es una colección de recursos web relacionados que incluyen páginas web y contenido multimedia , normalmente identificados con un nombre de dominio común y publicados en al menos un servidor web . Ejemplos notables son wikipedia.org , google.com y amazon.com .
Se puede acceder a un sitio web a través de una red pública de Protocolo de Internet (IP), como Internet , o una red de área local (LAN) privada, haciendo referencia a un localizador uniforme de recursos (URL) que identifica el sitio.
Los sitios web pueden tener muchas funciones y utilizarse de diversas formas; un sitio web puede ser un sitio web personal , un sitio web corporativo para una empresa, un sitio web gubernamental, un sitio web de una organización, etc. Los sitios web suelen estar dedicados a un tema o propósito particular, que va desde entretenimiento y redes sociales hasta brindar noticias y educación. Todos los sitios web de acceso público constituyen colectivamente la World Wide Web, mientras que los sitios web privados, como el sitio web de una empresa para sus empleados, suelen formar parte de una intranet .
Las páginas web, que son los componentes básicos de los sitios web, son documentos , normalmente compuestos en texto sin formato intercalados con instrucciones de formato del lenguaje de marcado de hipertexto ( HTML , XHTML ). Pueden incorporar elementos de otros sitios web con anclajes de marcado adecuados . Se accede a las páginas web y se transportan con el Protocolo de transferencia de hipertexto (HTTP), que opcionalmente puede emplear cifrado ( HTTP Secure , HTTPS) para brindar seguridad y privacidad al usuario. La aplicación del usuario, a menudo un navegador web , muestra el contenido de la página según sus instrucciones de marcado HTML en un terminal de visualización .
Los hipervínculos entre páginas web transmiten al lector la estructura del sitio y guían la navegación del sitio, que a menudo comienza con una página de inicio que contiene un directorio del contenido web del sitio . Algunos sitios web requieren el registro o suscripción del usuario para acceder al contenido. Ejemplos de sitios web de suscripción incluyen muchos sitios comerciales, sitios web de noticias, sitios web de revistas académicas , sitios web de juegos, sitios web para compartir archivos, foros de mensajes , correo electrónico basado en web , sitios web de redes sociales , sitios web que ofrecen cotizaciones de precios en tiempo real para diferentes tipos de mercados, como así como sitios que ofrecen otros servicios varios. Los usuarios finales pueden acceder a sitios web en una variedad de dispositivos, incluidas computadoras de escritorio y portátiles , tabletas , teléfonos inteligentes y televisores inteligentes .
Un navegador web (comúnmente denominado navegador ) es un agente de usuario de software para acceder a información en la World Wide Web. Para conectarse al servidor de un sitio web y mostrar sus páginas, el usuario necesita tener un programa de navegador web. Este es el programa que ejecuta el usuario para descargar, formatear y mostrar una página web en la computadora del usuario.
Además de permitir a los usuarios buscar, mostrar y moverse entre páginas web, un navegador web generalmente tendrá funciones como mantener marcadores, registrar historial, administrar cookies (ver más abajo) y páginas de inicio, y puede tener funciones para registrar contraseñas para iniciar sesión. sitios web.
Los navegadores más populares son Chrome , Firefox , Safari , Internet Explorer y Edge .
Un servidor web es un software de servidor , o hardware dedicado a ejecutar dicho software, que puede satisfacer las solicitudes de los clientes de la World Wide Web. Un servidor web puede, en general, contener uno o más sitios web. Un servidor web procesa solicitudes de red entrantes a través de HTTP y varios otros protocolos relacionados.
La función principal de un servidor web es almacenar, procesar y entregar páginas web a los clientes . [50] La comunicación entre el cliente y el servidor se realiza mediante el Protocolo de transferencia de hipertexto (HTTP) . Las páginas entregadas suelen ser documentos HTML , que pueden incluir imágenes , hojas de estilo y scripts además del contenido de texto.
Un agente de usuario , comúnmente un navegador web o un rastreador web , inicia la comunicación realizando una solicitud de un recurso específico mediante HTTP y el servidor responde con el contenido de ese recurso o un mensaje de error si no puede hacerlo. El recurso suele ser un archivo real en el almacenamiento secundario del servidor , pero este no es necesariamente el caso y depende de cómo esté implementado el servidor web .
Si bien la función principal es ofrecer contenido, la implementación completa de HTTP también incluye formas de recibir contenido de los clientes. Esta función se utiliza para enviar formularios web , incluida la carga de archivos.
Muchos servidores web genéricos también admiten secuencias de comandos del lado del servidor utilizando Active Server Pages (ASP), PHP (preprocesador de hipertexto) u otros lenguajes de secuencias de comandos . Esto significa que el comportamiento del servidor web se puede programar en archivos separados, mientras que el software del servidor real permanece sin cambios. Por lo general, esta función se utiliza para generar documentos HTML de forma dinámica ("sobre la marcha") en lugar de devolver documentos estáticos . El primero se utiliza principalmente para recuperar o modificar información de bases de datos . Este último suele ser mucho más rápido y más fácil de almacenar en caché , pero no puede ofrecer contenido dinámico .
Los servidores web también se pueden encontrar frecuentemente integrados en dispositivos como impresoras , enrutadores , cámaras web y sirviendo sólo a una red local . El servidor web puede entonces usarse como parte de un sistema para monitorear o administrar el dispositivo en cuestión. Por lo general, esto significa que no es necesario instalar ningún software adicional en la computadora cliente, ya que solo se requiere un navegador web (que ahora se incluye con la mayoría de los sistemas operativos ).
Una cookie HTTP (también llamada cookie web , cookie de Internet , cookie de navegador o simplemente cookie ) es una pequeña porción de datos enviada desde un sitio web y almacenada en la computadora del usuario por el navegador web del usuario mientras éste navega. Las cookies se diseñaron para ser un mecanismo confiable para que los sitios web recuerden información detallada (como los artículos agregados al carrito de compras en una tienda en línea) o para registrar la actividad de navegación del usuario (incluido hacer clic en botones específicos, iniciar sesión o registrar qué páginas fueron visitadas). en el pasado). También se pueden utilizar para recordar información arbitraria que el usuario ingresó previamente en los campos del formulario, como nombres, direcciones, contraseñas y números de tarjetas de crédito.
Las cookies realizan funciones esenciales en la web moderna. Quizás lo más importante es que las cookies de autenticación son el método más común utilizado por los servidores web para saber si el usuario ha iniciado sesión o no, y con qué cuenta ha iniciado sesión. Sin tal mecanismo, el sitio no sabría si enviar una página que contenga información confidencial o requerir que el usuario se autentique iniciando sesión. La seguridad de una cookie de autenticación generalmente depende de la seguridad del sitio web emisor y del navegador web del usuario . y sobre si los datos de las cookies están cifrados. Las vulnerabilidades de seguridad pueden permitir que un pirata informático lea los datos de una cookie , los utilice para obtener acceso a los datos del usuario o para obtener acceso (con las credenciales del usuario) al sitio web al que pertenece la cookie (consulte secuencias de comandos entre sitios y cross -site) . falsificación de solicitudes de sitios para ver ejemplos). [51]
Las cookies de seguimiento, y especialmente las cookies de seguimiento de terceros, se utilizan comúnmente como formas de compilar registros a largo plazo de los historiales de navegación de las personas, una posible preocupación sobre la privacidad que llevó a los legisladores europeos [52] y estadounidenses a tomar medidas en 2011. [53] [54] La ley europea exige que todos los sitios web dirigidos a los estados miembros de la Unión Europea obtengan el "consentimiento informado" de los usuarios antes de almacenar cookies no esenciales en sus dispositivos.
El investigador de Google Project Zero, Jann Horn, describe las formas en que los intermediarios pueden leer las cookies , como los proveedores de puntos de acceso Wi-Fi . Ante tales circunstancias, recomienda utilizar el navegador en modo de navegación privada (ampliamente conocido como modo Incógnito en Google Chrome). [55]
Un motor de búsqueda web o motor de búsqueda de Internet es un sistema de software que está diseñado para realizar búsquedas web ( búsqueda en Internet ), lo que significa buscar en la World Wide Web de manera sistemática información particular especificada en una consulta de búsqueda web . Los resultados de la búsqueda generalmente se presentan en una línea de resultados, a menudo denominadas páginas de resultados del motor de búsqueda (SERP). La información puede ser una combinación de páginas web , imágenes, videos, infografías, artículos, trabajos de investigación y otros tipos de archivos. Algunos motores de búsqueda también extraen datos disponibles en bases de datos o directorios abiertos . A diferencia de los directorios web , que son mantenidos únicamente por editores humanos, los motores de búsqueda también mantienen información en tiempo real ejecutando un algoritmo en un rastreador web . El contenido de Internet que no puede ser buscado por un motor de búsqueda web generalmente se describe como la web profunda .
La web profunda, [56] web invisible , [57] o web oculta [58] son partes de la World Wide Web cuyos contenidos no están indexados por los motores de búsqueda web estándar . El término opuesto a la web profunda es web superficial , a la que puede acceder cualquier persona que utilice Internet. [59] Al científico informático Michael K. Bergman se le atribuye haber acuñado el término web profunda en 2001 como término de indexación de búsqueda. [60]
El contenido de la web profunda está oculto detrás de formularios HTTP , [61] [62] e incluye muchos usos muy comunes como correo web , banca en línea y servicios por los que los usuarios deben pagar y que está protegido por un muro de pago , como vídeo bajo demanda , algunas revistas y periódicos online, entre otros.
Se puede localizar y acceder al contenido de la web profunda mediante una URL directa o una dirección IP y puede requerir una contraseña u otro acceso de seguridad más allá de la página del sitio web público.
Una caché web es una computadora servidor ubicada en la Internet pública o dentro de una empresa que almacena páginas web a las que se accedió recientemente para mejorar el tiempo de respuesta de los usuarios cuando se solicita el mismo contenido dentro de un tiempo determinado después de la solicitud original. La mayoría de los navegadores web también implementan un caché del navegador escribiendo datos obtenidos recientemente en un dispositivo de almacenamiento de datos local. Las solicitudes HTTP realizadas por un navegador pueden solicitar solo datos que hayan cambiado desde el último acceso. Las páginas web y los recursos pueden contener información de vencimiento para controlar el almacenamiento en caché y proteger datos confidenciales, como en la banca en línea , o para facilitar sitios que se actualizan con frecuencia, como los medios de noticias. Incluso los sitios con contenido muy dinámico pueden permitir que los recursos básicos se actualicen sólo ocasionalmente. Los diseñadores de sitios web consideran que vale la pena recopilar recursos como datos CSS y JavaScript en unos pocos archivos de todo el sitio para que puedan almacenarse en caché de manera eficiente. Los firewalls empresariales a menudo almacenan en caché los recursos web solicitados por un usuario para beneficio de muchos usuarios. Algunos motores de búsqueda almacenan contenido en caché de sitios web a los que se accede con frecuencia.
Para los delincuentes , la Web se ha convertido en un lugar para difundir malware y participar en una variedad de delitos cibernéticos , incluidos (entre otros) el robo de identidad , el fraude , el espionaje y la recopilación de inteligencia . [63] Las vulnerabilidades basadas en la web ahora superan en número a las preocupaciones de seguridad informática tradicionales, [64] [65] y, según las mediciones de Google , aproximadamente una de cada diez páginas web puede contener código malicioso. [66] La mayoría de los ataques basados en la web tienen lugar en sitios web legítimos y la mayoría, según lo medido por Sophos , están alojados en los Estados Unidos, China y Rusia. [67] La más común de todas las amenazas de malware son los ataques de inyección SQL contra sitios web. [68] A través de HTML y URI, la Web era vulnerable a ataques como cross-site scripting (XSS) que vinieron con la introducción de JavaScript [69] y fueron exacerbados hasta cierto punto por la Web 2.0 y el diseño web Ajax que favorece el uso de guiones. [70] Hoy [ ¿a partir de? ] Según una estimación, el 70% de todos los sitios web están abiertos a ataques XSS contra sus usuarios. [71] El phishing es otra amenaza común a la Web. En febrero de 2013, RSA (la división de seguridad de EMC) estimó las pérdidas globales por phishing en 1.500 millones de dólares en 2012. [72] Dos de los métodos de phishing más conocidos son Covert Redirect y Open Redirect.
Las soluciones propuestas varían. Grandes empresas de seguridad como McAfee ya diseñan suites de gobernanza y cumplimiento para cumplir con las regulaciones posteriores al 11 de septiembre, [73] y algunas, como Finjan , han recomendado una inspección activa en tiempo real del código de programación y de todo el contenido, independientemente de su fuente. [63] Algunos han argumentado que las empresas deben ver la seguridad web como una oportunidad de negocio en lugar de un centro de costos , [74] mientras que otros piden una " gestión de derechos digitales ubicua y siempre activa " aplicada en la infraestructura para reemplazar a los cientos de empresas. que protegen los datos y las redes. [75] Jonathan Zittrain ha dicho que los usuarios que comparten la responsabilidad de la seguridad informática son mucho más preferibles que bloquear Internet. [76]
Cada vez que un cliente solicita una página web, el servidor puede identificar la dirección IP de la solicitud . Los servidores web normalmente registran las direcciones IP en un archivo de registro . Además, a menos que se establezca lo contrario, la mayoría de los navegadores web registran las páginas web solicitadas en una función de historial visible y, por lo general, almacenan en caché gran parte del contenido localmente. A menos que la comunicación entre el servidor y el navegador utilice cifrado HTTPS, las solicitudes y respuestas web viajan en texto plano a través de Internet y pueden verse, registrarse y almacenarse en caché mediante sistemas intermedios. Otra forma de ocultar información de identificación personal es mediante el uso de una red privada virtual . Una VPN cifra el tráfico en línea y enmascara la dirección IP original, lo que reduce las posibilidades de identificación del usuario.
Cuando una página web solicita y el usuario proporciona información de identificación personal, como su nombre real, dirección, dirección de correo electrónico, etc., las entidades basadas en la web pueden asociar el tráfico web actual con esa persona. Si el sitio web utiliza cookies HTTP , autenticación de nombre de usuario y contraseña u otras técnicas de seguimiento, puede relacionar otras visitas web, antes y después, con la información identificable proporcionada. De esta manera, una organización basada en la web puede desarrollar y construir un perfil de las personas individuales que utilizan su sitio o sitios. Es posible que pueda crear un registro para un individuo que incluya información sobre sus actividades de ocio, sus intereses de compras, su profesión y otros aspectos de su perfil demográfico . Estos perfiles son de interés potencial para especialistas en marketing, anunciantes y otros. Dependiendo de los términos y condiciones del sitio web y de las leyes locales que aplican, la información de estos perfiles puede venderse, compartirse o pasarse a otras organizaciones sin que el usuario sea informado. Para mucha gente corriente, esto significa poco más que algunos correos electrónicos inesperados en su bandeja de entrada o alguna publicidad sorprendentemente relevante en una futura página web. Para otros, puede significar que el tiempo dedicado a complacer un interés inusual puede resultar en una avalancha de marketing dirigido adicional que puede no ser bienvenido. Las agencias policiales, antiterroristas y de espionaje también pueden identificar, seleccionar y rastrear a personas en función de sus intereses o inclinaciones en la Web.
Los sitios de redes sociales generalmente intentan que los usuarios utilicen sus nombres, intereses y ubicaciones reales, en lugar de seudónimos, ya que sus ejecutivos creen que esto hace que la experiencia de las redes sociales sea más atractiva para los usuarios. Por otro lado, las fotografías subidas o las declaraciones descuidadas pueden identificar a un individuo, que puede arrepentirse de esta exposición. Los empleadores, las escuelas, los padres y otros familiares pueden verse influenciados por aspectos de los perfiles de las redes sociales, como publicaciones de texto o fotografías digitales, que la persona que publica no estaba destinada a estas audiencias. Los acosadores en línea pueden hacer uso de información personal para acosar o acechar a los usuarios. Los sitios web de redes sociales modernos permiten un control detallado de la configuración de privacidad de cada publicación, pero pueden ser complejas y no fáciles de encontrar o usar, especialmente para los principiantes. [77] Las fotografías y vídeos publicados en sitios web han causado problemas particulares, ya que pueden agregar el rostro de una persona a un perfil en línea. Con la tecnología de reconocimiento facial moderna y potencial , entonces puede ser posible relacionar ese rostro con otras imágenes, eventos y escenarios, previamente anónimos, que han sido fotografiados en otros lugares. Debido al almacenamiento en caché, duplicación y copia de imágenes, es difícil eliminar una imagen de la World Wide Web.
Los estándares web incluyen muchos estándares y especificaciones interdependientes, algunos de los cuales rigen aspectos de Internet , no sólo la World Wide Web. Incluso cuando no están centrados en la web, dichos estándares afectan directa o indirectamente el desarrollo y la administración de sitios web y servicios web . Las consideraciones incluyen la interoperabilidad , accesibilidad y usabilidad de páginas web y sitios web.
Los estándares web, en el sentido más amplio, constan de lo siguiente:
Los estándares web no son conjuntos fijos de reglas, sino conjuntos de especificaciones técnicas finalizadas de tecnologías web en constante evolución. [84] Los estándares web son desarrollados por organizaciones de normalización (grupos de partes interesadas y a menudo competidoras encargadas de la tarea de estandarización), no tecnologías desarrolladas y declaradas estándar por un solo individuo o empresa. Es crucial distinguir aquellas especificaciones que están en desarrollo de aquellas que ya alcanzaron el estado de desarrollo final (en el caso de las especificaciones del W3C , el nivel de madurez más alto).
Existen métodos para acceder a la Web en medios y formatos alternativos para facilitar el uso por parte de personas con discapacidades . Estas discapacidades pueden ser visuales, auditivas, físicas, relacionadas con el habla, cognitivas, neurológicas o alguna combinación. Las funciones de accesibilidad también ayudan a las personas con discapacidades temporales, como un brazo roto, o a usuarios de edad avanzada a medida que cambian sus habilidades. [85] La Web recibe información, además de proporcionarla e interactuar con la sociedad. El Consorcio World Wide Web afirma que es esencial que la Web sea accesible, para que pueda brindar igualdad de acceso e igualdad de oportunidades a las personas con discapacidad. [86] Tim Berners-Lee señaló una vez: "El poder de la Web está en su universalidad. El acceso de todos, independientemente de su discapacidad, es un aspecto esencial". [85] Muchos países regulan la accesibilidad web como un requisito para los sitios web. [87] La cooperación internacional en la Iniciativa de Accesibilidad Web del W3C condujo a pautas simples que los autores de contenido web y los desarrolladores de software pueden utilizar para hacer que la Web sea accesible para personas que pueden o no estar usando tecnología de asistencia . [85] [88]
La Actividad de Internacionalización del W3C garantiza que la tecnología web funcione en todos los idiomas, escrituras y culturas. [89] A partir de 2004 o 2005, Unicode ganó terreno y finalmente, en diciembre de 2007, superó tanto a ASCII como a Europa occidental como la codificación de caracteres más utilizada en la Web . [90] Originalmente, RFC 3986 permitía identificar recursos mediante URI en un subconjunto de US-ASCII. RFC 3987 permite más caracteres (cualquier carácter del conjunto de caracteres universal ) y ahora IRI puede identificar un recurso en cualquier idioma. [91]
Tejió la World Wide Web y creó un medio de comunicación para el siglo XXI. La World Wide Web es sólo de Berners-Lee. Él lo diseñó. Lo soltó sobre el mundo. Y él, más que nadie, ha luchado para mantenerlo abierto, sin derechos de propiedad y gratuito.[ página necesaria ]
JavaScript es parte de la tríada de tecnologías que todo desarrollador web debe aprender: HTML para especificar el contenido de las páginas web, CSS para especificar la presentación de las páginas web y JavaScript para especificar el comportamiento de las páginas web.
{{cite book}}
: CS1 maint: multiple names: authors list (link)