El tráfico de Internet es el flujo de datos dentro de Internet en su totalidad o en ciertos enlaces de red de sus redes constituyentes. Las mediciones de tráfico más comunes son el volumen total, en unidades de múltiplos de bytes , o como tasas de transmisión en bytes por ciertas unidades de tiempo.
Como la topología de Internet no es jerárquica, no es posible un único punto de medición para el tráfico total de Internet. Los datos de tráfico se pueden obtener de los puntos de interconexión de los proveedores de red de nivel 1 para obtener indicaciones de volumen y crecimiento. Sin embargo, dichos datos excluyen el tráfico que permanece dentro de la red de un único proveedor de servicios y el tráfico que cruza puntos de interconexión privados.
A diciembre de 2022, casi la mitad (48%) del tráfico de Internet se concentra en India y China , mientras que América del Norte y Europa representan aproximadamente una cuarta parte del tráfico mundial de Internet. [1]
El intercambio de archivos constituye una fracción del tráfico de Internet. [2] La tecnología predominante para compartir archivos es el protocolo BitTorrent , que es un sistema peer-to-peer (P2P) mediado por sitios de indexación que proporcionan directorios de recursos. Según un estudio de Sandvine Research en 2013, la participación de BitTorrent en el tráfico de Internet disminuyó un 20% hasta el 7,4% en general, una reducción del 31% en 2008. [3]
A partir de 2023, aproximadamente el 65% de todo el tráfico de Internet provino de sitios de videos , [4] frente al 51% en 2016. [5]
Se estimó que en 2022 aproximadamente el 47 % de todo el tráfico provenía de bots automatizados . [6]
Gestión del tráfico de Internet, también conocida como gestión del tráfico de aplicaciones. Internet no utiliza ningún servicio centralizado formal para la gestión del tráfico. Sus redes progenitoras, especialmente ARPANET, establecieron una infraestructura troncal temprana que transportaba el tráfico entre los principales centros de intercambio de tráfico, lo que dio lugar a un sistema jerárquico de proveedores de servicios de Internet (ISP) en el que las redes de nivel 1 proporcionaban el intercambio de tráfico mediante interconexión sin liquidación y enrutamiento del tráfico a niveles inferiores de ISP. El crecimiento dinámico de la red mundial dio lugar a interconexiones cada vez mayores en todos los niveles de interconexión de Internet, por lo que se desarrolló un sistema robusto que pudiera mediar en fallos de enlaces, cuellos de botella y otras congestiones en muchos niveles. [ cita requerida ]
La gestión económica del tráfico (ETM) es el término que a veces se utiliza para señalar las oportunidades de siembra como una práctica que atiende la contribución dentro del intercambio de archivos entre pares y la distribución de contenido en el mundo digital en general. [7]
En Hungría, se ha previsto aplicar un impuesto sobre el uso de Internet de 150 florines (0,62 dólares estadounidenses o 0,47 euros) por gigabyte de tráfico de datos, con el fin de reducir el tráfico de Internet y ayudar a las empresas a compensar el impuesto sobre la renta de sociedades con el nuevo impuesto. [8] Hungría alcanzó 1.150 millones de gigabytes en 2013 y otros 18 millones de gigabytes acumulados por dispositivos móviles. Esto habría dado lugar a unos ingresos adicionales de 175.000 millones de florines en virtud del nuevo impuesto, según la consultora eNet. [8]
Según Yahoo News, el ministro de Economía, Mihály Varga, defendió la medida diciendo que "el impuesto era justo, ya que reflejaba un cambio de los consumidores hacia Internet en lugar de las líneas telefónicas" y que "150 florines por cada gigabyte de datos transferido eran necesarios para tapar los agujeros en el presupuesto de 2015 de una de las naciones más endeudadas de la UE". [9]
Algunas personas sostienen que el nuevo plan sobre el impuesto a Internet resultaría desventajoso para el desarrollo económico del país , limitaría el acceso a la información y obstaculizaría la libertad de expresión. [10] Aproximadamente 36.000 personas se han inscrito para participar en un evento en Facebook que se celebrará fuera del Ministerio de Economía para protestar contra el posible impuesto. [9]
En 1998, Estados Unidos promulgó la Ley de Libertad Fiscal de Internet (ITFA, por sus siglas en inglés) para evitar la imposición de impuestos directos sobre el uso de Internet y las actividades en línea, como correos electrónicos, acceso a Internet , impuesto a los bits e impuesto al ancho de banda. [11] [12] Inicialmente, esta ley impuso una moratoria de 10 años sobre dichos impuestos, que luego se extendió varias veces y se hizo permanente en 2016. El objetivo de la ITFA era proteger a los consumidores y apoyar el crecimiento del tráfico de Internet al prohibir los impuestos recurrentes y discriminatorios que podrían obstaculizar la adopción y el uso de Internet. Como resultado, la ITFA ha desempeñado un papel crucial en la promoción de la economía digital y la protección de los intereses de los consumidores. Según Pew Research Center, a partir de 2024, aproximadamente el 93% de los estadounidenses usan Internet, y plataformas como YouTube y Facebook son muy populares. [13] [14] [15] [16] Además, el 90% de los hogares estadounidenses se suscribieron a servicios de Internet de alta velocidad en 2021. [17] [18] Aunque la ITFA brinda protección contra los impuestos directos a Internet, los debates en curso sobre la regulación y la gobernanza de Internet continúan dando forma al panorama del tráfico y el uso de Internet en los Estados Unidos .
La clasificación de tráfico describe los métodos de clasificación del tráfico mediante la observación pasiva de las características del tráfico y la línea con objetivos de clasificación particulares. Puede haber algunos que solo tengan un objetivo de clasificación vulgar. Por ejemplo, si se trata de transferencia masiva, intercambio de archivos de igual a igual u orientado a transacciones. Algunos otros establecerán un objetivo de clasificación más detallado, por ejemplo, el número exacto de aplicaciones representadas por el tráfico. Las características del tráfico incluyen el número de puerto, la carga útil de la aplicación, el tamaño temporal del paquete y la característica del tráfico. Existe una amplia gama de métodos para asignar el tráfico de Internet, incluido el tráfico exacto, por ejemplo, el número de puerto (redes informáticas) , la carga útil, el aprendizaje automático heurístico o estadístico.
La clasificación precisa del tráfico de red es fundamental para muchas actividades de Internet, desde la supervisión de la seguridad hasta la contabilidad y desde la calidad del servicio hasta la provisión a los operadores de previsiones útiles para el suministro a largo plazo. Sin embargo, los esquemas de clasificación son extremadamente complejos de aplicar con precisión debido a la escasez de conocimiento disponible sobre la red. Por ejemplo, la información relacionada con el encabezado de los paquetes siempre es insuficiente para permitir una metodología precisa.
Trabajo [19] que involucra aprendizaje automático supervisado para clasificar el tráfico de red. Los datos se clasifican manualmente (según el contenido del flujo) en una de varias categorías. Se utiliza una combinación de categorías de conjuntos de datos (asignadas manualmente) y descripciones de los flujos clasificados (como la longitud del flujo, los números de puerto, el tiempo entre flujos consecutivos) para entrenar al clasificador. Para brindar una mejor idea de la técnica en sí, se realizan suposiciones iniciales y se aplican otras dos técnicas en la realidad. Una es mejorar la calidad y la separación de la entrada de información, lo que conduce a un aumento en la precisión de la técnica del clasificador Naive Bayes .
La base del trabajo de categorización es clasificar el tipo de tráfico de Internet; esto se hace colocando grupos comunes de aplicaciones en diferentes categorías, por ejemplo, "normal" versus "malicioso", o definiciones más complejas, por ejemplo, la identificación de aplicaciones específicas o implementaciones específicas del Protocolo de Control de Transmisión (TCP). [20] Adaptado de Logg et al. [21]
La clasificación de tráfico es un componente importante de los sistemas de detección de intrusiones automatizados. [22] [23] Se utilizan para identificar patrones, así como una indicación de los recursos de red para los clientes prioritarios, o para identificar el uso de los recursos de red por parte de los clientes que de alguna manera contraviene los términos de servicio del operador. Las técnicas de clasificación de tráfico del Protocolo de Internet (IP) generalmente implementadas se basan aproximadamente en una inspección directa del contenido de cada paquete en algún punto de la red. La dirección de origen, el puerto y la dirección de destino se incluyen en paquetes IP sucesivos con un tipo de protocolo de 5-tuplas similar, si no el mismo. Se considera que los ort pertenecen a un flujo cuya aplicación de control deseamos determinar. La clasificación simple infiere la identidad de la aplicación de control al suponer que la mayoría de las aplicaciones utilizan de forma constante números de puerto TCP o UDP bien conocidos. A pesar de ello, muchos candidatos utilizan cada vez más números de puerto impredecibles. Como resultado, las técnicas de clasificación más sofisticadas infieren los tipos de aplicación al buscar datos específicos de la aplicación dentro de las cargas útiles TCP o UDP. [24]
A partir de múltiples fuentes y aplicando suposiciones sobre el uso y la tasa de bits, Cisco , una importante empresa de sistemas de red, ha publicado las siguientes cifras históricas sobre el Protocolo de Internet (IP) y el tráfico de Internet: [25]
El "tráfico de Internet fijo" se refiere quizás al tráfico de los abonados residenciales y comerciales a los proveedores de servicios de Internet, las compañías de cable y otros proveedores de servicios. El "tráfico de Internet móvil" se refiere quizás al tráfico de retorno de las torres y proveedores de telefonía celular. Las cifras generales de "tráfico de Internet", que pueden ser un 30% más altas que la suma de las otras dos, tal vez tengan en cuenta el tráfico en el núcleo de la red troncal nacional, mientras que las otras cifras parecen derivarse principalmente de la periferia de la red.
Cisco también publica proyecciones a 5 años.
Los siguientes datos sobre la red troncal de Internet en EE. UU. provienen de los Estudios de Tráfico de Internet de Minnesota (MINTS): [37]
Los datos de Cisco pueden ser siete veces superiores a los de los Estudios de Tráfico de Internet de Minnesota (MINTS), no sólo porque las cifras de Cisco son estimaciones para Internet global (no sólo para el mercado interno de Estados Unidos), sino también porque Cisco cuenta "el tráfico IP general (incluyendo así las redes cerradas que no son realmente parte de Internet, pero que utilizan IP, el Protocolo de Internet, como los servicios IPTV de varias empresas de telecomunicaciones)". [38] La estimación de MINTS del tráfico de la red troncal nacional de Estados Unidos para 2004, que puede interpolarse como 200 petabytes/mes, es un múltiplo plausible de tres veces el tráfico del mayor operador de red troncal de Estados Unidos, Level(3) Inc. , que afirma un nivel de tráfico medio de 60 petabytes/mes. [39]
En el pasado, el ancho de banda de Internet en las redes de telecomunicaciones se duplicaba cada 18 meses, una observación expresada como la ley de Edholm . [40] Esto sigue los avances en la tecnología de semiconductores , como el escalado de óxido de metal y silicio (MOS) , ejemplificado por el transistor MOSFET, que ha mostrado un escalado similar descrito por la ley de Moore . En la década de 1980, la tecnología de fibra óptica que utiliza luz láser como portadora de información aceleró la velocidad de transmisión y el ancho de banda de los circuitos de telecomunicaciones. Esto ha llevado a que los anchos de banda de las redes de comunicación alcancen velocidades de transmisión de terabits por segundo . [41]