Сетевой трафик
Сетевой трафик — это поток данных во всей сети Интернет или по определённым сетевым связям её составляющих сетей. Обычные метрики трафика включают общий объём данных (в байтах и их кратных) либо скорость передачи (в байтах за единицу времени).
Поскольку топология Интернета не иерархична, не существует единой точки измерения всего сетевого трафика. Данные о трафике могут быть получены на пунктах обмена трафиком магистральных сетей первого уровня (англ. Tier 1 network), что позволяет получить ориентировочные значения объёма и динамики трафика. Однако такие данные не учитывают трафик, остающийся внутри одной сети-провайдера, и обмен между частными точками пиринга.
По состоянию на декабрь 2022 года почти половина (48 %) мобильного интернет-трафика приходится на Индию и Китай, тогда как Северная Америка и Европа в совокупности обеспечивают примерно четверть мирового показателя[1]. Тем не менее, мобильный трафик остаётся меньшей частью от общего сетевого трафика.
Источники трафика
Файлообмен составляет долю интернет-трафика[2]. Преобладающей технологией для обмена файлами является протокол BitTorrent, построенный по принципу одноранговых (P2P) сетей и использующий специальные сайты-индексаторы ресурсов. По данным исследования Sandvine (2013 год), доля BitTorrent в общем интернет-трафике снизилась на 20 % и составила 7,4 %, хотя в 2008 году этот показатель был на уровне 31 %[3].
По данным за 2023 год, примерно 65 % всего интернет-трафика приходится на видеосервисы[4], тогда как в 2016 году эта доля была около 51 %[5].
Управление трафиком
Управление интернет-трафиком (или управление прикладным трафиком) — это общий термин для методов администрирования потоков данных в компьютерных сетях. В Интернете отсутствует централизованное управление трафиком: исторически в прототипных сетях (особенно ARPANET) вводился магистральный сегмент для пересылки трафика между ключевыми центрами обмена, что привело к многоуровневой структуре провайдеров Интернета, где магистральная сеть уровня 1 осуществляет бесплатный обмен трафиком между собой и маршрутизацию на более низкие уровни. Динамичный рост Интернета повлёк за собой увеличение межсетевых соединений на всех уровнях, что потребовало выработки стойкой системы к сбоям соединений, узким местам и локальным перегрузкам сети.
Экономическое управление трафиком (англ. Economic traffic management, ETM) — термин, который иногда применяют по отношению к практике сидирования как способу стимулирования вклада в одноранговом файлообмене и распространении контента в цифровой среде[6].
Налог на использование Интернета
В 2014 году в Венгрии был предложен налог на использование Интернета в размере 150 форинтов (0,62 доллара США или 0,47 евро) за каждый гигабайт данных. Эта инициатива предназначалась для сокращения объёма трафика, а также позволяла компаниям уменьшать налог на прибыль за счёт нового сбора[7]. В 2013 году в стране было передано 1,15 миллиарда гигабайт, а мобильные устройства добавили ещё 18 миллионов. Это могло бы дать дополнительный доход в 175 миллиардов форинтов согласно оценке консалтинговой фирмы eNet[7].
Министр экономики Михай Варга защитил эту инициативу словами о её справедливости, так как она отражает переход потребителей в Интернет от использования телефонной связи; «150 форинтов за каждый переданный гигабайт нужны для покрытия бюджета одной из наиболее задолжавших стран ЕС»[8].
Критики утверждали, что новый налог может негативно сказаться на экономическом развитии страны, ограничить доступ к информации и препятствовать свободе выражения[9]. Около 36 000 человек заявили о намерении принять участие в акции протеста перед министерством экономики[8].
В 1998 году в США был принят Закон о свободе Интернета от налогов (англ. Internet Tax Freedom Act, ITFA), запрещающий взимание прямых налогов на использование Интернета и связанные с этим онлайн-услуги, такие как эл. почта, доступ в сеть, битовый и полосовой налоги[10][11]. Изначально действие закона было ограничено 10 годами, но в дальнейшем он неоднократно продлевался и был сделан бессрочным в 2016 году. Целью ITFA было поддерживать рост интернет-трафика за счёт защиты пользователей от повторяющихся и дискриминационных налогов, способных препятствовать распространению и использованию Интернета. Закон сыграл заметную роль в развитии цифровой экономики и защите интересов потребителей. По оценкам Pew Research Center, по состоянию на 2024 год около 93 % американцев пользуются Интернетом.[12][13][14] К 2021 году 90 % домохозяйств в США имели широкополосный интернет[15][16]. Несмотря на защиту от прямых интернет-налогов, в США продолжаются дебаты о регулировании и управлении интернет-трафиком.
Классификация трафика
Классификация трафика описывает методы пассивного анализа сетевого трафика с целью его классификации по различным признакам. Простая классификация может делить трафик на массовую передачу данных, одноранговый обмен или ориентированную на транзакции передачу, а более тонкая — идентифицировать конкретные приложения или виды деятельности. Для классификации используются такие признаки, как номер порта, содержимое приложения, временные интервалы, размер пакета и характеристики передач. Существует широкий спектр методов распределения интернет-трафика, например, по точному признаку (номер порта), нагрузке, эвристике или статистическому машинному обучению.
Точная классификация сетевого трафика важна для ряда задач: мониторинга безопасности, учёта, обеспечения качества обслуживания (QoS) и долгосрочного планирования сетевой инфраструктуры. Тем не менее, дефицит информации (например, из заголовков пакетов) зачастую мешает достичь высокой точности этих методов.
Работы по классификации сетевого трафика включают использование контролируемого машинного обучения. Данные предварительно классифицируются вручную (на основе содержимого потока) по набору категорий. Сочетание информации о категории данных и дескрипторов потока (длина, номера портов, интервалы между потоками) используется для обучения классификатора. Для повышения точности использование наивного байесовского классификатора дополняется введением предположений и использованием вспомогательных методов.
Классификация интернет-трафика может делить приложения на группы: условно, «нормальные» или «вредоносные» приложения; также возможна более точная идентификация конкретных приложений или реализаций TCP[17]. Примеры подходов взяты из работы C. Logg и др.[18]
Классификация трафика лежит в основе автоматизированных систем обнаружения вторжений[19][20]. Они позволяют выявлять шаблоны использования сети, выделять ресурсоёмких клиентов и отслеживать нарушения условий обслуживания. Традиционные технологии классификации трафика ориентируются на прямой анализ содержимого пакетов в узлах сети. Для определения управляющего приложения используют адрес источника и получателя, а также номера портов серии пакетов (5-ка параметров). Простые подходы предполагают постоянство портов для большинства приложений (например, стандартные TCP или UDP), однако всё больше программ используют непредсказуемые номера портов. Поэтому современные методы обращаются к анализу данных в полезной нагрузке TCP или UDP пакетов для идентификации типа приложения[21].
Глобальный интернет-трафик
Агрегируя данные различных источников и применяя допущения по объёмам и битрейту, компания Cisco, являющаяся крупным производителем сетевых систем, публиковала следующие исторические данные по мировому трафику IP и Интернету:[22]
| Год | IP-трафик (ПБ/месяц) |
Фиксированный интернет-трафик (ПБ/месяц) |
Мобильный интернет-трафик (ПБ/месяц) |
|---|---|---|---|
| 1990 | 0,001 | 0,001 | н/д |
| 1991 | 0,002 | 0,002 | н/д |
| 1992 | 0,005 | 0,004 | н/д |
| 1993 | 0,01 | 0,01 | н/д |
| 1994 | 0,02 | 0,02 | н/д |
| 1995 | 0,18 | 0,17 | н/д |
| 1996 | 1,9 | 1,8 | н/д |
| 1997 | 5,4 | 5,0 | н/д |
| 1998 | 12 | 11 | н/д |
| 1999 | 28 | 26 | н/д |
| 2000 | 84 | 75 | н/д |
| 2001 | 197 | 175 | н/д |
| 2002 | 405 | 356 | н/д |
| 2003 | 784 | 681 | н/д |
| 2004 | 1 477 | 1 267 | н/д |
| 2005 | 2 426 | 2 055 | 0,9 |
| 2006 | 3 992 | 3 339 | 4 |
| 2007 | 6 430 | 5 219 | 15 |
| 2008[23] | 10 174 | 8 140 | 33 |
| 2009[24] | 14 686 | 10 942 | 91 |
| 2010[25] | 20 151 | 14 955 | 237 |
| 2011[26] | 30 734 | 23 288 | 597 |
| 2012[27][28] | 43 570 | 31 339 | 885 |
| 2013[29] | 51 168 | 34 952 | 1 480 |
| 2014[30] | 59 848 | 39 909 | 2 514 |
| 2015[31] | 72 521 | 49 494 | 3 685 |
| 2016[32] | 96 054 | 65 942 | 7 201 |
| 2017[33] | 122 000 | 85 000 | 12 000 |
Под «фиксированным интернет-трафиком» понимается, возможно, трафик от домашних и корпоративных пользователей операторов, кабельных компаний и других сервис-провайдеров. «Мобильный интернет-трафик» зачастую трактуется как бэкхол трафик от сотовых башен и поставщиков связи. Общий показатель «интернет-трафика» может быть примерно на 30 % больше суммы предыдущих двух, вероятно, за счёт включения обмена по национальному магистральному ядру сети.
Компания Cisco также публикует 5‑летние прогнозы.
| Год | Фиксированный интернет-трафик (ЭБ/месяц) |
Мобильный интернет-трафик (ЭБ/месяц) |
|---|---|---|
| 2018 | 107 | 19 |
| 2019 | 137 | 29 |
| 2020 | 174 | 41 |
| 2021 | 219 | 57 |
| 2022 | 273 | 77 |
Трафик в магистральных сетях США
Ниже приведены данные по магистральному трафику в США согласно Minnesota Internet Traffic Studies (MINTS):[34]
| Год | Данные (ТБ/месяц) |
|---|---|
| 1990 | 1 |
| 1991 | 2 |
| 1992 | 4 |
| 1993 | 8 |
| 1994 | 16 |
| 1995 | н/д |
| 1996 | 1 500 |
| 1997 | 2 500-4 000 |
| 1998 | 5 000-8 000 |
| 1999 | 10 000-16 000 |
| 2000 | 20 000-35 000 |
| 2001 | 40 000-70 000 |
| 2002 | 80 000—140 000 |
| 2003 | н/д |
| 2004 | н/д |
| 2005 | н/д |
| 2006 | 450 000—800 000 |
| 2007 | 750 000-1 250 000 |
| 2008 | 1 200 000-1 800 000 |
| 2009 | 1 900 000-2 400 000 |
| 2010 | 2 600 000-3 100 000 |
| 2011 | 3 400 000-4 100 000 |
По данным Cisco, значения могут быть в 7 раз выше, чем у Minnesota Internet Traffic Studies (MINTS), не только потому что Cisco оценивает глобальный, а не только национальный трафик США, но и потому, что учитывает весь трафик IP (в том числе и закрытые сети на протоколе IP, не являющиеся реальной частью Интернета, как IPTV некоторых телеком-операторов)[35]. Оценка MINTS для США за 2004 год (примерно 200 ПБ/месяц) примерно втрое превышает объём трафика крупнейшего национального магистрального провайдера Level(3) Inc., который заявлял о среднем уровне 60 ПБ/месяц[36].
Закон Эдхолма
В прошлом пропускная способность телекоммуникационных сетей каждые 18 месяцев удваивалась, что известно как закон Эдхолма[37]. Эта тенденция обусловлена прогрессом в полупроводниковых технологиях, например, развитием MOS-транзисторов по закону Мура. В 1980‑е внедрение волоконно-оптических технологий и лазерных источников света резко увеличило возможности передачи данных, что позволило сетям выйти на скорости передачи порядка террабит в секунду[38].
См. также
Примечания
Литература
- Williamson, Carey (2001). “Internet Traffic Measurement”. IEEE Internet Computing. 5 (6): 70—74. DOI:10.1109/4236.968834.
Ссылки
- The Size and Growth Rate of the Internet, K.G. Coffman и Э. Одлисски, First Monday, том 3, № 5, октябрь 1998
- Internet Traffic Report от AnalogX
- Internet Health Report (Keynote Systems)
- CAIDA — Ассоциация по анализу данных Интернета Архивировано 14 мая 2014 года. (CAIDA, Университет Калифорнии в Сан-Диего, центр суперкомпьютеров)