Сетевой трафик

Сетевой трафик — это поток данных во всей сети Интернет или по определённым сетевым связям её составляющих сетей. Обычные метрики трафика включают общий объём данных (в байтах и их кратных) либо скорость передачи (в байтах за единицу времени).

Поскольку топология Интернета не иерархична, не существует единой точки измерения всего сетевого трафика. Данные о трафике могут быть получены на пунктах обмена трафиком магистральных сетей первого уровня (англ. Tier 1 network), что позволяет получить ориентировочные значения объёма и динамики трафика. Однако такие данные не учитывают трафик, остающийся внутри одной сети-провайдера, и обмен между частными точками пиринга.

По состоянию на декабрь 2022 года почти половина (48 %) мобильного интернет-трафика приходится на Индию и Китай, тогда как Северная Америка и Европа в совокупности обеспечивают примерно четверть мирового показателя^[1]. Тем не менее, мобильный трафик остаётся меньшей частью от общего сетевого трафика.

Файлообмен составляет долю интернет-трафика^[2]. Преобладающей технологией для обмена файлами является протокол BitTorrent, построенный по принципу одноранговых (P2P) сетей и использующий специальные сайты-индексаторы ресурсов. По данным исследования Sandvine (2013 год), доля BitTorrent в общем интернет-трафике снизилась на 20 % и составила 7,4 %, хотя в 2008 году этот показатель был на уровне 31 %^[3].

По данным за 2023 год, примерно 65 % всего интернет-трафика приходится на видеосервисы^[4], тогда как в 2016 году эта доля была около 51 %^[5].

Управление интернет-трафиком (или управление прикладным трафиком) — это общий термин для методов администрирования потоков данных в компьютерных сетях. В Интернете отсутствует централизованное управление трафиком: исторически в прототипных сетях (особенно ARPANET) вводился магистральный сегмент для пересылки трафика между ключевыми центрами обмена, что привело к многоуровневой структуре провайдеров Интернета, где магистральная сеть уровня 1 осуществляет бесплатный обмен трафиком между собой и маршрутизацию на более низкие уровни. Динамичный рост Интернета повлёк за собой увеличение межсетевых соединений на всех уровнях, что потребовало выработки стойкой системы к сбоям соединений, узким местам и локальным перегрузкам сети.

Экономическое управление трафиком (англ. Economic traffic management, ETM) — термин, который иногда применяют по отношению к практике сидирования как способу стимулирования вклада в одноранговом файлообмене и распространении контента в цифровой среде^[6].

В 2014 году в Венгрии был предложен налог на использование Интернета в размере 150 форинтов (0,62 доллара США или 0,47 евро) за каждый гигабайт данных. Эта инициатива предназначалась для сокращения объёма трафика, а также позволяла компаниям уменьшать налог на прибыль за счёт нового сбора^[7]. В 2013 году в стране было передано 1,15 миллиарда гигабайт, а мобильные устройства добавили ещё 18 миллионов. Это могло бы дать дополнительный доход в 175 миллиардов форинтов согласно оценке консалтинговой фирмы eNet^[7].

Министр экономики Михай Варга защитил эту инициативу словами о её справедливости, так как она отражает переход потребителей в Интернет от использования телефонной связи; «150 форинтов за каждый переданный гигабайт нужны для покрытия бюджета одной из наиболее задолжавших стран ЕС»^[8].

Критики утверждали, что новый налог может негативно сказаться на экономическом развитии страны, ограничить доступ к информации и препятствовать свободе выражения^[9]. Около 36 000 человек заявили о намерении принять участие в акции протеста перед министерством экономики^[8].

В 1998 году в США был принят Закон о свободе Интернета от налогов (англ. Internet Tax Freedom Act, ITFA), запрещающий взимание прямых налогов на использование Интернета и связанные с этим онлайн-услуги, такие как эл. почта, доступ в сеть, битовый и полосовой налоги^[10]^[11]. Изначально действие закона было ограничено 10 годами, но в дальнейшем он неоднократно продлевался и был сделан бессрочным в 2016 году. Целью ITFA было поддерживать рост интернет-трафика за счёт защиты пользователей от повторяющихся и дискриминационных налогов, способных препятствовать распространению и использованию Интернета. Закон сыграл заметную роль в развитии цифровой экономики и защите интересов потребителей. По оценкам Pew Research Center, по состоянию на 2024 год около 93 % американцев пользуются Интернетом.^[12]^[13]^[14] К 2021 году 90 % домохозяйств в США имели широкополосный интернет^[15]^[16]. Несмотря на защиту от прямых интернет-налогов, в США продолжаются дебаты о регулировании и управлении интернет-трафиком.

Классификация трафика описывает методы пассивного анализа сетевого трафика с целью его классификации по различным признакам. Простая классификация может делить трафик на массовую передачу данных, одноранговый обмен или ориентированную на транзакции передачу, а более тонкая — идентифицировать конкретные приложения или виды деятельности. Для классификации используются такие признаки, как номер порта, содержимое приложения, временные интервалы, размер пакета и характеристики передач. Существует широкий спектр методов распределения интернет-трафика, например, по точному признаку (номер порта), нагрузке, эвристике или статистическому машинному обучению.

Точная классификация сетевого трафика важна для ряда задач: мониторинга безопасности, учёта, обеспечения качества обслуживания (QoS) и долгосрочного планирования сетевой инфраструктуры. Тем не менее, дефицит информации (например, из заголовков пакетов) зачастую мешает достичь высокой точности этих методов.

Байесовские методы анализа

Работы по классификации сетевого трафика включают использование контролируемого машинного обучения. Данные предварительно классифицируются вручную (на основе содержимого потока) по набору категорий. Сочетание информации о категории данных и дескрипторов потока (длина, номера портов, интервалы между потоками) используется для обучения классификатора. Для повышения точности использование наивного байесовского классификатора дополняется введением предположений и использованием вспомогательных методов.

Классификация интернет-трафика может делить приложения на группы: условно, «нормальные» или «вредоносные» приложения; также возможна более точная идентификация конкретных приложений или реализаций TCP^[17]. Примеры подходов взяты из работы C. Logg и др.^[18]

Обзор методов

Классификация трафика лежит в основе автоматизированных систем обнаружения вторжений^[19]^[20]. Они позволяют выявлять шаблоны использования сети, выделять ресурсоёмких клиентов и отслеживать нарушения условий обслуживания. Традиционные технологии классификации трафика ориентируются на прямой анализ содержимого пакетов в узлах сети. Для определения управляющего приложения используют адрес источника и получателя, а также номера портов серии пакетов (5-ка параметров). Простые подходы предполагают постоянство портов для большинства приложений (например, стандартные TCP или UDP), однако всё больше программ используют непредсказуемые номера портов. Поэтому современные методы обращаются к анализу данных в полезной нагрузке TCP или UDP пакетов для идентификации типа приложения^[21].

Агрегируя данные различных источников и применяя допущения по объёмам и битрейту, компания Cisco, являющаяся крупным производителем сетевых систем, публиковала следующие исторические данные по мировому трафику IP и Интернету:^[22]

Глобальный интернет-трафик по годам
Год	IP-трафик (ПБ/месяц)	Фиксированный интернет-трафик (ПБ/месяц)	Мобильный интернет-трафик (ПБ/месяц)
1990	0,001	0,001	н/д
1991	0,002	0,002	н/д
1992	0,005	0,004	н/д
1993	0,01	0,01	н/д
1994	0,02	0,02	н/д
1995	0,18	0,17	н/д
1996	1,9	1,8	н/д
1997	5,4	5,0	н/д
1998	12	11	н/д
1999	28	26	н/д
2000	84	75	н/д
2001	197	175	н/д
2002	405	356	н/д
2003	784	681	н/д
2004	1 477	1 267	н/д
2005	2 426	2 055	0,9
2006	3 992	3 339	4
2007	6 430	5 219	15
2008^[23]	10 174	8 140	33
2009^[24]	14 686	10 942	91
2010^[25]	20 151	14 955	237
2011^[26]	30 734	23 288	597
2012^[27]^[28]	43 570	31 339	885
2013^[29]	51 168	34 952	1 480
2014^[30]	59 848	39 909	2 514
2015^[31]	72 521	49 494	3 685
2016^[32]	96 054	65 942	7 201
2017^[33]	122 000	85 000	12 000

Под «фиксированным интернет-трафиком» понимается, возможно, трафик от домашних и корпоративных пользователей операторов, кабельных компаний и других сервис-провайдеров. «Мобильный интернет-трафик» зачастую трактуется как бэкхол трафик от сотовых башен и поставщиков связи. Общий показатель «интернет-трафика» может быть примерно на 30 % больше суммы предыдущих двух, вероятно, за счёт включения обмена по национальному магистральному ядру сети.

Компания Cisco также публикует 5‑летние прогнозы.

Прогнозируемый мировой интернет-трафик по годам^[33]
Год	Фиксированный интернет-трафик (ЭБ/месяц)	Мобильный интернет-трафик (ЭБ/месяц)
2018	107	19
2019	137	29
2020	174	41
2021	219	57
2022	273	77

Ниже приведены данные по магистральному трафику в США согласно Minnesota Internet Traffic Studies (MINTS):^[34]

Магистральный трафик США по годам
Год	Данные (ТБ/месяц)
1990	1
1991	2
1992	4
1993	8
1994	16
1995	н/д
1996	1 500
1997	2 500-4 000
1998	5 000-8 000
1999	10 000-16 000
2000	20 000-35 000
2001	40 000-70 000
2002	80 000—140 000
2003	н/д
2004	н/д
2005	н/д
2006	450 000—800 000
2007	750 000-1 250 000
2008	1 200 000-1 800 000
2009	1 900 000-2 400 000
2010	2 600 000-3 100 000
2011	3 400 000-4 100 000

По данным Cisco, значения могут быть в 7 раз выше, чем у Minnesota Internet Traffic Studies (MINTS), не только потому что Cisco оценивает глобальный, а не только национальный трафик США, но и потому, что учитывает весь трафик IP (в том числе и закрытые сети на протоколе IP, не являющиеся реальной частью Интернета, как IPTV некоторых телеком-операторов)^[35]. Оценка MINTS для США за 2004 год (примерно 200 ПБ/месяц) примерно втрое превышает объём трафика крупнейшего национального магистрального провайдера Level(3) Inc., который заявлял о среднем уровне 60 ПБ/месяц^[36].

В прошлом пропускная способность телекоммуникационных сетей каждые 18 месяцев удваивалась, что известно как закон Эдхолма^[37]. Эта тенденция обусловлена прогрессом в полупроводниковых технологиях, например, развитием MOS-транзисторов по закону Мура. В 1980‑е внедрение волоконно-оптических технологий и лазерных источников света резко увеличило возможности передачи данных, что позволило сетям выйти на скорости передачи порядка террабит в секунду^[38].

Williamson, Carey (2001). “Internet Traffic Measurement”. IEEE Internet Computing. 5 (6): 70—74. DOI:10.1109/4236.968834.

The Size and Growth Rate of the Internet, K.G. Coffman и Э. Одлисски, First Monday, том 3, № 5, октябрь 1998
Internet Traffic Report от AnalogX
Internet Health Report (Keynote Systems)
CAIDA — Ассоциация по анализу данных Интернета Архивировано 14 мая 2014 года. (CAIDA, Университет Калифорнии в Сан-Диего, центр суперкомпьютеров)

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

Сетевой трафик

Источники трафика

Управление трафиком

Налог на использование Интернета

Классификация трафика

Байесовские методы анализа

Обзор методов

Глобальный интернет-трафик

Трафик в магистральных сетях США

Закон Эдхолма

См. также

Примечания

Литература

Ссылки

Категории