Порносайты и трафик в интернете

Я знаю, что эта статья не сильно вписывается в тематику моего блога, но вообще информация из статьи показалась мне крайне интересной, и я решил перевести ее для читателей. Кстати, можно попробовать притянуть за уши к тематике блога и эту статью — пока ее писал, позаходил на некоторые сайты, которые в ней упоминаются, и все они активно рекламируют, что поддерживают iPad и не требуют для работы Flash. Вполне может быть, что как в свое время порно-индустрия проголосовала за VHS, а затем выбрала Bluray, так и сейчас решение порно-индустрии не в пользу Flash, скорей всего, окончательно добьет эту технологию как инструмент поставки видео в сети. Вот. Теперь к сути.(простите, не мог удержаться до понедельника, так хотелось перевести).
—————
Общепринято считать, что человек с быстрым интернет-подключением может желать какой-нибудь порнушки.
И хотя в эту сферу сложно внедриться — точных данных очень мало, мы точно знаем, что порно-сайты являются одной из самых популярных частей интернета с точки зрения трафика. Согласно DoubleClick Ad Planner, который отслеживает пользователей в сети с помощью куки, среди 500 популярнейших веб-сайтов есть десятки сайтов для взрослых. Xvideos, крупнейший порно-сайт в сети с 4,4 млрд просмотров в месяц, в три раза больше CNN или ESPN, и в два раза больше Reddit. LiveJasmin не намного меньше. YouPorn, Tube8 и Pornhub — это все очень крупные сайты, больше которых только Google и Facebook.

И хотя количество просматриваемых страниц — это неплохое начало, но они нам говорят только о том, что порно-сайт А более популярен, чем непорно-сайт Б. 4 миллиарда просмотров страниц звучит круто, но когда вы учтете, что именно делают на этих сайтах посетители, тогда можно оценить размер и масштаб сайтов для взрослых по-настоящему.
[ad#intext-inside]
Начнем с базовых вещей, а потом расскажем о реальных цифрах от YouPorn, второго по величине порно-сайта в интернете. Если хотите, можете попробовать поугадывать количество трафика, которое проходит через YouPorn каждую секунду. Потом расскажете в комментариях, угадали ли вы.
Масштаб
Основная разница между порно и не-порно сайтами — в средней продолжительности визита: для новостного сайта вроде Engadget или ExtremeTech среднее посещение длится примерно от 3 до 6 минут; достаточно времени, чтобы прочитать 1-2 статьи. Среднее время, проведенное на порно-сайте, однако, составляет от 15 до 20 минут.
Еще надо учитывать, что большинство веб-сайтов состоят в основном из текстов и картинок, в то время как крупнейшие порно-сайты транслируют видео. Когда вы загружаете главную страницу ExtremeTech, мы говорим о паре мегабайт, а затем, может быть, 500 килобайт, если вы загружаете статью. Когда вы смотрите порно, допустим, в низком разрешении 480х200, вам передается около 100кб в секунду — так что за 15 минут набегает на 90 мегабайт.
А затем надо умножить 90 мегабайт на количество посетителей в месяц — это около 350 миллионов у Xvideos. Так что получается примерно 29 петабайт данных каждый месяц, или же 50 гигабайт в секунду. Для сравнения, ваше домашнее интернет-подключение, скорей всего, способно пропускать несколько мегабайт в секунду, что в 25 тысяч раз меньше.
Короче говоря, порно-сайтам приходится работать с астрономическими объемами данных. Единственные сайты, которые похожи по этим параметрам — это YouTube или Hulu, но даже YouPorn примерно в 6 раз больше Hulu.
Инфраструктура
Раздача видео требует гораздо больше ресурсов, чем загрузка текста или изображений — и в плане хранения, и процессора, и систем ввода/вывода, и мощности канала передачи данных.
От сайта к сайту эта цифра, конечно, отличается, но большинство сайтов для взрослых хранят примерно от 50 до 200 терабайтов порно. Это много для веб-сайта (только сайты типа Google, Facebook, Blogger, YouTube хранят больше данных), но в мире, где диски на 2ТБ дешевые и доступные, это не так уж и много. Мы писали в прошлом году про систему хранения Backblaze, где можно хранить 135ТБ в ящике 4U, стоимостью всего 7400 долл.
Мощность процессора и ввода-вывода зависят от битрейта транслируемого видео и количества просматриваемых страниц. Вначале порно-сайт должен выдать динамическую, доступную для поиска базу данных тысяч роликов, а затем, когда кто-то кликает на видео, этот файл надо прочитать с жесткого диска и затем транслировать его через интернет. Если
вы когда-то передавали много больших файлов по локальной сети (то есть, нагружая и жесткий диск, и порт Ethernet), вы знаете, какую нагрузку это вызывает.
Реальные аппаратные требования практически невозможно получить (их не публикуют), но в случае с большим порно-сайтом мы, видимо, говорим о стойках четырехядерных серверов, гигабитных свичах и балансировщиках нагрузки. В программном плане большинство крупных порно-сайтов используют высокопроизводительную базу данных Redis для хранения и выдачи видео, и легкий HTTP-сервер вроде Nginx для выдачи веб-страниц.
Ну и, конечно, канал связи. Возвращаясь к примеру Xvideos (на основе оценки Ad Planer), большой порносайт должен иметь достаточно широкий канал, чтобы выдавать 50 гигабайтов в секунду (400Гбит/с). И речь идет о средней нагрузке: в пиковые моменты Xvideos может подниматься до 1000Гбит/с (1Тбит/с) или даже больше. Для сравнения, между Лондоном и Нью-Йорком общая ширина каналов связи составляет примерно 15Тбит/сек.
Чтобы справиться с таким объемом трафика, есть несколько вариантов: можно построить свой дата-центр, арендовать несколько стоек в очень большом дата-центре, или же использовать облачного провайдера вроде Amazon AWS или Microsoft Azure.
Реальный пример
Второй по величине порно-сайт в интернете, YouPorn, поделился с нами реальными данными. Вас может порадовать (или напугать) тот факт, что оценочные цифры DoubleClick Ad Planner оказываются значительно ниже, чем на самом деле.
YouPorn хранит “более 100ТБ порно”, и показывает более “100 млн” страниц в день. С учетом этого, в среднем получается 950 терабайт данных в день, почти все — потоковое видео. Это примерно 28 петабайт в месяц, что означает, что наша оценка про 29ПБ для Xvideos занижена; там, видимо, передается от 35 до 40ПБ в месяц.
Но это еще не все! В моменты пиковой нагрузки YouPorn выдает 4000 страниц в секунду, что равно пиковому трафику в районе 100 гигабайт в секунду (800Гбит/с). Это равно передаче более 10 двухслойных DVD каждую секунду.
В программной части для хранения данных YouPorn на 100% построен на Redis, а MySQL используется как администрирующий инструмент для управления и добавления данных в кластер Redis. Сайт был когда-то сделан на Perl с бэк-эндом в виде MySQL, но в 2011 году Perl заменили на PHP, а MySQL заменили на Redis. Nginx используется в качестве HTTP-сервера, а HAProxy и Varnish используются для балансировки загрузки.
Сервер Redis обрабатывает 300 тысяч запросов в секунду, и каждый час сохраняется 8-15ГБ логов (логи посещаемости, поведение, и тд). Нам рассказали, что это решение способно обрабатывать до 200 млн просмотров в день.
К сожалению, YouPorn не смогли рассказать о своей аппаратной инфраструктуре. Судя по IP-адресам их сети доставки контента, они не размещаются “в облаке” вроде Amazon, а, скорее, где-то в большом дата-центре, где пиринг обеспечивается провайдерами третьего уровня.
[ad#intext-inside]
Чтобы оценить масштабы этой цифры в 800Гбит/с, можно сказать, что в Интернете ежедневно передается около половины экзабайта, что равно примерно 50Тбит/сек — другими словами, один порно-сайт передает примерно 2% всего трафика интернета. А сайтов масштаба YouPorn — десятки, и сотни таких, которые размером с ExtremeTech или ваш любимый новостной сайт. Так что вполне можно допустить, что порнография занимает 30% всех данных, передаваемых по сети интернет.
Интернет на самом деле для порнографии.
Оригинал

13 thoughts on “Порносайты и трафик в интернете

  1. Интересно. Кстати со своей стороны могу подтвердить теорию хорошей скорость инета и порносайтов. Я сам туда частенько заглядываю, недавно поставил вайфай с 32 мбит. Правда через месяц уже успело все надоесть, так что теперь на порносайты практически не захожу.

  2. Да, весьма и весьма поучительно…
    Перефразируя известную фразу о рекламе как двигателе прогресса, выходит, что сейчас именно порнотрафик заставляет всех этих провайдеров держать аппаратный уровень на высоте! (как минимум, выступает своеобразным тестом на профпригодность, хе-хе)  😉  

  3. А кто-то сомневался? Интернет как массовое явление вырос из сисек Анны Курниковой и роликов Памелы+Томми. Это потом ушлые барыги сообразили, что раз уж народ собрался, неплохо бы ему что-нибудь продать. А уж широкополосному интеренету мы на 100% обязаны порно. Если рассмотреть сексуальный аспект в более широком контексте, то напомните мне, откуда взялись, зачем создавались и как получили популярность социальные сети? :))
    Как говорил герой Чарли Шина в сериале “Два с половиной человека” – “Если это не сексуально, не вкусно или не приносит денег, этого в моем телефоне нет!” ))

  4. Это нормально, вся жизнь человека вращается вокруг секса, начиная с зачатия и появления на свет. Секс своего рода двигатель прогресса, после чувства голода, конечно.

  5. Если из интернета убрать все порносайты, то останется один сайт с надписью “Верните порно!” (с) Доктор Кокс из сериала “Клиника”

  6. Последняя фраза в статье очень жизнеутверждающая и оптимистичная)) Но очень похожая на правду. Думаю, процентов на 80.

  7. YouPorn, как и собственно вся их сеть, сидит на CDN от Reflected, которая базируется на Level3.. Это легко посмотреть тем же пингом до их ресурсов. Секретов тут никаких нет. А хранить контент можно и на своих серверах, отдавая его в CDN.

Leave a Reply