Высота ленты Твиттера
Оригинал: Twitter Timeline HeightЕсли наши ленты сообщений в Твиттере (твиты людей, на которых мы подписаны) смогут выходить за пределы экрана в обоих направлениях, насколько высокими они станут?
— Аноним
Это на удивление заковыристый вопрос. Ответ включает в себя немецкие танки, вымирание человечества и самую обсуждаемую в Интернете проблему статистики.
Но сначала о Твиттере.
Огромное количество твитов
Очевидно, что ответ зависит от того, на кого вы подписаны. Некоторые люди твитят гораздо чаще других.
Джеф Жак (@JephJacques), автор Questionable Content, твитит очень много. Его вклад в вашу ленту сообщений составит 36 000 твитов и будет расти. С другой стороны, если вы подписаны на людей, которые твитят нечасто, вся ваша лента, возможно, поместится на одном экране.
Согласно анализу Диего Баша, в прошлом году «средний» аккаунт Твиттера был подписан на 51 человека и опубликовал 307 сообщений[1].↲Диего Баш. Немного свежей статистики Твиттера (за июль 2012, набор данных включён). (Набор данных не включён.)↳ Но средние величины могут быть обманчивы[2]:↲Если Ларри Эллисон, заработавший 96 миллионов долларов в прошлом году, переедет в обычный городок с населением в 3 000 человек, средний доход в этом городке мигом удвоится.↳ большинство аккаунтов Твиттера имеют единственного подписчика, а то и вовсе не писали сообщений.
Чтобы получить представление о типичной ленте сообщений, я попросил нескольких друзей сделать скриншоты своих домашних страниц в Твиттере и посчитать текущее число твитов. Разброс результатов оказался весьма широк: у кого-то вышло 20 твитов в минуту, а у кого-то — 20 твитов в месяц.
С учётом поправки[3]↲Умножения на случайное число от 0,5 до 1.↳ на время суток и экстраполяции[4]↲Заполнения таблиц числами до тех пор, пока не закончатся столбцы.↳ в прошлое на основании темпа роста Твиттера, получаем гипотезу, что некоторые ленты содержат сейчас сотни твитов, а некоторые — миллионы.
На мониторе моего компьютера среднестатистический твит занимает 2,4 сантиметра[5].↲Источник: сам только что померил. Вы тоже можете измерить, но вам придётся использовать свой компьютер вместо моего. На своём я сейчас печатаю, и мне нужно видеть экран.↳ Таким образом, башня твитов Джефа Жака имеет где-то 900 метров в высоту (это выше самого высокого здания) и продолжает расти.
Однако Джеф не идёт ни в какое сравнение с @YOUGAKUDAN_00, который твитит много раз в минуту — обычно в двоичном коде, но иногда и словами. У @YOUGAKUDAN_00 накопилось 37 миллионов твитов; этого достаточно, чтобы достичь околоземной орбиты.
Применяя оценку Диего за июль 2012 года к текущему количеству твитов в день, приходим к предположению, что на октябрь 2013 года общее число твитов — около 345 миллиардов. Это означает, что если вы подпишетесь на всех пользователей Твиттера, то высота вашей ленты составит восемь миллионов километров. Сравните: вот Земля, а рядом с ней ваша лента:
Впрочем… это же только нижняя часть ленты сообщений. А как насчёт всей ленты?
Когда-нибудь последний человек, на которого вы подписаны, твитнет последний раз. Когда это случится?
Будущее
На самом деле, наши ленты даже и близко не столь высоки, как небоскрёбы, поскольку Твиттер ограничивает количество старых твитов, доступных при пролистывании. Однако можем ли мы оценить, насколько высокими могли бы стать наши ленты в итоге?
Ввиду продолжительности жизни человека, большинство аккаунтов, на которые вы подписаны, вероятно, прекратят твитить в течение века. С другой стороны, аккаунты вроде @big_ben_clock могут существовать тысячелетиями.
Но продержится ли так долго сам Твиттер?
Наверняка, конечно, сказать нельзя, но в статистике существует занятный подход, который может нам помочь[6].↲Предскажите гибель Твиттера с одной дурацкой подсказки!
А может быть и нет. Смотря кого спросить.
Задача о немецких танках
Допустим, вы перенеслись в параллельную вселенную. Вы открываете IMDb, грузите случайную страницу, и натыкаетесь на фильм «Земля до начала времён XXVII»[7].↲27.
Если судить только по названию, сколько, по-вашему, в этой вселенной фильмов «Земля до начала времён»? Очевидно, что как минимум 27, а вероятно, и больше.
Во время Второй мировой войны с вариантом этой задачи столкнулись войска антигитлеровской коалиции[8].↲(Фашисты завалили их продолжениями «Земли до начала времён».)↳ У деталей немецких танков были серийные номера, многие из которых шли последовательно (1, 2, …, N). Предположим, что был захвачен случайный танк. Если установить, что это танк № 27, то можно быть уверенным, что немцы собрали как минимум 27 танков. Это также говорит о том, что танков, скорее всего, не миллионы: в противном случае серийный номер едва ли оказался бы двузначным.
Конечно же, враг может расстроить этот план, присваивая танкам случайные многозначные серийные номера. США так и сделали в 1981 году: Военно-морской флот дал своему элитному контртеррористическому подразделению название «6-й отряд Морских котиков»[#],↲Подробнее: w:6-й отряд Морских котиков. — Прим. пер.↳ чтобы запутать советских разведчиков, подтолкнув их к мысли, что существует ещё как минимум пять других команд[9].↲Чак Фаррер. «Команда Джедаев». Цель отряда Морских котиков: внутренняя история миссии по убийству Усамы бен Ладена. — Нью-Йорк, St. Martinʼs Press, 2011: Loc 594/3898.
Предположив, что числа действительно последовательны, и используя хитроумную байесовскую теорию, можно оценить общее количество танков достаточно надёжно[10].↲Помимо статьи на Википедии есть хорошие обсуждения решения на Statistics Blog и Event Horizon.
Если у вас всего несколько образцов, вычисления становятся немного сложнее[11].↲Проблема в том, что вам нужно выбрать априорное распределение — изначальное предположение о том, насколько вероятно каждое число танков. Обычно просто предполагают, что для всех чисел шансы равны. Однако это предположение нематематично. Идея равной вероятности всех номеров от одного до бесконечности не работает в теории вероятности; говоря формально, она нарушает вторую аксиому Колмогорова.↳ При одном образце, как и в случае с «Землёй до начала времён», лучшая стратегия — взять имеющееся число и удвоить его. Стало быть, «Земель до начала времён» 54 штуки.
Идея в том, что вы скорее всего находитесь где-то в середине диапазона — шанс, что вам попался один из первых или из последних фильмов, весьма невелик.
Всё становится запутаннее
Если применить задачу о немецких танках к людям, то можно утверждать, что наш вид вымрет к 2807 году.
Вот доказательство:
Человечество когда-нибудь вымрет. Предположим, что после этого инопланетяне каким-то образом оживят всех когда-либо живших людей. Они поставят нас в ряд по дате рождения и пронумеруют от 1 до N, а затем разделят на три группы: первые 5%, средние 90% и последние 5%.
Теперь предположим, что инопланетяне спросят каждого человека (который не знает, сколько людей жило после него): «Как вы считаете, в какой вы группе?».
Большинство из них, вероятно, не говорит по-английски, а у тех, кто говорит, будет куча встречных вопросов. Но если по какой-то причине каждый человек ответит, что он в средней группе, 90% из них будут (очевидно) правы. Это верно вне зависимости от того, насколько велико число N.
Таким образом, продолжая доказательство, мы должны предположить, что находимся в средних 90%. Допустим, существовало всего чуть более 100 миллиардов людей, тогда N с 95%-й вероятностью меньше 2,2 триллиона. Предположив, что это не так, мы помещаем себя в 5%-ю группу — а если так скажут все, большинство из них будут неправы.
Более простым языком: среди всех людей прошлого и будущего мы, вероятно, где-то в середине. Как, собственно, и большинство остальных.
Если наше население превысит 9 миллиардов, то получится, что человечество вымрет в течение примерно 800, и не более 16 000 лет.
Такова теорема о конце света.
Стоп, но это же глупо
Почти все, кто слышали об этой теореме, считают, что с ней что-то не так.
Проблема в том, что причины для этого у всех разные. И чем больше изучаешь эту теорему, тем сильнее тянет изменить своё мнение о том, в чём же она неверна.
С тех пор, как её выдвинули в 1983 году, она была предметом тысяч опровергающих статей и тысяч статей, опровергающих эти статьи[14].↲Ник Бостром. Теорема о конце света для начинающих.↳ Консенсуса по поводу ответа нет до сих пор, это как проблема самолёта на конвейере, только хуже.
Что всё это значит для Твиттера?
Давайте предположим, что теорема о конце света истинна, и применим это к Твиттеру. Поскольку сейчас имеется 345 миллиардов твитов, лучший способ угадать общее время жизни Твиттера — предположить, что в нём будет 690 миллиардов твитов.
С учётом текущей скорости в 400 миллионов твитов за день, по этой теореме получаем, что Твиттеру осталось около пяти лет. По ней же с 95%-й вероятностью Твиттер исчезнет в течение 45 лет.
Это, безусловно, звучит обоснованно: при нынешней скорости смены технологий нет причин ожидать, что интернет-сервис останется популярным более чем на 10 или 20 лет.
Но… верна ли сама теорема?
Если мы увидим, что в 2018 году активность Твиттера снизится, будет ли это доказательством правоты теоремы о конце света? И если так, то означает ли это, что человечеству осталось всего несколько веков?
Вероятно, нет. Но это зависит от того, каких статистиков вы спросите.
Что касается положительных моментов: в 2007 году снимать продолжения «Земли до начала времён», похоже, перестали, так что наши шансы избежать именно этого сценария довольно неплохи.