Отвечаем на ваши гипотетические вопросы с точки зрения физики

Высота ленты Твиттера

Оригинал: Twitter Timeline Height

Если наши ленты сообщений в Твиттере (твиты людей, на которых мы подписаны) смогут выходить за пределы экрана в обоих направлениях, насколько высокими они станут?

— Аноним

Погодите, в пикселях или в пунктах?

Это на удивление заковыристый вопрос. Ответ включает в себя немецкие танки, вымирание человечества и самую обсуждаемую в Интернете проблему статистики.

Но сначала о Твиттере.

Огромное количество твитов

Очевидно, что ответ зависит от того, на кого вы подписаны. Некоторые люди твитят гораздо чаще других.

Джеф Жак (@JephJacques), автор Questionable Content, твитит очень много. Его вклад в вашу ленту сообщений составит 36 000 твитов и будет расти. С другой стороны, если вы подписаны на людей, которые твитят нечасто, вся ваша лента, возможно, поместится на одном экране.

Согласно анализу Диего Баша, в прошлом году «средний» аккаунт Твиттера был подписан на 51 человека и опубликовал 307 сообщений[1].Диего Баш. Немного свежей статистики Твиттера (за июль 2012, набор данных включён). (Набор данных не включён.) Но средние величины могут быть обманчивы[2]:Если Ларри Эллисон, заработавший 96 миллионов долларов в прошлом году, переедет в обычный городок с населением в 3 000 человек, средний доход в этом городке мигом удвоится. большинство аккаунтов Твиттера имеют единственного подписчика, а то и вовсе не писали сообщений.

Чтобы получить представление о типичной ленте сообщений, я попросил нескольких друзей сделать скриншоты своих домашних страниц в Твиттере и посчитать текущее число твитов. Разброс результатов оказался весьма широк: у кого-то вышло 20 твитов в минуту, а у кого-то — 20 твитов в месяц.

С учётом поправки[3]Умножения на случайное число от 0,5 до 1. на время суток и экстраполяции[4]Заполнения таблиц числами до тех пор, пока не закончатся столбцы. в прошлое на основании темпа роста Твиттера, получаем гипотезу, что некоторые ленты содержат сейчас сотни твитов, а некоторые — миллионы.

На мониторе моего компьютера среднестатистический твит занимает 2,4 сантиметра[5].Источник: сам только что померил. Вы тоже можете измерить, но вам придётся использовать свой компьютер вместо моего. На своём я сейчас печатаю, и мне нужно видеть экран. Таким образом, башня твитов Джефа Жака имеет где-то 900 метров в высоту (это выше самого высокого здания) и продолжает расти.

Однако Джеф не идёт ни в какое сравнение с @YOUGAKUDAN_00, который твитит много раз в минуту — обычно в двоичном коде, но иногда и словами. У @YOUGAKUDAN_00 накопилось 37 миллионов твитов; этого достаточно, чтобы достичь околоземной орбиты.

Применяя оценку Диего за июль 2012 года к текущему количеству твитов в день, приходим к предположению, что на октябрь 2013 года общее число твитов — около 345 миллиардов. Это означает, что если вы подпишетесь на всех пользователей Твиттера, то высота вашей ленты составит восемь миллионов километров. Сравните: вот Земля, а рядом с ней ваша лента:

Видите эту беленькую линию? Это Твиттер. Каждый фальшивый аккаунт, каждый «пьяный» твит, каждый дурацкий или расистский хэштег…

Впрочем… это же только нижняя часть ленты сообщений. А как насчёт всей ленты?

Ошибка в клиенте Твиттера позволяет при прокрутке ленты вниз на мгновение увидеть ещё не опубликованные твиты.

Когда-нибудь последний человек, на которого вы подписаны, твитнет последний раз. Когда это случится?

Будущее

На самом деле, наши ленты даже и близко не столь высоки, как небоскрёбы, поскольку Твиттер ограничивает количество старых твитов, доступных при пролистывании. Однако можем ли мы оценить, насколько высокими могли бы стать наши ленты в итоге?

Ввиду продолжительности жизни человека, большинство аккаунтов, на которые вы подписаны, вероятно, прекратят твитить в течение века. С другой стороны, аккаунты вроде @big_ben_clock могут существовать тысячелетиями.

Но продержится ли так долго сам Твиттер?

Наверняка, конечно, сказать нельзя, но в статистике существует занятный подход, который может нам помочь[6].Предскажите гибель Твиттера с одной дурацкой подсказки!

А может быть и нет. Смотря кого спросить.

Задача о немецких танках

Допустим, вы перенеслись в параллельную вселенную. Вы открываете IMDb, грузите случайную страницу, и натыкаетесь на фильм «Земля до начала времён XXVII»[7].27.

Если судить только по названию, сколько, по-вашему, в этой вселенной фильмов «Земля до начала времён»? Очевидно, что как минимум 27, а вероятно, и больше.

Во время Второй мировой войны с вариантом этой задачи столкнулись войска антигитлеровской коалиции[8].(Фашисты завалили их продолжениями «Земли до начала времён».) У деталей немецких танков были серийные номера, многие из которых шли последовательно (1, 2, …, N). Предположим, что был захвачен случайный танк. Если установить, что это танк № 27, то можно быть уверенным, что немцы собрали как минимум 27 танков. Это также говорит о том, что танков, скорее всего, не миллионы: в противном случае серийный номер едва ли оказался бы двузначным.

Конечно же, враг может расстроить этот план, присваивая танкам случайные многозначные серийные номера. США так и сделали в 1981 году: Военно-морской флот дал своему элитному контртеррористическому подразделению название «6-й отряд Морских котиков»[#],Подробнее: w:6-й отряд Морских котиков. — Прим. пер. чтобы запутать советских разведчиков, подтолкнув их к мысли, что существует ещё как минимум пять других команд[9].Чак Фаррер. «Команда Джедаев». Цель отряда Морских котиков: внутренняя история миссии по убийству Усамы бен Ладена. — Нью-Йорк, St. Martinʼs Press, 2011: Loc 594/3898.

Предположив, что числа действительно последовательны, и используя хитроумную байесовскую теорию, можно оценить общее количество танков достаточно надёжно[10].Помимо статьи на Википедии есть хорошие обсуждения решения на Statistics Blog и Event Horizon.

Если у вас всего несколько образцов, вычисления становятся немного сложнее[11].Проблема в том, что вам нужно выбрать априорное распределение — изначальное предположение о том, насколько вероятно каждое число танков. Обычно просто предполагают, что для всех чисел шансы равны. Однако это предположение нематематично. Идея равной вероятности всех номеров от одного до бесконечности не работает в теории вероятности; говоря формально, она нарушает вторую аксиому Колмогорова. При одном образце, как и в случае с «Землёй до начала времён», лучшая стратегия — взять имеющееся число и удвоить его. Стало быть, «Земель до начала времён» 54 штуки.

Идея в том, что вы скорее всего находитесь где-то в середине диапазона — шанс, что вам попался один из первых или из последних фильмов, весьма невелик.

Всё становится запутаннее

Если применить задачу о немецких танках к людям, то можно утверждать, что наш вид вымрет к 2807 году.

Вот доказательство:

Человечество когда-нибудь вымрет. Предположим, что после этого инопланетяне каким-то образом оживят всех когда-либо живших людей. Они поставят нас в ряд по дате рождения и пронумеруют от 1 до N, а затем разделят на три группы: первые 5%, средние 90% и последние 5%.

Зачем вы это делаете?

Теперь предположим, что инопланетяне спросят каждого человека (который не знает, сколько людей жило после него): «Как вы считаете, в какой вы группе?».

 

Большинство из них, вероятно, не говорит по-английски, а у тех, кто говорит, будет куча встречных вопросов. Но если по какой-то причине каждый человек ответит, что он в средней группе, 90% из них будут (очевидно) правы. Это верно вне зависимости от того, насколько велико число N.

 

Таким образом, продолжая доказательство, мы должны предположить, что находимся в средних 90%. Допустим, существовало всего чуть более 100 миллиардов людей, тогда N с 95%-й вероятностью меньше 2,2 триллиона. Предположив, что это не так, мы помещаем себя в 5%-ю группу — а если так скажут все, большинство из них будут неправы.

 

Более простым языком: среди всех людей прошлого и будущего мы, вероятно, где-то в середине. Как, собственно, и большинство остальных.

 

Если наше население превысит 9 миллиардов, то получится, что человечество вымрет в течение примерно 800, и не более 16 000 лет.

Такова теорема о конце света.

Стоп, но это же глупо

Почти все, кто слышали об этой теореме, считают, что с ней что-то не так.

Проблема в том, что причины для этого у всех разные. И чем больше изучаешь эту теорему, тем сильнее тянет изменить своё мнение о том, в чём же она неверна.

С тех пор, как её выдвинули в 1983 году, она была предметом тысяч опровергающих статей и тысяч статей, опровергающих эти статьи[14].Ник Бостром. Теорема о конце света для начинающих. Консенсуса по поводу ответа нет до сих пор, это как проблема самолёта на конвейере, только хуже.

Что всё это значит для Твиттера?

Давайте предположим, что теорема о конце света истинна, и применим это к Твиттеру. Поскольку сейчас имеется 345 миллиардов твитов, лучший способ угадать общее время жизни Твиттера — предположить, что в нём будет 690 миллиардов твитов.

С учётом текущей скорости в 400 миллионов твитов за день, по этой теореме получаем, что Твиттеру осталось около пяти лет. По ней же с 95%-й вероятностью Твиттер исчезнет в течение 45 лет.

Это, безусловно, звучит обоснованно: при нынешней скорости смены технологий нет причин ожидать, что интернет-сервис останется популярным более чем на 10 или 20 лет.

Но… верна ли сама теорема?

Третий вариант ответа однозначно верен.

Если мы увидим, что в 2018 году активность Твиттера снизится, будет ли это доказательством правоты теоремы о конце света? И если так, то означает ли это, что человечеству осталось всего несколько веков?

Вероятно, нет. Но это зависит от того, каких статистиков вы спросите.

Что касается положительных моментов: в 2007 году снимать продолжения «Земли до начала времён», похоже, перестали, так что наши шансы избежать именно этого сценария довольно неплохи.

«Земля до начала времён XX» Томми Уайзо по праву считается худшей в серии.