Библиотека Конгресса США сохранит более 170 млрд твитов

Ежедневно пользователи Twitter публикуют в своих микроблогах до 500 тыс. сообщений. Сотрудники Библиотеки Конгресса решили, что эти записи являются отражением жизни современного общества, а значит, их можно приравнять к раритетным изданиям книг, газет, журналов и законодательных актов.
Библиотека Конгресса США сохранит более 170 млрд твитов

В апреле 2010 года Twitter объявил, что каждый публичный твит, опубликованный с момента его создания в 2006 году, будет добавлен в Библиотеку Конгресса. Как сообщает научно-исследовательский центр в Вашингтоне, сотрудники почти закончили сбор и архивацию более 170 млрд сообщений. Уже через 100 лет сегодняшние твиты будут казаться такой же стариной, как и первые книги, выпущенные на американском континенте.

Представители Библиотеки заявили, что общий объем информации составил 133,2 терабайт, так что для поиска одного ключевого слова уже сейчас может понадобиться до 24 часов.

Библиотека уже получила запросы от более чем 400 исследователей, которые хотят полюбоваться на миллиарды твитов. Но это не значит, что воспользоваться этой базой сможет любой. Согласно договору с Twitter, Библиотека предоставит доступ только к публичным твитам, опубликованным более шести месяцев назад, и только «добросовестным ученым», которые не имеют никакого отношения к коммерческим исследованиям.

«Twitter является крупнейшим архивом человеческого поведения, который когда-либо существовал. Мы рады, что можем сотрудничать с Библиотекой Конгресса, чтобы помочь сделать эти данные доступными для исследователей. Мы считаем, что значение социальных данных безгранично, и часто получаем запросы от академических исследователей, занимающихся анализом социальных данных из Twitter», - говорится в заявлении компании Gnip, которая занимается изучением социальных медиа.

Ранее на эту тему:
Сегодня в СМИ
  • Лента новостей
  • Картина дня
Самое читаемое
Загрузка...
Документальный канал