Корпорация EMC опубликовала результаты седьмого ежегодного исследования “Цифровая вселенная”, который является единственным в мире проектом по количественной оценке и прогнозированию роста объемов данных. Над этим проектом работают специалисты IDC. Исследование этого года называется “Цифровая вселенная возможностей: многообразие данных в Интернете вещей” опубликовано на сайте EMC.
 
Приводятся такие примеры: если сегодня кому-нибудь придет в голову записать в iPad Air весь объем информации цифровой вселенной, то понадобится батарея планшетов длиной 253 704 км (2/3 расстояния до Луны). А к 2020 году не хватит и шести таких батарей. Также отмечается, что сегодня каждое домохозяйство создает объем данных, достаточный для заполнения памяти 65 телефонов iPhone. К 2020 году этот объем будет заполнять уже 318 телефонов iPhone.
 
Если для наглядности представить один байт данных как кастрюлю с водой (емкостью в 3,7 литра), то на данный момент создаваемые за 10 секунд данные могут полностью “залить” средних размеров дом. В уже в 2020 году на это понадобится всего лишь 2 секунды.
 
В последние годы активную роль в росте объема данных играют “генераторы информации”, а именно беспроводные технологии, смарт-устройства и программно-определяемые предприятия, — об этом сообщают аналитики. Объем цифровой вселенной каждые два года расширяется в два раза. Ученые прогнозируют, что за период между 2013 и 2020 годами количество информации увеличится десятикратно — с 4,4 триллионов Гбайт до 44 триллионов. Если в 2013 году объем “цифровой вселенной” составлял 4,4 зетабайта, то к 2020 году объем цифровой вселенной вырастет до 44 зетабайт.
 
По оценкам экспертов, в 2020 году именно на “интернет вещей” будет приходиться 10% всего объема “цифровой вселенной”, а количество подключенных устройств возрастет до 32 млрд. С одной стороны, это процент сравнительно небольшой. Но с другой — это приблизительно равно объему “цифровой вселенной” в 2013 году. На данный момент, говорится в исследовании, количество устройств и предметов, которые можно подключить к интернету, приближается к 200 млрд, из которых 7% (14 млрд) уже передают через мировую сеть данные. Сейчас данные от таких устройств составляют 2% от объема информации, генерируемого во всем мире.
 
В настоящий момент 60% данных в “цифровой вселенной” приходится на развитые рынки (Германия, Япония и США), но к 2020 году соотношение поменяется, и те же 60% данных будут генерировать страны развивающиеся, в том числе и Россия.
 
Изменяется удельная доля"полезных данных“, то есть данных, пригодных для анализа. В 2013 году в эту категорию попадало только 22% информации, а фактически анализировалось всего 5% данных — остальные массивы превращались в “космический мусор”. К 2020 году, благодаря развитию “интернета вещей”, более 35% данных будут считаться полезными, однако эффективность использования этой информации будет зависеть от предприятий.
 
В ближайшие 5 лет усугубиться проблема с хранением, обработкой и защитой больших объемов данных. По оценке IDC только 40% данных в цифровой вселенной нуждаются в различных мерах защиты. Но на настоящий момент фактически защищена только половина таких данных.
 
Еще одна проблема заключается в том, что рост объемов данных значительно опережает рост емкости систем хранения. Так, в 2013 году совокупная доступная емкость соответствовала всего 33% объема цифровой вселенной, а к 2020 году ее будет достаточно для хранения менее чем 15%. Ситуацию несколько спасает то, что большая часть данных “цифровой вселенной” является потоковой не требующей длительного хранения информацией (производимой сервисами Netflix или Hulu, а также игровыми приложениями (например, Xbox ONE) и цифровым телевидением в целом.
 
“По большому счету, сейчас мы даже не можем себе представить, каким на самом деле будет мир, когда мы научимся работать с большими объемами данных (в том числе с использованием технологий big data) в режиме реального времени, — комментирует Камиль Исаев, вице-президент, ЕМС Россия и СНГ. — Когда интернет только начинался, никто не мог представить себе, что на свете будет существовать, например, e-commerce. Так и с большими данными — мы пока не знаем точно, какие реальные возможности они несут”.