Большие данные: все, что вам необходимо знать

 Большие данные стали горячей темой 2012-го. Что скрывается за шумихой?


В гиперконкурентном мире, вынуждающем соперничающие компании постоянно снижать маржинальность, бизнес рассматривает большие данные как возможность получить абсолютное оружие в борьбе за выживание. Как предсказывает консалтинговая корпорация Deloitte, к концу 2012 г. свыше 90% компаний из списка Fortune 500 будут активно готовить по крайней мере несколько инициатив в области больших данных. Что же такое большие данные и почему о них надо волноваться?

 

1. Что такое большие данные?

 

Так же, как и с облачными технологиями, то, что один человек подразумевает при обсуждении больших данных, совсем не обязательно совпадает с тем, что под этим понимает его собеседник.

 

Самое простое определение


Из названия можно предположить, что термин “большие данные” относится просто к управлению и анализу больших объемов данных. Согласно отчету McKinsey Institute “Большие данные: новый рубеж для инноваций, конкуренции и производительности” ( Big data: The next frontier for innovation, competition and productivity), термин “большие данные” относится к наборам данных, размер которых превосходит возможности типичных баз данных (БД) по занесению, хранению, управлению и анализу информации. И мировые репозитарии данных, безусловно, продолжают расти. В представленном в середине 2011 г. отчете аналитической компании IDC “Исследование цифровой вселенной” ( Digital Universe Study), подготовку которого спонсировала компания EMC, предсказывалось, что общий мировой объем созданных и реплицированных данных в 2011-м может составить около 1,8 зеттабайта (1,8 трлн. гигабайт) — примерно в 9 раз больше того, что было создано в 2006-м.

 

Более сложное определение

 

Тем не менее “большие данные” предполагают нечто большее, чем просто анализ огромных объемов информации. Проблема не в том, что организации создают огромные объемы данных, а в том, что бóльшая их часть представлена в формате, плохо соответствующем традиционному структурированному формату БД, — это веб-журналы, видеозаписи, текстовые документы, машинный код или, например, геопространственные данные. Всё это хранится во множестве разнообразных хранилищ, иногда даже за пределами организации. В результате корпорации могут иметь доступ к огромному объему своих данных и не иметь необходимых инструментов, чтобы установить взаимосвязи между этими данными и сделать на их основе значимые выводы. Добавьте сюда то обстоятельство, что данные сейчас обновляются все чаще и чаще, и вы получите ситуацию, в которой традиционные методы анализа информации не могут угнаться за огромными объемами постоянно обновляемых данных, что в итоге и открывает дорогу технологиям больших данных.


Наилучшее определение

 

В сущности понятие больших данных подразумевает работу с информацией огромного объема и разнообразного состава, весьма часто обновляемой и находящейся в разных источниках в целях увеличения эффективности работы, создания новых продуктов и повышения конкурентоспособности. Консалтинговая компания Forrester дает краткую формулировку: “Большие данные объединяют техники и технологии, которые извлекают смысл из данных на экстремальном пределе практичности”.

 

https://www.pcweek.ru/idea/article/detail.php?ID=141962

18 ноября 2014 Просмотров: 4 380