Что такое Big Data простым языком?

BigData, Big Data, большие данные - маркетинговый термин, собирательный образ, за которым стоят десятки технологий и сотни продуктов. Аааа....

​свежий Big Data &amp; Ai Landscape 2019 Источник картинки: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fmattturck.com%2Fdata2019%2F&postId=86791" rel="nofollow noreferrer noopener" target="_blank">https://mattturck.com/data2019/</a>
​свежий Big Data & Ai Landscape 2019 Источник картинки: https://mattturck.com/data2019/

Ключевое отличие Больших Данных от традиционных и привычных:

- структурированных - базы данных от простой таблички и реестра до многомерных, многовекторных, реляционных, иерархических, сетевых, объектных и т.п и даже огромных по размеру

- или неструктурированных - тексты, схемы, карты, фотографии и изображения, звуки, наборы текстов-схем-карт и т.п, «файловые помойки» на гигантских хранилищах;

так вот ключевое отличие - это способность быстро (БЫСТРО) накапливать, обрабатывать большие (БОЛЬШИЕ) объёмы (обычно говорят о гигабайтах и сотнях гигабайт в СЕКУНДУ), многообразных данных (т.е всех перечисленных выше и других).

Гигабайт в секунду - это много. Очень. Это к примеру 200 песен которые загрузятся и прозвучат за 1сек и автоматически будут откатегоризованы например по жанру или разложены по инструментам или распознаны по вокалистам, или 1000 книг по 200стр загруженных и прочитанных с целью поиска информации или составления эссе за 1сек.

Что важно, Большие Данные это не только хранение. Это сбор, обработка, представление. Хорошее определение Больших Данных дано в википедии .

Большие данные умерли в 2015г по заявлению Gartner. Сейчас есть мнение, что большие данные - это зло. Добро - Умные Большие Данные - Smart Big Data. То есть когда к трем уже привычным V (объём, скорость, разнообразность) добавляются две умные V (ценность и релевантность). И да, сейчас уже не отделяют Big Data от Ai (искусственного интеллекта), так как последний без данных вообще не работает, а первые без ИИ не собрать ни накопить не обработать.

От  Больших Данных к Умным Большим Данным​ Leonid Golovin
От  Больших Данных к Умным Большим Данным​ Leonid Golovin

Хорошая книга про Большие Данные от русского гуру вопроса:

​Big data простым языком Алексей Благирев, Наталья Хапаева 
​Big data простым языком Алексей Благирев, Наталья Хапаева 
Начать дискуссию