Powszechna definicja wskazuje cztery cechy, którymi powinien charakteryzować się zbiór nadający się do przetwarzania analizami Big Data: ilość (volume), różnorodność (variety), szybkość tworzenia/pozyskania (velocity), wartość (value). Większość ekspertów i większość firm dostarczających rozwiązania analityczne kładzie nacisk na stronę technologiczną czyli pierwsze trzy cechy. Doskonale to rozumiem. Jestem inżynierem i też czuję skok adrenaliny, gdy widzę np. terabajty danych płynące z ponad 200 czujników wbudowanych w bolid Formuły 1. W myślach zaczynam szukać nowych algorytmów analizy, nowych miejsc, w które można wbudować dodatkowe czujniki, nowych typów danych, które wzbogaciłyby analizy. Wyścig między dostawcami systemu (bo trudno oddzielić czujniki od systemu przechowywania i oprogramowania przetwarzającego dane) rozwija się w tym właśnie wymiarze: więcej. Więcej ilości, więcej różnorodności, więcej szybkości tworzenia.

Z drugiej strony, nie możemy zapominać o wartości, czyli sensie zbierania i przetwarzania tych wszystkich danych. Bo tak naprawdę czy kierowcy bolidu robi jakąkolwiek różnicę fakt, że otrzymuje dane z 200 czujników, a nie z 220? Jego obchodzi wyłącznie trafna wskazówka inżyniera wyścigowego co ma zrobić na nadchodzącym okrążeniu. Czy ma zmniejszyć przełożenie biegów? Obniżyć obroty silnika? Poluzować hamulce? Podobnie nas wszystkich, zasiadających za kółkiem samochodów osobowych, niezbyt interesuje które dane przetwarza system wspierający bezpieczeństwo jazdy. Ważne, że dostajemy wskazówkę jaką odległość utrzymać od innych pojazdów albo jak zaparkować auto (albo czy się w ogóle zmieścimy w wolnym miejscu).

Warta podkreślenia jest również subtelna różnica w momencie, w którym analizy Big Data dostarczają wyniki. Dla inżynierów i osób zarządzających nieco bardziej ważne są wyniki “po fakcie” (iteracyjne), czyli np. po zakończeniu wyścigu, na których można oprzeć planowaną strategię na kolejny wyścig. Dla kierowców z kolei bardziej istotne są wyniki “w locie” (bieżące), bo dzięki nim mogą oni na bieżąco dopasowywać aktualny tryb jazdy — co wpływa na miejsce zajęte na mecie i efekt punktowy dla siebie i dla zespołu. Tworząc oferty dla klientów, można łatwo wpędzić się w ślepą uliczkę, mówiąc długo i entuzjastycznie o ilości danych, a pomijając kwestie wartości — i to tej bieżącej, “dla kierowców”. Pamiętajmy o tym.