A „Big Data” kifejezés szó szerint adattömeget jelent. A fogalom bővített köre azt a komplex technológiai környezetet (szoftvert, hardvert, hálózati modelleket) is magába foglalja, amelyek lehetővé teszik olyan adatállományok feldolgozását, amelyek annyira nagy méretűek és annyira komplexek, hogy feldolgozásuk a meglévő adatbázis-kezelő eszközökkel nem oldható meg. Mivel ezek az adatok túl nagy méretűek vagy túl összetettek, a big data új technikák, eszközök, illetve technológiák kifejlesztésére teremtett igényt.
A big data olyan adathalmazokat jelent, amelyek nagyon nagy mennyiségű adatot tartalmaznak, és az adatok szerkezetükben is nagyon változatosak. A változó adatokat folyamatosan (általában automatikusan) gyűjtik és tárolják, illetve nagyon gyorsan feldolgozzák őket.
Közérthető példák a big datára: A New York-i tőzsdén naponta körülbelül 1 terabájtnyi új kereskedelmi adat születik, míg a Facebookon naponta 4 petabájtnyi (4096 terabájtnyi) új adat jön létre. Utóbbiak főképp fotó- és videófeltöltések, üzenetváltások és bejegyzések által születnek.
A big datát információóceánnak is szokták nevezni. Az információk bármilyen forrásból származhatnak, amelyet képesek vagyunk digitálisan figyelni (pl. időjárási műholdak, Internet of Things (IoT) eszközök, forgalmi és térfigyelő kamerák, közösségimédia-trendek stb.). Az adatokat az adatgyűjtő szervezetek többek között döntéseikhez, a folyamatok és az irányelvek javításához, valamint az ügyfélközpontú termékek, szolgáltatások és élmények létrehozásához használják fel.
A feldolgozásra összegyűjtött adatok lehetnek strukturált, félig strukturált vagy strukturálatlan adatok. Strukturáltnak olyan adathalmazt neveznek, amelyben előre definiált sémában, meghatározott megkötések mentén vannak tárolva az adatok. Hagyományosan sorokban és oszlopokban rögzítettek, könnyen kereshetők: ilyenek például az Excel-táblázatokban található adatok. A félig strukturált adatoknak olyan tulajdonságaik vannak, amelyek megkönnyítik az elemzést, az információk hierarchiába rendezhetők. Ilyen például egy webáruház, amely minden termékről ismétlődő struktúrában tárol adatokat. Ennek segítségével az adatokat gyorsan és könnyen egy strukturált adatbázisba rendezhetjük. Strukturálatlanok azok az adatok, amelyekhez semmiféle struktúra nem kapcsolódik. Ilyenek például az újságcikkek, a blogbejegyzések, a hosszabb szöveges dokumentumok, a képfájlok, az audio- vagy a videofájlok.
Mire jó a big data?
Sok vállalat, szervezet big data adathalmazokat használ fel működése javítására, a jobb ügyfélszolgálat biztosítására, személyre szabott marketing ajánlatok létrehozására és egyéb intézkedésekhez, amelyek növelhetik a bevételüket vagy a nyereségüket. Például a pénzügyi szolgáltató cégek big data rendszereket használnak kockázatkezelésre, a piaci adatok valós idejű elemzésére; vagy a gyártók és a szállítmányozó cégek ellátási láncaik kezelésében és szállítási útvonalaik optimalizálásában. Azok a szervezetek, amelyek az adatokat hatékonyan tudják felhasználni, potenciális versenyelőnyre tesznek szert.
A big data adatok fontos szerepet játszhatnak az előrejelzésekben. A meteorológiához és egyéb klímatudományokhoz kapcsolódó tudományos adatgyűjtések segíthetnek abban, hogy tisztán lássuk a valós veszélyeket. Például a szén-dioxid-kibocsátás mértékének és változásának előrejelzésével a big data segíthet a klímakatasztrófa elkerüléséhez szükséges lépések meghatározásában.
Forrás: Greendex és wikipedia