Olvasási idő: 2 perc
Annak apropóján írom e szösszenetet, hogy könyvünk (Business value in an ocean of data) e-book formában is megjelent. Ezt a formát elsősorban azok kedvéért hoztuk létre, akik tanulmányaikhoz szerették volna elérni a kiadványt, illetve több ügyfelünk is jelezte, szívesebben ismerné meg a digitális változatból a BI, az adatbányászat alkalmazását az üzleti gyakorlatban.
Miközben azonban e 2013-ban íródott könyvünk e-lapjait forgattam, felmerült bennem, hogy vajon mennyire lehet jó alap a tanuláshoz vagy üzleti ötletek kereséséhez egy adatelemzéssel foglalkozó könyv, amiben nem szerepel a big data fogalma. Hiszen mostanában a csapból is a big data buzzword folyik. Több nagyvállalati ügyfelünk is küzd az igazi nagy adatokkal kapcsolatos business case-ek kialakításával és implementációjával. De még nem láttunk igazi üzleti áttörést, ahol a gépek által generált adatokat komoly megtérüléssé fordíthatták volna.
Így hát, hogy megtudjam, mennyire vagyok őskövület vagy mennyire igazodok az idők szavához, beiratkoztam pár big data tanfolyamra. Ezeken szépen elmagyarázzák, hogy mennyi adat van; hogy azokat jól elő kell készíteni, tisztogatni, megelemezni, vizualizálni és végül riportokat készíteni a kapott eredményből. Mellesleg pedig megismertetnek fantasztikus új eszközökkel: Hadoop, Spark, Hive, meg még húsz másik. Sőt, példaként meg is mutatják, hogyan kell ezeket parancssorból meghívni.
Ügyfeleinknél vannak big data-val asszociált, elosztott technológiával megkezdett próbálkozások, de ezek legtöbbje egyelőre az IT játékszerei, észlelhető üzleti cél nélkül, és jelenleg elsősorban az infrastruktúra kialakításánál tartanak. Bőgel Györgyöt, a CEU professzorát idézve inkább adattemetők, mint adatbányák. Van olyan szupernagy cég, amelyik 3 havonta cseréli le még újabbra az adatfeldolgozó eszközét.
Ezen közben buzzword-ök nélkül napi gyakorlattá vált a hagyományosabb relációs adatbázisokon végezhető, tranzakció alapú elemzés: csalásfelderítésben, CRM-ben jelentős üzleti sikereket látunk. Érdekes módon még az online pénztárgépek adatai is feldolgozhatóak ésszerű idő alatt a kiforrott adatbázis-kezelőkkel.
Az utóbbi év leglátványosabb eredményeként értékelem, hogy több olyan vizualizációs és dashboard projektekre kérnek fel bennünket, amelyekben valóban adatalapú döntésekre nyílik esély. Átütő hatásokat érzékelünk több iparágban, cégvezetői, államtitkári szinteken.
Ezek után úgy döntöttem, még nem nyilvánítom magamat fosszíliának, inkább levontam a tanulságokat:
- Az első tanulság az, hogy a könyvünkben épp azokról a kiforrott módszerekről meséltünk mélységében, amit adatbányász- adattárház építési tevékenységünk során végeztünk, és ma ezeket big data címkével látnák el.
- A másik tanulság, hogy a big data technológiák nagyon messze vannak még a letisztultságtól – nekem a céhes világot juttatja eszembe – , ami tömeges üzleti hasznot hozó alkalmazhatóságuk korlátja. Két eset lehetséges: vagy valamelyikük integrálja és felhasználóbaráttá teszi a palettát, vagy pár hagyományos szoftverszállító (pl. IBM, Microsoft, Oracle, SAS) addig vásárol és/vagy fejleszt, hogy szinte észre sem vesszük, hogy más skálájú adatot dolgoztunk fel.
Addig is a magyar ugaron még nem találkoztunk akkora adattal, amit ne lehetett volna agymunkával, ésszerű üzleti-technikai kompromisszummal és kiforrott adatbázis-kezelővel, a könyvünkben leírt módszerekkel hasznosítani.
A lehetőségeket persze mi is örömmel várjuk, és ha a feladat úgy kívánja, hadrendben állítjuk minden big data tudásunkat, amelyet a korábbi munkáink során megszereztünk.
A Hiflylabs üzleti értéket nyer ki az adatokból. A csapat magja jó 15 éve dolgozik ezen, ma már több mint 50 lelkes munkatárssal együtt.
Teljesen jól látod a helyzetet a “Big Data” hype-olását illeti, illetve az “igazi” elosztott rendszerekre épülő analitikai megoldások eddig realizált üzleti hasznát illeti.
Én két alapvető problémát látok.
Az egyik abból a fogalmi zavarból adódik, hogy sokan a “Big Data” kifejezést használják már minden analitikai problémára, amit nem lehet egy számológéppel megoldani. Tipikusan az e-commerce és a CRM területen az ügyfelek beazonosítása és a viselkedés- vagy tranzakció alapú adatok ügyfélprofilhoz rendelése önmagában rengeteg üzleti előnyt hozhat, ahol az adatfeldolgozásnak nem kell feltétlenül elosztott rendszerűnek lennie.
A másik a magyar ill. európai szabályozási környezet, ill. az ebből adódó jogi/compliance óvatosság (ami természetesen nem alaptalan így szűk 1 évvel a GDPR életbe lépése előtt). A Big Data rendszerekkel feldolgozható részletezettségű – ügyfelekhez köthető – adatok eddig sok helyen nem is voltak elérhetőek az elemzéssel foglalkozó szakemberek számára emiatt. Innentől ez igazi tyúk-tojás probléma. Amíg az adat nem rendelhető legalább ügyfélszegmenshez, valós üzleti hasznot nehezen fog hozni, amíg nem hoz üzleti hasznot, addig meg a cégvezetők sem látják meg benne az igazi potenciált.
Ahol szerintem a most ismert Big Data technológiák áttörést tudtak, és fognak tudni elérni, az az ipari (IoT) felhasználás, illetve a kép/hang/video feldolgozás, ahol a nagy adatmennyiség adott és az eddigi technikai lehetőségek nem tették lehetővé a gépi tanulás vagy mesterséges intelligencia olyan alkalmazását, amit a végfelhasználók közvetlenül érzékelnének pl. a mobiltelefonjuk használata során.
p.s.: a következő poszt esetleg helyretehetné az ugyancsak félreértelmezett “machine learning” fogalmát is. Nagy szükség lenne rá…