Számítástechnika
sulaki - 2017-04-06
Sokat hallunk a Big Data fogalomról
Sokat hallunk a Big Data fogalomról, és mint minden felkapott témában, ezzel kapcsolatban is terjednek már tévhitek, anélkül, hogy megfelelő ismerettel rendelkeznénk arról, hogy pontosan mit jelent, mit szabad és mit lehet vele kezdeni?Nem segít a helyzeten az sem, hogy nemrég jelentették be az USA-ban, hogy már csak Donald Trump elnök aláírására vár az a javaslat, amelynek értelmében a tengerentúli internetszolgáltatók a jövőben az ügyfelek engedélye nélkül is felhasználhatják és akár tovább is adhatják előfizetőik személyes adatait, amelyből kiderülnek a szokásaik, például a böngészési előzményeik. Amennyiben ezt engedélyezik, „a tudás hatalom” elve alapján, egyes vállalkozások erős piaci előnyre tehetnek szert.
Első lépésként célszerű tisztázni a Big Data fogalmát, mivel egyre több olyan nyilatkozatot hallani, amely arra enged következtetni, hogy nem jól használjuk ezt a fogalmat. Big Data-ként akkor tudunk egy adathalmazra tekinteni, amennyiben három kritériumnak együttesen megfelel:
1. nagyon nagy adatmennyiségről van szó,
2. szerkezetében is nagyon változatos adatokat tartalmaz,
3. nagyon gyorsan szükséges feldolgozni.
Amennyiben a fenti kritériumok közül bármelyiknek nem felel meg az adathalmaz, (pl.: homogén szerkezetű adathalmazról van szó), akkor Small Data-val van dolgunk (még ha a mennyiség alapján furcsán is hat az elnevezés). Ha ilyen aspektusból közelítünk a Big Data-hoz és tekintetbe vesszük, hogy a gyors feldolgozás során csak arra keressük a választ, hogy mi történik és nem arra, hogy miért, akkor könnyen belátható, hogy a Big Data szempontjából az egyén és személyes jellemzői nem feltétlenül fontosak. Például a közlekedés szervezési célú feldolgozás esetén a lényeg az, hogy most hol van dugó kialakulóban (hogy elterelhetők legyenek a járművek alternatív útvonalra), nem pedig az, hogy miért alakul ki.
Könnyen belátható, hogy Big Data szempontból az adatvédelmi szabályok sok esetben kevésbé fontosak, ebből adódóan a KÜRT véleménye szerint az adatvédelem túlszabályozott terület, napjainkban is egyre-másra jelennek meg a „német mérnöki alapossággal” minden területet szabályozni (az „embereket” megvédeni) kívánó jogszabályok. Szemben – a demokrácia bölcsőjének tekintett – Amerika pedig most pont a másik végletet mutatja, hiszen az adatok üzleti célú felhasználásának (Big Data feldolgozások, elemzések) területén mutatkoznak engedékenynek, amely során európai gondolkodással sok kérdés vetődik fel. Az európai szabályozás alapján semmilyen adat nem tárolható, dolgozható fel, ami az adat tulajdonos (adatgazda) személyéhez köthető, az ő külön engedélye nélkül; Amerikában pont a fordított elv érvényesül, ha nem tiltom meg, akkor szabadon használható.
Így minden adatunkat jogilag elzárjuk a lehetséges feldolgozástól (hiszen a smart eszközök világában legfeljebb három-négy kapcsolatot kell végigkövetni, hogy beazonosítható legyen a személy), azaz elveszítjük annak lehetőségét, hogy kapjunk egy üzenetet a járművünk fedélzeti eszközére, miszerint előttünk dugó van/lesz, amely alternatív útvonalon így kerülhető ki. Mi fog történni? Természetesen hozzá fogunk járulni a személyes adataink kezeléséhez, így pusztán egy újabb adminisztratív feladathalmazzal fogunk szembesülni, mi, akik szeretnénk élni a smart eszközeink nyújtotta kényelemmel (hiszen ezért vásároltuk). Az új szabályozás szerint mindenkinek személyesen kell meghoznia azt a döntését, hogy akar-e a továbbiakban is részesülni a már megszokott kényelmi szolgáltatásokból. Természetesen az adatkezelőknek is dönteniük kell, hogy az eddigi szolgáltatásokat a megnövekedett adminisztrációs, kommunikációs, biztonsági és jelentési terhek mellett fenn tudja-e tartani a jelenlegi színvonalon, illetve elképzelhető, hogy eddig ingyenesen rendelkezésünkre álló szolgáltatásokért a fenntarthatóság érdekében díjat kell szednie.
Minden szereplőnek újra kell gondolnia az érdekeit, a lehetőségeit és ennek megfelelően kell rendeznie a kapcsolatait adatkezelés, adatvédelem tekintetében. Ugyanakkor a világ fejlődik, a Big Data feldolgozást végző algoritmusok egyre okosabbak, egyre több mindenben segítik a mindennapi életünket, ha nem tudják megtanulni a mi szokásainkat, azzal nem csak az
Első lépésként célszerű tisztázni a Big Data fogalmát, mivel egyre több olyan nyilatkozatot hallani, amely arra enged következtetni, hogy nem jól használjuk ezt a fogalmat. Big Data-ként akkor tudunk egy adathalmazra tekinteni, amennyiben három kritériumnak együttesen megfelel:
1. nagyon nagy adatmennyiségről van szó,
2. szerkezetében is nagyon változatos adatokat tartalmaz,
3. nagyon gyorsan szükséges feldolgozni.
Amennyiben a fenti kritériumok közül bármelyiknek nem felel meg az adathalmaz, (pl.: homogén szerkezetű adathalmazról van szó), akkor Small Data-val van dolgunk (még ha a mennyiség alapján furcsán is hat az elnevezés). Ha ilyen aspektusból közelítünk a Big Data-hoz és tekintetbe vesszük, hogy a gyors feldolgozás során csak arra keressük a választ, hogy mi történik és nem arra, hogy miért, akkor könnyen belátható, hogy a Big Data szempontjából az egyén és személyes jellemzői nem feltétlenül fontosak. Például a közlekedés szervezési célú feldolgozás esetén a lényeg az, hogy most hol van dugó kialakulóban (hogy elterelhetők legyenek a járművek alternatív útvonalra), nem pedig az, hogy miért alakul ki.
Könnyen belátható, hogy Big Data szempontból az adatvédelmi szabályok sok esetben kevésbé fontosak, ebből adódóan a KÜRT véleménye szerint az adatvédelem túlszabályozott terület, napjainkban is egyre-másra jelennek meg a „német mérnöki alapossággal” minden területet szabályozni (az „embereket” megvédeni) kívánó jogszabályok. Szemben – a demokrácia bölcsőjének tekintett – Amerika pedig most pont a másik végletet mutatja, hiszen az adatok üzleti célú felhasználásának (Big Data feldolgozások, elemzések) területén mutatkoznak engedékenynek, amely során európai gondolkodással sok kérdés vetődik fel. Az európai szabályozás alapján semmilyen adat nem tárolható, dolgozható fel, ami az adat tulajdonos (adatgazda) személyéhez köthető, az ő külön engedélye nélkül; Amerikában pont a fordított elv érvényesül, ha nem tiltom meg, akkor szabadon használható.
Így minden adatunkat jogilag elzárjuk a lehetséges feldolgozástól (hiszen a smart eszközök világában legfeljebb három-négy kapcsolatot kell végigkövetni, hogy beazonosítható legyen a személy), azaz elveszítjük annak lehetőségét, hogy kapjunk egy üzenetet a járművünk fedélzeti eszközére, miszerint előttünk dugó van/lesz, amely alternatív útvonalon így kerülhető ki. Mi fog történni? Természetesen hozzá fogunk járulni a személyes adataink kezeléséhez, így pusztán egy újabb adminisztratív feladathalmazzal fogunk szembesülni, mi, akik szeretnénk élni a smart eszközeink nyújtotta kényelemmel (hiszen ezért vásároltuk). Az új szabályozás szerint mindenkinek személyesen kell meghoznia azt a döntését, hogy akar-e a továbbiakban is részesülni a már megszokott kényelmi szolgáltatásokból. Természetesen az adatkezelőknek is dönteniük kell, hogy az eddigi szolgáltatásokat a megnövekedett adminisztrációs, kommunikációs, biztonsági és jelentési terhek mellett fenn tudja-e tartani a jelenlegi színvonalon, illetve elképzelhető, hogy eddig ingyenesen rendelkezésünkre álló szolgáltatásokért a fenntarthatóság érdekében díjat kell szednie.
Minden szereplőnek újra kell gondolnia az érdekeit, a lehetőségeit és ennek megfelelően kell rendeznie a kapcsolatait adatkezelés, adatvédelem tekintetében. Ugyanakkor a világ fejlődik, a Big Data feldolgozást végző algoritmusok egyre okosabbak, egyre több mindenben segítik a mindennapi életünket, ha nem tudják megtanulni a mi szokásainkat, azzal nem csak az
algoritmus
lesz kevesebb, hanem mi is veszíthetünk. Nagyon lényeges megértenünk, hogy egy Big Data elemzéssel foglalkozó kutató/elemző más szemmel látja a világot. Őt nem a születési dátum érdekli, hanem inkább például az, hogy az 55 év feletti emberek milyen rendszerességgel látogatnak meg árvíztűrő tükörfúrógépet forgalmazó oldalakat és mennyi lesz belőlük vásárló Simagöröngyös 60 km-es körzetén belül, mert esetleg érdemes akkor oda gyárat vagy logisztikai bázist építeni. Esetleg arra kíváncsi, hogy adott iskola diákjai közül hányan laknak az iskolától 800 méterre, akiket járművel szállítanak minden nap, ide akkor érdemes lenne kerékpárutat építeni és egy dugóval kevesebb lesz a településen. Szóval ők azok, akik képesek meglátni az óriáskígyóban az elefántot. Érdemes odafigyelni az általuk professzionális módszerekkel készített folyamatos, dinamikus elemzésekre, hogy jobbá tehessük a világot, nem biztos, hogy tőlük kell féltenünk az adatainkat.