Из медиите ни напоследък все по-често се среща терминът „големи данни“ (Big Data). Ето няколко заглавия само от последния месец: „Xeon E7 v2 ускорява анализа на големи данни“, „Големи данни – големи възможности „, „IDC: Анализът на големи данни ще стане реалност и у нас“, „Правни аспекти при управление на данни в Облака и Големи данни“ и дори „Анализът на големи данни предсказа кой ще получи “Оскар”…
Що за пропаганда е това и дали количественото определение в случая не описва нещо качествено различно? Така е, Big Data обобщават в себе си цяло ново поколение технологии, предназначени за работа със стремително нарастващия обем неструктурирана информация, идваща от все по-голям и разнообразен брой източници: оперативни данни, данни за финансови транзакции, данни за поведението на потребителите в социалните мрежи, данни от интернет телефония и видео-стриймове и т.н. Целите на анализа им също могат да са най-различни: от управлението на сложни технологични процеси и поддръжка на системи през по-добро управление на интернет трафика или подобряване на някаква услуга, увеличаване приходите от продажби чрез идентифициране на точния момент на появата на пазара на даден продукт, та до съставяне на потребителски „профили“ и болнични досиета, установяване на връзки между отделни лица или пък установяване на самоличности и всякакви други такива, не чак толкова ясни цели…
От известно време насам съществува стабилен пазар за големи данни – и услугите, свързани с тях – и те се превръщат в шанс за голям бизнес. Гаранция за това е и фактът, че големите данни все пак са интегрална част от хибридните технологии, залегнали в близкото бъдеще на интернет, известен ни вече като IPv6, Интернет на нещата (Internet of Things – IoT).
В този хибрид влиза и „облачната“ технология за съхранение на големи данни, чиято най-съществена особеност е делокализацията на данните – те са извън физическите сървъри, осцилиращи между множество свързани памети.
Ако можем да вярваме на нашите медии, анализът на големи данни скоро ще е реалност и у нас.
Но докато много организации вече предвкусват разрастването си и успеха, други се питат готови ли сме за това? Да оставим настрана антиутопичните киберпънк сюжети за безжично свързани помежду си белязани тела, обхванати от глобалната RFid структура, и да се придържаме към сивата реалност на закона! На 5 март 2014 в Computerworld се появи анализът на доц. д-р Георги Димитров и адвокат Десислава Кръстева от адвокатско дружество „Димитров, Петров и Ко.“, озаглавен „Правни аспекти при управление на данни в Облака и Големи данни“. Той зачеква най-сериозните юридически казуси, свързани с управлението на Големи данни и съхранението им в т. нар. облак, изхождайки от драстичната разлика в скоростта, с която се развиват технологиите и правото.
Първият казус (и по мое мнение, най-тревожният): юридическите специфики при частния и публичния облак? Ясни ли са те от чисто проприетарна гледна точка? И още, проблемът с т. нар. профилиране – съставяне на „досие“ въз основа на данни, като колко и за какво харчим, какви търсения и интереси имаме, с кого общуваме, какво работим, ядем и пием, спортуваме, маршрутите ни, заболяванията ни, страховете, четивата ни, физиологичните ни и здравни показатели… Дали и колко често се извършва профилиране на потребители в мрежата и дали това е единствено с цел таргетирана реклама?
Друг казус: „вземане на автоматизирани решения“… Само на базата на автоматизирана обработка на събраните за нас данни, системата (абстрактно казано) ще взима решения, „съществени за нашите права или интереси“, като се почне от отгатване на желанието ни да намерим нещо в мрежата, та се стигне до отгатване на това дали не сме потенциални терористи или прости рушители на корпоративния дух… Това е дейност, която в ЕС е забранена, ноне и другаде… Оттук произтича и следващият важен казус: големи данни се обработват от и до тях имат достъп лица, които са разположени на територията на различни държави. Правилата на коя държава се прилагат в такъв случай? И кои от лицата, събиращи, имащи достъп или обработващи данните ни, могат да бъдат държани отговорни пред закона при манипулация с тези данни?