Зад гърба на Новия колос* | Култура – Брой 19 (2767), 20 май 2011
Президентът Обама, за който цял свят знае, че е силно привързан към своето BlackBerry**, вече официално може да бъде наречен „главен писач на есемеси на американската нация“. За какво иде реч? На 10 май в в блога на Los Angeles Times се появи анонс на нов почин на американското правителство – система за предупреждение при бедствия, аварии и тероризъм, наречена Лична локална предупредителна мрежа (Personal Localized Alerting Network) или съкратено – PLAN.
Играчка-плачка | Култура – Брой 6 (2708), 19 февруари 2010
Присвояване | Култура – Брой 8 (2535), 27 февруари 2009
Тези дни се вдигна доста шум около промените, които социалната мрежа Facebook направи в условията за ползване на услугата. Преди две седмици тя тихомълком си гарантира ‛постоянен, неизключителен, неотменяем и напълно прехвърляем лиценз (с правото на сублиценз) да използва, копира, издава, дистрибутира, възпроизвежда, модифицира, съхранява, публикува, превежда, публично показва, скенира, преформатира, модифицира, редактира, цитира, адаптира, създава производни и разпространява всяко съдържание‛, споделено от ползувателите й, при това завинаги, дори след като те са закрили потребителските си сметки. После като че ли обратната връзка сработи и Facebook, взела си бележка от гневните реакции, върна нещата в старото им положение.
Трудно е да се каже доколко ценно от комерсиална гледна точка и трайно във времето е това, което ползувателите на мрежата споделят помежду си: любителски семейни снимки, новини, линкове. От коментарите под статиите в Consumerist и New York Times , отразили скандала, а и във Facebook-групите, обособили се в знак на протест, обаче се вижда, че всички те са еднакво неприязнени към идеята нещо, споделяно от тях безкористно, да се превръща в предмет на комерсиално ползване. Дори когато оправданието е ‛улесняване на споделянето на съдържание‛.
Всъщност, би следвало да се запитме какви още следи, какви още данни за себе си оставяме в тази среда, освен доброволно споделеното от нас съдържание? Нали все пак с нещо трябва да заплатим удоволствието да общуваме? Дали няма да се окаже, че по-ценните от комерсиална гледна точка данни са не предназначените за обмен със себеподобните ни, а тъкмо тези, които лесно могат да се преобразуват в логична, смислена и машинно обработваема информация – данните, издаващи нашето потребителско поведение? Бихме могли да научим немалко за интереса, който изпитват към това наше поведение разработчиците на всевъзможни аналитични платформи и приложения за социалните мрежи, достатъчно е да предприемем кратко пътешествие из Google с ключови думи ‛user behavior analysis‛. По време на едно такова търсене аз попаднах право на форума на разработчиците на Facebook и по-точно в една тема от юли миналата година, в която екипът на платформата Kontagent търсеше бетатестери (доброволци-изпитатели) за своя нов продукт.
Kontagent са рисково начинание със седалище Сан Франциско и са се фокусирали върху изграждането на мощна платформа за viral analytics (вирален анализ?), предназначена за разработчиците на социални мрежи.
По-долу следва информация за видовете данни, които Kontagent проследява, събира и анализира за целите на своите предвиждания: възраст на потребителите, пол, местонахождение, брой приятели, брой посещения на профила, брой на уникалните измежду тях, времето, прекаранно на сайта, датата на последното посещение. Прави се анализ и се търсят всевъзможни зависимости: между демография и социално поведение в дадени групи индивиди, между източниците на трафик и поведението на индивидите, между предпочитаната версия на ползваните приложения и поведението на индивидите; изследва се вирулентността (K-фактора) на индивидите, т.е. потенциала им да ‛заразяват‛ и други индивиди и т.н.
Логично следва въпрос от страна на модератора на Facebook: Как ще бъдат набавяни тези данни? В разрез с правилата за ползване на услугата?
На което Kontagent отговарят, че уважават тайната на личните данни и по-точно тези, чрез които индивидът може да бъде идентифицран (име, e-mail). За сметка на това пък изрично отказват да разкрият как точно ще събират тези данни. Един вид, това си е лична работа на Kontagent, тайна, която те биха споделили само с партньори.
Очевидно Facebook и Kontagent са намерили общ език, защото през октомври м.г. в блога на платформата се появи постинг, съобщаващ за началото на тяхното многообещаващо партньорство.
Та в тази връзка, мисля си, че далеч по-незащитимо е тъкмо това съдържание, оставяно от нас в мрежата под формата на лесно обработваема информация за поведението ни. Колкото и да демонстрира загриженост към личните ни тайни обаче, вирусният маркетинг и изобщо всяка дейност, свързана с изучаването на поведението ни в мрежата, трудно ще успее да докаже етичността си.
Пак за текста | Култура – Брой 43 (2526), 12 декември 2008
Почнах сезона с колонка, посветена на трудностите, с които се сблъсква проектът ‛Тезей‛ на Катедрата по класическа филология на СУ в мрежата, за да получи разрешение за изследването на един или друг класически текст. Конкретно тези трудности идваха от невъзможността да се гарантират научните намерения на ресурса, тъй като само това би позволило свободното ползване според съществуващия в момента Закон за авторското право. Сега ще продължа с темата за някои видове комерсиална дейност в мрежата, също ползваща текстови корпуси и развивана без много шум от различни компании. Компаниите, упражняващи тази дейност, не срещат никакви затруднения да я легитимират, вероятно заради безплатността и вседостъпността на ползваните текстови масиви – статии в онлайн медии, блогове, форуми, коментари и прочие генерирано от потребителите съдържание под формата на свободно упражнено гражданско право на мнение.
Напоследък е актуално да се негодува срещу ‛подслушването‛ на интернет и ‛задържането на данни‛, т.е. изграждане на бази данни с досиета, съдържащи информация за онлайн навиците на потребителите. Някак не е прието обаче да се говори за възможностите, които отключва притежаването на такива бази данни. А крайната цел не винаги е малко контекстен спам в празното поле на пощенската ни кутия или в профила ни в някоя социална мрежа.
В началото на годината четох във WanityFair, а после и във Wired за някой си брокер на име Джон Аристотел Филипс (John Aristotle Phillips) и неговата Aristotle Inc., която притежава, според WF, една направо Оруеловска база данни с информация за американските гласоподаватели и се явява важен инструмент в изборите за всеки президент в Америка от Роналд Рейган насам. Част от тази информация (име, адрес на гласоподавателите и т.н.) се купува от администрацията на различните щати; след това се комбинира със строго лична и детайлна такава, примерно събирана чрез data mining (за доходи, за притежаване на лично оръжие, за ползвани медицински процедури) и накрая, добре пакетирана, бива продавана на кандидатите за президент, на политическите агенти или на комерсиалните субекти, интересуващи се от нея.
Ако може да се вярва на WanityFair, в базата данни на Aristotle има информация за 175 милиона американски гласоподаватели. Такава информация, правилно употребена, може доста да повлияе на изхода на едни избори.
Ако се вгледаме малко по-внимателно в дейността на някои тукашни компании, ще видим, че те от доста години прилагат статистически методи за анализ на текст, набавяйки си го именно от достъпни електронни публикации. Бих си спестила назоваването на конкретна компания, но ми е интересно по какъв начин всяка една от тях би гарантирала некомерсиалността на дейността си, примерно, в полза на Лондонската фондова борса? Или пък, че не се занимава с политически data mining (извличане на ценни данни от някакъв информационен масив)?
Всичко си остава в сферата на догадките, само едно е извън всяко съмнение – технологията и нейните възможности.
Ето например откъс от едно интервю в ‛Дневник‛ на мениджъра на проекти в ‛Ontotext‛ – научноизследователската лабораторията на Сирма груп, занимаваща се с научни разработки, свързани със семантичното бъдеще на мрежата, и експериментираща с достъпните безплатни масиви от текст на ‛Дневник‛:
„Дневник“ има огромно количество статии, които сами сте произвели, но и материали от други източници, които вземате предвид в работата си. Оказва се обаче, че това са само моментни снимки на реалността. Не можем сами автоматично да извеждаме тенденциите (от тези огромни масиви), не можем да правим анализ на причинно-следствените връзки, а тази технология ни помага да навържем събития, развивали се дълго време.‛
В това интервю сливането на науката с бизнеса изглежда някак естествено и дори желано, без намек за странични нежелани ефекти. А може пък безплатността на изследвания ресурс да не задължава ползващите го да гарантират чисто научните си намерения?