Наука или индустрия | Култура – Брой 23 (3033), 16 юни 2017

Четох преди време едно изследване, което сравняваше ефекта на технологията „големи данни“ върху нашия човешки свят с ефекта на природно бедствие. Даже нещо повече: изобретявайки тази нова технология, ние едва ли не сме си произвели нов Бог със свой Пантеон и жреци, на които да служим и от чиито прищевки да зависим.
Откъде този фатализъм по отношение на големите данни? Тъй като очевидно става дума за количество, ще ви занимая малко с приложна математика и по-точно – суниверсалното допускане в традиционните количествени анализи, че ‘N = All’, тоест, обозначавайки с „N на брой“ някакво безкрайно количество от нещо си, ние подразбираме „всичко“, всички членове на дадена популация/общност/население на една страна, да речем. Поне оттам тръгват изтъкнатите изследователи на големите данни Mayer-Schönberger и Cukier. Дори и да не сме запознати с техните изследвания, ако сме учили статистика, знаем, че за да разкрием закономерностите, по които се развива една популация, не можем да изследваме цялата популация, а само представителна извадка от нея; и от резултатите, които получим, екстраполираме резултат за цялата популация с известна, макар и допустима неточност. Съвременната изчислителна мощ обаче и технологията на Големите Данни позволяват да правим количествен анализ на цялата популация, т.е. ‘N = Аll’, оттам и допускането, че неточността и несигурността са елиминирани.
Има обаче една малка подробност – колкото и голямо количество данни да е в състояние да обработи съвременната техника, самият живот няма как да се транслира в дискретен, машинно четим, количествено измерим, лесен за манипулиране поток от битове и байтове. Просто по-големите Данни не са по-добри Данни. А когато машините превръщат този шум в „знания“, извличат от него „патерн“ посредством изчислителни методи и правят изводи въз основа на този „патерни“, резултатът е съмнителен и специалистите го наричат „data дериватив“ (от “derivatives“ – “производни“). Бъдеще, моделирано въз основа на Data деривативи, как ви се вижда това? Зле, нали? Просто N никога няма да стане All!
Доскоро вярата в големите данни бе наистина голяма. Майкъл Флауерс, бившият главен аналитик на Ню Йорк и автор на концепцията за „data driven city“, пише в книгата си „Отвъд прозрачността: Отворените данни и бъдещето на гражданските инновации“ (2013): “Мен не ме интересуват причинно-следствените връзки освен тези, които показват какво да се прави“.
Според него, причинно-следствената връзка е нещо много рисковано… Самото говорене за причинност е нещо рисковано. Има твърде много реални проблеми, които се налага да се решават в реално време, че градските власти да могат да си позволят лукса да се отдават на абстрактни разсъждения и теории относно причинността. Пък и законността, като се замислите…
И Тим О’Райли (Tim O’Reilly), друг един виден корпоративен мъдрец, си бе поставил за цел чрез обратната връзка, идваща от въоръжените с „гаджети“ потребители, да се бори с ригидността на правилата, спускани от откъснатите от живота политици.
Е, след като вече няма време за абстрактни размисли и след като знаем как технологията Big Data „решава“ проблеми, нормално е да се запитаме за чисто епистемологичния резултат от абсолютизирането на Big Data – бързината, с която се извличат патерни от произволно голямо количество data-шлака, просто изсмуква живота от всеки опит за търсене на причинност. В самото навечерие на Big Data бума, през 2008-а, Крис Андерсън (Chris Anderson) писа по този повод статия за Wired Magazine, многозначително озаглавена „Краят на теорията“, но краят очевидно е далеч. Напоследък все по-често се говори за проблема на големите данни, а именно, че информацията е прекалено много, а талантите, които да се справят с нея – прекалено малко. Проблем, който може да бъде решен с академични програми, от които да излязат повече и по-добре обучени специалисти, ще кажете. Може би да, но по-скоро не. В случая се е заложило на повече и по-добре обучени… компютри. Точно така, на сцената излиза нова технология, така нареченият когнитивен компютинг – нов хардуер и/или софтуер, имитиращ работата на човешкия мозък и човешката работа по вземането на решения, а вероятно и свързаните с това човешки дилеми.

 

Codex ex memes | Култура – Брой 1 (3011), 13 януари 2017

Обикновено, като чуем за меми[1], се сещаме за Internet меми – нещо не винаги стойностно, но пък разпространяващо се бързо като зараза в мрежата. На този феномен е посветен цял сайт – Know Your Meme, но не за него говоря. Говоря за meme в смисъла на културен аналог на гена (gene), който пренася през времето културни идеи, репликира се, мутира, еволюира и даже умира.
Та, в тази връзка, има ли Кодекс на мемите?
Хоп! Ето, че и „кодекс[2]” е дума, която в съвременността ползваме по инерция, най-често в тесния смисъл на система от закони в правото. Процесът на кодификация (съставяне на Кодекс) обаче може да се приложи за систематизиране на какви ли не неща, освен закони.
Представете си сега един Кодекс, систематизиращ последователността на появата и еволюцията на мемите в хода на човешката история. Етимологиите са отчасти това – те изследват живота на думите, разложени на морфеми, само че не под формата на система, а като отделни лингвистични факти. А понякога се случва така, че едни и същи идеи биват изразени с различни думи, или пък обратно – различни идеи се изразяват с едни и същи думи, доколкото не всяка нова идея произвежда нова терминология. (Обикновено всяка нова идея използва вече съществуваща терминология, докато не се развие дотолкова, че да изпита нужда от нов инструментариум.)
Ето защо би било крайно интересно да се синтезира един Codex ex memes, който да е като нагледна времева карта на това какви идеи са се срещали, допълвали, комбинирали или разделяли с течение на вековете. Би бил доста полезен организационен инструмент, с който да проверяваме дали една идея е оригинална или вече е хрумвала другиму. Би ни позволил дори да комбинираме идеи, които не сме и подозирали, че можем да комбинираме.
Нещо подобно вече съществува, но в друга област – това е каталогът Тематическа класификация и разпределение на фолклорно-митологическите мотиви по ареали на Юрий Берьозкин. Каталогът на Берьозкин е най-голямата база данни по сравнителна митология, която може да бъде разглеждана свободно в мрежата [на адрес http://myths.antropogenez.ru/] и си е de facto един Кодекс, в който, вместо меми, са кодифицирани митеми. (Митемите, това са единичните меми на мита, неговите „атоми”, конститутивните му съставки.)
На сайта ще видим колекция от огромен брой текстове, разпределени по теми, обозначени с букви. Примерно, „A” отговаря на темата „Слънце и Луна”. След буквата има цифра за обозначаване на тематичния раздел: A1 – „Древно слънце”; A2A – „Няколко слънца обгарят земята”; A2B – „Излишните слънца и луни са погасени” и т.н. Регионите, в чиито предели е записан текстът, пък са маркирани с поредица от двуцифрени числа. Така този корпус позволява с помощта на статистически анализ да се потърси мястото на спонтанно зараждане на един мит; да се проследят пътищата на т.нар. нетривиална дифузия – разпространението на мита по маршрутите на търговията в древността или на доисторически преселения; да се установи къде са разпространени в миналото, но вече отмрели и забравени митове, и т.н.
Доказателствената сила на подобен статистически анализ е винаги донякъде косвена и зависи от избраната методика, поради което винаги трябва да бъде подкрепена и по други начини, с други методики. Това обаче не намалява мощта на един Кодекс като инструмент за анализ, даже напротив – колкото по-мощен е инструментът, толкова е и по-мистичен. В тази връзка, невзрачните електронни Кодекси на съвременността далеч надминават по мистичност украсените си със злато средновековни свои предшественици заради възможността за извличане на информация от „нищото” – клъстерният анализ прави видимо невидимото, изважда наяве неподозирани модели, прави лесно сравняването и изследването им.
Но ако ще говоря за Кодекса най-общо, а не за някой Кодекс конкретно, представете си колко полезен би бил този инструмент в „мистична” област като управлението на Държавата. Представете си колко бързо би приключила точещата се вече четвърт век реформа, ако имахме инструмент, с който да проверим историята на възникване, репликиране, дублиране, припокриване и т.н. на разни текстове от Закона или брънки в администрацията!

 


[1]Думата е въведена е от Ричард Докинс в книгата му „Себичният ген“ (1976) при обсъждане на еволюционното естество на разпространението на идеи и културни явления. Миймовете се разпространяват в меметична среда, като прескачат от мозък в мозък чрез процес, който в най-широкия смисъл може да бъде наречен имитация. Според Ричард Докинс, разпространението на миймовете е проява на Дарвиновата теория под друга форма. (Уикипедия)
[2]Латинското caudex означава всъщност трупче дървесина.