Световната библиотека | Култура – Брой 18 (2545), 15 май 2009

На 21 април в главната квартира на UNESCO в Париж под ръководството на американската Конгресна библиотека и UNESCO тръгна проектът Световна цифрова библиотека (СЦБ, The World Digital Library). За тази библиотека се говори още от 2003 г., когато след 20-годишно отсъствие САЩ възобнови своето участие в световната културна организация, а за пръв път бе представена през юни 2005 г., когато номинираният за комисионер на САЩ в ЮНЕСКО, д-р Джеймс Билингтън, произнесе реч, озаглавена именно „Една визия за световна дигитална библиотека‛. В тази си реч д-р Билингтън говори за своето желание за обединяване на богатите колекции на институции, библиотеки и музеи и превръщането им в свободно достояние на човечеството, при това под форма, „далеч по-универсална и достъпна от всички досегашни.“ Като пръв партньор в това публично-частно начинание бива посочен Google с неговия принос от 3 млн. долара. Разработката струва засега над 10 млн., а Билингтън не крие желанието си средствата да идват предимно от частни компании. Сред останалите донори са Майкрософт, благотворителната корпорация ‛Карнеги“, Катарската фондация за образование, наука и развитие, Университетът на крал Абдулла от Саудитска Арабия.

Мисията на СЦБ е осигуряване на възможно най широк достъп до възможно най-представителна част от световното интелектуално наследство, като за тази цел се поощрява разрастването на сектора с неанглоезични и изобщо незападни ресурси (ръкописи, редки книги, карти, фотографии, чертежи, скици, музикални партитури, звукозаписи, филми и др.). Всичко това ще бъде достъпно едновременно на 7 езика (английски, арабски, испански, китайски, португалски, руски и френски). Библиотеката стартира с 1170 заглавия, повече от половината от които неанглоезични. Има дори седем ранни български заглавия, сред които Неделникът на Софроний Врачански, Рибният буквар на Берон, Кратка политическа география за обучение на българската младеж на Архимандрит Неофит. Те до едно са предоставени от Конгресната библиотека.

Търсенето и отсяването на информация от ползувателите на СЦБ може да става по различни критерии, като търсенето може да бъде конкретизирано или разширявано – примерно с цел сравняване на постижения в дадена област в различни части на света по едно и също време.

Билингтън споменава за възможни проблеми, свързани с чувствителни теми, особено от най-новата история на някои страни, които техните правителства биха предпочели да се забравят или фалшифицират, нещо, което според него трудно би могло да се случи поради отворения характер на проекта за всички страни на дебата.

Съдейки от наличните източници в интернет, технологичните предизвикателства пред СЦБ се състоят в начина на дигитализиране на съдържанието, установяването на стандарти и създаването на добра навигация. Само Google през последните години е дигитализирал около 5000 заглавия от Конгресната Библиотека, но все още не е ясно кои от тях ще предостави на СЦБ. Сред партньорите на тази библиотека са такива солидни институции, като Александрийската библиотека, библиотеката на Brown University, Египетската национална библитека и архив, Международната федерация на библиотечните асоциации и иинституции, Конгресната библиотека, националните библиотеки на Япония, Бразилия, Китай, Франция, Израел, Русия, Сърбия, Швеция, Уганда, библиотеката на Йейлския университет и много други.

Във връзка с цялото това суетене около цифровизирането на съдържание, всеки, който досега е ползвал ресурси, като Google Library&Google Book Search, интернет архива на Yahoo&MSN, Amazon’s Search Inside’s, проекта Publisher Macmillian’s BookStore и любимия на много от нас Project Gutenberg, не може да не се запита какви ще са отношенията на СЦБ с тези вече утвърдени източници на дигитално съдържание? Конкурентни? Или с цел да се избегне съперничеството, дублирането на усилия и хаоса от стандарти, ще се установи някаква форма на сътрудничество?

В мрежата вече се срещат догадки за бъдещ Алианс за свободно съдържание (Open Content Alliance), както и въпроси относно евентуалното участие на Google в такъв един алианс, но това е нещо, което бъдещето ще покаже.

Едно единствено нещо смущава и изненадва сега: никъде в мрежата не се открива и намек за приложение на семантични web технологии в този иначе грандиозен и многоезичен проект.

Бръмчене | Култура – Брой 16 (2543), 24 април 2009

Една локална новост напоследък буди немалък интерес и дори успява да измести фокуса на вниманието от мъчителни теми като тази за поправките в Закона за електронните съобщения и стремежа към безконтролен достъп на МВР до интернет трафика. Името на тази новост е BuzzDash: американският онлайн барометър на публичното мнение преди седмица се сдоби с български лицензиант.

Как точно един сайт измежду много други успява да се превърне в новина? Със скъпо струваща реклама, разбира се.

На 7 април столицата осъмна украсена от билбордове с ликовете на велики диктатори в комбинация със слогана: „Те говорят, ти слушаш“. Както по-късно стана ясно, тези билбордове били не просто поредната проява на лош вкус или намек за начина, по който пропагандата работи с масите, а имали за цел налагане на марката BuzzDash посредством т.нар. teasing (дразнене) на обществеността, при което тя да отдели, подобно секрет, своето мнение. Точно това и се случи – мнението на скандализираните граждани достигна чак до намиращия се зад граница софийски кмет и той издаде заповед билбордовете да се свалят, с което да даде повод на други скандализирани граждани да нададат тревожен вой за наличието на цензура. Изпълнителят на рекламната поръчка, фирма „Оксиген“ ЕООД, обяснява концепцията си не с търсене на скандал на всяка цена, а с желание да постигне ефект от контраста на типичната за тоталитарните общества ситуация, при която бива слушан единствено диктаторът, с истинската мисия на BuzzDash, въплътена в слогана: „Ти говориш, те слушат!“, схванато не като подслушване обаче, а като възможност за всеки от нас да изрази по чуваем начин мнението си.

Сайтът има кратка история. Съществува от септември 2006 г., а негов създател е политическият експерт Дейвид Гергън. Оригиналната цел на сайта е точно създаване на меродавен и независим инструмент за изследване на общественото мнение, позволяващ поглед в реално време върху процесите, протичащи в него.

Типичен web 2.0 проект, той не би могъл да съществува без обратна връзка с потребителите си и като такъв имб не малка заслуга Обама да спечели президентските избори. Ползвайки BuzzDash като инструмент за мигновено тестване на идеи, екипът на Обама предлагаше на обществеността своите, отсяваше полезните измежду тях и се съсредоточаваше върху им.

Какво представлява BuzzDash? Съществуващ под формата на индивидуални модули за допитване, наречени buzzbites, сайтът е всъщност форум, в който всеки може да:

• види в реално време популярното мнение по даден въпрос в широк обхват от теми;

• изрази мнение, гласувайки или коментирайки тези теми;

• поства самият той buzzbites в личната си страница, блог и мейл;

• създава buzzbites за лични нужди, за BuzzDash или и двете заедно.

Първото, което ми направи впечатление преди седмица в българския вариант, е, че активността в сектора с Новини и Политика е забележимо по-голяма от тази в сектора Спорт, Забавления, Бизнес и Други. Сега активността в сектор Забавления и Политика се е поизравнила, но ето някои от най-болните теми все пак:

„Ще оцелее ли „Кремиковци?“, „Ще открие ли ДАНС корумпирани министри“, „Разпада ли се СДС“, „Мислите ли, че подслушват телефона ви?“, „Има ли днес криза с боклука в столицата?“, „Кой е по-лошият премиер“, „Колко пари има в сивата икономика?“. Има дори допитване за ефекта от акцията с билбордовете: „Дразни ли билбордът с Хитлер еврейската общност.“

Седмица след стартирането на сайта, активността на гражданите на него не е кой знае колко голяма, новината обаче продължава да е новина: Научаваме, че американският първообраз BuzzDash.com се е превърнал в собственост на българският Buzz. Собственици са Иво Гиздарски и Бисер Димитров, което и обяснява донякъде липсата на възторг у гражданите по повод предоставения им чисто нов инструмент за гласност. Ето и някои от коментарите под статията със заглавие „Buzzdash.bg купува buzzdash.com“ във вестник „Капитал“:

„Майко мила, ченгетата пак хвърлят пачки.“ „Пачки по стотачки и портрета на Сталин.“ „Ами избори идват и пачките хвърчат.“ „ДС се сдоби с нов инструмент за манипулация на общественото мнение, този път в интернет.“

Краят на безплатния обяд? | Култура – Брой 15 (2542), 17 април 2009

След Facebook, друг един емблематичен за web2.0 сайт направи опит да въведе промени в условията на ползване и също така бързо отложи промените за неопределен срок в резултат на гневната реакция на потребителите си. Този път става дума за любимото на много от нас, поне до преди година, британско онлайн радио, Last.fm. През 2008 г. радиото стана собственост на американския медиен конгломерат CBS, така че промените не са изненада. Първата дойде още през юни 2008, когато Warner, финансово неудовлетворен, развали сделката си с Last.fm и премахна от каталога всички свои артисти.

И ето че на 24 март т.г. блогът на Last.fm уведоми общността, че скоро слушането на Last.fm Radio ще става срещу месечна такса от €3.00 за всички страни в света с изключение на САЩ, Англия и Германия, като безплатни ще останат само 30 мелодии, както и всички други дейности на сайта: класации, препоръки, добавяне на информация за артисти, събития и видеа, и не на последно място, характерния за Last.fm ‛скроблинг‛ – съставяне на детайлен профил на всеки потребител в базата данни на сайта и позволяващ му да прослушва любимата си музика дори на портативни устройства. Иначе казано, безплатно остава удоволствието ни да попълваме базата данни на сайта с огромни количества всевъзможна информация.

За по-малко от седмица коментарите под това изявление стават 1651 и са от такова естество, че на 30 март в блога се появява нов постинг, съобщаващ, че след дълго и нелесно разискване, екипът на Last.fm е преосмислил политиката си и отлага въвеждането на абонаментен режим за неопределен срок, работейки междувременно върху някои от потребителските предложения, като например възможност за абонамент с цел подарък, предимства за разработчиците на приложения, докато са в системата като редови слушатели, разработване на алтернативни начини за плащане за държави, в които Paypal е невалиден. В далечен план обаче Last.fm не се отказва от идеята да се превърне в платена услуга и обяснява мотивите си за това несправедливо разпокъсване по териториален признак на уж интернационалната общност с мотива, че се издържа единствено и само благодарение на реклами, които стават безпредметни извън териториите на изброените три държави.

Справедливо ли е това, или не? Амбицията на Last.fm от началото на съществуванието им през 2002 е, по собствените им думи, ‛правилната песен да достига до правилния слушател‛, като за това се разчита именно на обратната връзка с над 30 милиона потребители и каталог от над 7 милиона заглавия, предоставени от над 280,000 издатели на музика и музиканти. Верно е също така, че сайтът може да е доста полезен за ориентация в огромната и разнообразна музикална продукция и изграждането на вкус, особено у младата част от аудиторията, но дали информацията, която трупа в базата си данни, е единствено тази, която съзнателно му предоставяме ние на принципа ‛от фенове за фенове‛? А какво става с тази, която остава да съществува в по-неявен вид, достъпна единствено на собствениците от CBS? Нима информацията за потребителското ни поведение и тенденциите в него не струва нищо? Тази информация в полза на кого е, ако не на индустрията и нейния стремеж да не оставя нищо на случайността и ирационалността на слушателските ни капризи? Дали, отказвайки се да плащаме за музиката, която слушаме, сами не поощряваме алчната индустрия да търси алтернативи и да ги намира в предлагането на все по-предвидима и неавтентична продукция на пазара, задоволияваща най-масовия и посредствен вкус? Или като потребители сме наясно, че предоставили веднъж вече тази информация, индустрията в никой случай не би пропуснала да се възползва от нея. Дори и да плащаме абонаментната си такса от 3 евро на месец.

Междувременно бившите привърженици на Last.fm търсят и намират алтернативи:

http://www.imeem.com/
http://mog.com/
http://www.deezer.com/
http://www.twones.com/
http://listen.grooveshark.com
http://blip.fm/
http://www.mufin.com/
http://www.spotify.com/en/
http://www.playlist.com/
http://mixtape.me/
http://www.goear.com/
http://www.thesixtyone.com/
http://www.jango.com/

Ще оцелее ли Last.fm при наличието на толкова много съществуващи в мрежата възможности за любителите на безплатната музика?

Прозрачна администрация | Култура – Брой 13 (2540), 03 април 2009

От началото на март в САЩ се случва нещо интересно – в ход са сериозни реформи в начина, по който американската държавата ще борави с данни. Насоката им бе зададена от президента Обама, който създаде нов пост в администрацията си – директор на информационните служби, и назначи на него бившия технологичен експерт от екипа на Вашингтонския кмет Вивек Кундра. Вивек Кундра е известен не само с последователността си в стремежа да революционизира технологиите в обществения сектор, но и като безкомпромисен застъпник на оpen data, а данните, превърнати в обществено достояние (open data), в днешни дни са това, което преди 7-8 години бе отвореният код (open source) – синоним на технологична и гражданска свобода.

Веднага с встъпването си в длъжност Кундра даде гласност на някои от плановете си, в това число и на намерението да ползва ‛облаков компютинг‛ за правителствени цели, както и да създаде специален сайт на адрес http://www.data.gov, където да се поддържа в наличност и в достъпна за гражданите форма ключова информация за работата на правителството. Новият информационен шеф не крие амбицията си да разклати представите, че политиците в САЩ застават зад технологиите единствено, когато трябва да са в услуга на едрите представители на частния сектор.

Проблемите, които трябва да бъдат непосредствено решени, са свързани с мащаба на начинанието. Всяка една държава е фабрика за данни, а Америка е огромна страна с огромен и все по-нарастващ брой държавни агенции, които се занимават със събиране и публикуване на статистически данни, отразяващи работата на един или друг сектор от живота (икономика, наука, здравеопазване, вътрешни дела), а данните, освен че са в необозримо количество, не винаги са добре описани и в достъпен за ползване формат.

Решението е съзряно в обратната връзка с гражданите – направен е wiki-сайт, където всеки може да докладва по всяко време къде данните са недостъпни поради лош дизайн, недоглеждане или злоупотреба с технологиите, а също така да се обсъжда начинът, по който реформата протича – процесът на каталогизиране на данните, циркулирането на информационните потоци, поощрения за сериозните донори на данни, каквито са научните институти, поощряване на самата работа с данни в учебните центрове например, както и изобщо стремежът към информираност у гражданите.Следейки случващото се в САЩ и в обстановката на очакване, създадена от наближаващите избори у нас, не мога да не си задам въпроса каква е готовността за технологизиране на нашата администрация. Защото, преди да се пристъпи към създаване на е-правителство, преди дори да започне да се говори за него, нужно е да се направи предварителна оценка именно на т. нар. е-готовност, процес сам по себе си също технологизиран и осъществяващ се с помощта на специфичен софтуер и натрупани данни за инфраструктура, налични компютри, типове мрежи, компетентност на служителите и пр. Не ми е известно да е в ход такова проучване, затова пък технология със сигурност има. Достатъчно е да потърсим с ключова дума ‛Bulgaria‛ в базата данни на сайта European Open Source Observatory and Repository (Европейска обсерватория и хранилище за отворен код) , за да открием с изненада, че такава дори е разработвана от българин; а по рейтинга, релевантността и броя на изтеглянията й в централен за разработчиците по света източник, какъвто е SourceForge.net, да си направим извод за качествата й.

Какво евентуално ще се случи, каква ще е готовността на едно бъдещо правителство у нас да се технологизира и да направи процеса на работата си прозрачен, а потока данни – протичащ безпрепятствено и в двете посоки – не само от гражданите-данъкоплатци към администрацията, а и обратно, от администрацията към гражданите-данъкоплатци, надявам се да е вече не само въпрос на добра воля от страна на политиците, а и въпрос на технология от най-ново поколение. Защото все пак облачният компютинг е нещо, способно да се появи и просъществува извън и въпреки всеки опит за контрол, докато има граждани, готови да се възползват от свободата, която той им дава.

Правилен въпрос* | Култура – Брой 12 (2539), 27 март 2009 Начална страница

Краят на по-миналата седмица се оказа богат на новини от света на търсачките: след временното излизане от строя на електронната поща Gmail, друго едно приложение на Google създаде проблем – безплатният, уеб-базиран офис пакет Googe Docs позволи неоторизиран достъп до архива на част от своите потребители. Въпреки оправданията на компанията, че пораженията са минимални, и въпреки убедеността на повечето потребители, че Google печелят достатъчно от доверието им, за да имат причина да го губят с неетични сделки в полза на частни компании и политици, все повече стават и тези, които се надяват на алтернатива на монополиста Google, при това некомерсиална.

Чисто съвпадение, но по времето, когато в мрежата се дискутираха тези проблеми, се появи и добрата новина за скорошното пускане (през май) на адрес www.wolframalpha.com на търсачката Wolfram Alpha. Тя е дело на Стивън Уолфрам, британски математик, известен още от 70-те години на миналия век с разработката си на системата за компютърна алгебра SMP (Symbolic Manipulation Program), а после и на мощния научен инструмент Mathematica (1988), представляващ сложна система от библиотеки с елементарни и специални математически функции, огромни масиви разнообразни данни, инструменти за визуализация и за обработка на изображения, статистически библиотеки и още много други. Уолфрам е известен също и с диспута, който е предизвикал с гигантския си емпиричен труд New Kind of Science (‛Нов вид наука“), който е изграден върху представата, че Вселената е дигитална по своята същност. Тази негова представа, както и опитът му с Mathematica, са залегнали в основата и на Wolfram Alpha, която, по думите му, е „смес от много и умни алторитми, евристика, езикови открития и грижа за езика и неминуемо ще доведе до сериозен теоретичен пробив… И докато Google просто доставя документи на базата на търсене по ключови думи, тази търсачка има амбицията да улесни хората да правят своите запитвания на естествен език: просто едно въвеждане на въпрос в празното поле и получавате достъп до огромна система от данни и алгоритми.

Нова Спивак – пионер на web3.0 и предприемач, казва за работата на тази ‛машина за отговори“ следното:

‛Wolfram Alpha е система за изчисляване на отговорите на въпроси. За да изпълни задачата си, тя ползва вградени модели от различни области на знанието, допълнени от данни и алгоритми, представляващи напълно реално познание.“

Всички знаем колко скаран е Google с естествените езици и как премахва от търсенето всичкия този ‛незначителен словесен шум“ – определителните членове, предлозите, съюзите. С това обаче Google неусетно влияе на начина, по който започваме да си служим с езика; ‛гугълизира“ го, превръща го, за добро или зло, в мозайка от ключови думи, вместо в логически свързани изречения, които на свой ред да са свързани помежду си в логични абзаци. За някои това е печална перспектива, за други – не чак толкова, но истината е, че винаги трябва да има алтернатива.

Според някои достойнствата на бъдещата търсачка се преувеличават с цел реклама, а справянето с естествените езици на Wolfram Alpha е всъщност заобикаляне на проблема с предварително заложен контекст на търсенето – задаване на въпроси от научно естество. Освен това, много от нас знаят, че почти от година функционира бета версия на подобна сeмантична машина за отговори True Knowledge .

Истината обаче е, че всяка една мощна алтернатива на Google ще бъде топло приета от ползувателите на интернет, защото (цитирам случаен анонимен коментар под статията, посветена на Wolfram Alpha в CNET): ‛… когато web навлезе в 90-те, се надявах тя да заздрави демокрацията, помагайки на всеки по-лесно да научава фактите. Но web прекалено бързо се наблъска с толкова много пропаганда, че можете да си изкарате душата от ровене с google и още да продължавате да вярвате, че Ал Гор е открил интернет… Може би все пак тази търсачка ще пресява по-добре преувеличенията?“

**“Правилен въпрос‛ е заглавието, с което разказът ‛Ask a Foolish Question“ на Робърт Шекли е известен в мрежата на български и е достъпен на следния адрес: http://www.sfbg.us/authors/r/robert_sheckley/Stories/Ask_a_Foolish_Question.htm