Не така, господа! | Култура – Брой 25 (2728), 02 юли 2010
Споразумение с Google | Култура – Брой 20 (2547), 29 май 2009
Културното събитие на годината, Генералната асамблея на Федерацията на европейските книгоиздатели, състояла се тази година в София под домакинството на Асоциация Българска книга, завърши, отразена в медиите предимно със скандала с таксиметровия шофьор, изоставил в полето изпълнителния директор на Федерацията Ане Бергман-Тахон и юридическия съветник Олга Мартин Санчо. Нищо чудно! Дали поради неуточненост до последния момент на мястото, където ще се провежда пресконференцията, дали поради ниския потенциал за скандал на самото събитие, на пресконференцията присъстваха съвсем малко хора, повечето от които навярно издатели, вълнуващи се от въпроса за ставката и ДДС.
Разисквани са обаче и новости и проблеми, свързани с предизвикателствата на технологиите и информационното общество: съдържанието онлайн, телеком пакетът и възможността за уреждане на отношенията между доставчиците на съдържание и доставчиците на Интернет, цифровизирането и достъпността на европейското културно наследство (библиотека Еуропеана), отношенията с Google. Всеки един от тези проблеми заслужава отделно внимание, но ако се налага да се съсредоточа върху един, това ще е постигането по време на тази асамблея на споразумение между Федерацията и Гугъл.
Може би се налага все пак да започна с технологичната страна на нещата. Инструментът Google Book Search , претърсващ текстовете на книги, сканирани от Google и складирани в дигиталната му база данни, започва съществуванието си през 2004 година под името Google Print и въпреки че все още се намира в своята beta (неокончателна) версия, базата му данни не спира да расте, като освен текстове извън копирайтните възбрани, в този най-голям в света online тесктови корпус има и доста книги, актуални в момента на пазара. Основните му конкуренти са Microsoft с проекта Live Search Books, започнал през 2006 и изоставен през май 2008, и Europeana с нейните почти 3 милиона обекта към края на 2008.
Google има огромна преднина (много университетски библиотеки му предоставят фондовете си), но очевидно има и слаби места. Най-атакуеми са отношенията му с копирайтното законодателство.
През 2005 гилдията на авторите в Америка и Асоциацията на американските книгоиздатели съдят Google за „масивни нарушения на авторските права“. А Google се противопоставя на претенциите им с довода, че намира базата си данни за еквивалент на картотека, в която всяка дума във всяка една книга е индексирана. И въпреки че Google си позволява да показва целия текст единствено на книги от публичния домейн, издателите протестират и срещу своеволието да се сканират и съхраняват в базата му данни защитени от закона текстове.
Претенции към Google имат и европейските интелектуалци и издатели, като този път обвиненията са не само копирайтни, но и в езиков империализъм. Все пак Google отдава предпочитание на англоезични книги.
Съглашението, постигнато между Федерацията и Google, накратко може да бъде представено така:
– класифициране на книгите:
а). комерсиално достъпни книги;
б). комерсиално недостъпни;
– същност на споразумението:
а). компенсация за дигитализирано без разрешение съдържание до 5 май т. г.;
б). отделяне на 34.5 млн. долара за регистъра Book Rignts Registry, който ще бъде независима, некомерсиална организация, събираща и разпределяща доходите от Google Book Search и поддържаща база данни с копирайтна информация за всички материали;
в). компенсация за собствениците на права с 63% от доходите от комерсиалната дейност, асоциирана с текстовете под формата на онлайн продажби на книги, контекстна реклама и др.
По време на пресконференцията по-скоро формално попитах г-н Мота не са ли твърде големи технологичните предизвикателства пред копирайтната институция и тези, които в момента са най-облагодетелствани от нея – посредниците между автор и публика, издатели и разпространители.
Той политично отвърна, че все пак нещо трябва да защитава правата на произвеждащите ценности, а както знаем, Google не ги произвежда и следователно не би могъл и да ги защити.
Искаше ми се да попитам също от интерес ли е за европейските книгоиздатели информацията, с която се сдобива Google относно заглавията в неговата база данни, позволяваща примерно улавянето на тенденции в читателските вкусове, но не успях, тъй като пресконференцията внезапно приключи.
Модата на четците | Култура – Брой 19 (2546), 22 май 2009
Четивата ни се цифровизират неумолимо! Поредната новина: проектът „Виртуална библиотека“ стартира и у нас и това ще направи достъпен фонда на над 43 европейски библиотеки в рамките на проекта „Европеана‛. Наскоро стана дума също и за грандиозната Световна цифрова библиотека и един евентуален Световен Цифров Алианс, който да уеднаквява стандартите, да разпредели усилията на все по-многобройните начинания от този сорт.
Но освен библиотеките се цифровизира и пресата и, както вече е ставало дума, това съвсем не е заради вярата в предимството на технологиите, а чисто и просто отчаян ход на тази индустрия, притисната от рецесията и настъпилите неизбежните промени в начина, по който се потребяват новини.
До какво би довело цялото това прехвърляне на съдържание – от досегашния му хартиен носител в мрежата? Следвайки предвидимото мислене на предприемачите, спокойно можем да допуснем вероятността за скорошен бум в производството на хардуер за четене – един вид, нова iPod-вълна, но този път от устройства за четене на текстови файлове. Всички помним модата на айподите. Беше си точно мода, не толкова техническа иновация, и именно като мода успя да донесе толкова приходи на Apple Inc. Паралелът между iPod-ите и устройствата за четене на текст обаче е подвеждаща. Защо?
Някои считат че дигитализирането на книгите е свързано единствено с лишаване от тактилното удоволствие от досега с този продукт, мириса на мастилото, драскането в полетата. Всъщност, дигитализираният текст създава и по-сериозни неудобства. Нека се замислим например малко над значението на думата „формат‛. При печатането на книги форматът зависи от големината и формата на самите книжни тела, от съотношението между размера на шрифта и на самата книга. Това има икономически смисъл, тъй като позволява изчисляването на най-евтиния и подходящ за масово издание формат.
В web обаче под думата „формат‛ се разбират съвършено други неща. В web се говори за текстове, публикувани в проприетарни формати, в свободни формати, за формати с отворен код. HTML, например, е свободен формат, чиито спецификации са достъпни на World Wide Web Consortium – сайтът за web-стандарти. Или пък също толкова познатият на всички ни Portable Document Format (PDF), разработен от Adobe Systems. В същото време има проприетарни формати като AZW – форматът на Amаzon, който бе създаден с пускането на пазара на четеца Kindle eBook , или пък TomeRaider , пригоден за Windows Mobile, Palm, Symbian. Или пък форматът ARG на френската фирма Arghos и работещ изключително и само с нейните четци.
Разнообразието от формати е голямо и всеки от тях има някакви предимства и недостатъци, според нуждите, които трябва да задоволява. Има например формати за хора, физически затруднени при работа с клавиатура. Форматът DAISY е такъв.
Но можем да си представим какъв хаос може да настане и съответно, какъв контрол да се осъществява над достъпа и потреблението на цифровизирани текстове тъкмо чрез форматите.
Web обаче поставя и други препятствия пред желаещите да четат. В мрежата няма дефицит на място и няма снижаване на себестойността посредством вариации в размера на страниците. Проблем обаче е лошата икономия на вниманието. Много е трудно да четем съсредоточено дълъг и изискващ съсредоточаване труд, ако само на клик разстояние се намира разсейваща информация.
Освен това, как „стоят‛ в мрежата дългите форми? На хартия един роман е напълно приемлив за четене, но online кратките форми печелят.
Да се върнем на метафората за iPod-а за четене. Първото което си представяме е малко квадратно устройство за складиране и консумиране на огромни колличества текст, също както и музика. Но докато спокойно можем да прослушваме симфонии на iPod-а си, то едва ли някой от нас би рискувал да започне да чете „Война и мир‛ от екрана на такова малко устройство? Блогове или новини, може би, но не и „Война и мир‛. Освен това от музиката може да се печели и „на дребно‛ – някой може да предпочита да купи не целия албум, а просто някоя от песните. Колко обаче би струвал един кратък откъс от обемист текст?
А може пък печалбата ни от такъв маниер на четене да е в усъвършенстването на способността ни да колажираме, анотираме, обменяме късове текст, да ги поставяме в нов контекст и да разгръщаме опита си до някакъв всеобхватен колективен дискурс.
Световната библиотека | Култура – Брой 18 (2545), 15 май 2009
Мисията на СЦБ е осигуряване на възможно най широк достъп до възможно най-представителна част от световното интелектуално наследство, като за тази цел се поощрява разрастването на сектора с неанглоезични и изобщо незападни ресурси (ръкописи, редки книги, карти, фотографии, чертежи, скици, музикални партитури, звукозаписи, филми и др.). Всичко това ще бъде достъпно едновременно на 7 езика (английски, арабски, испански, китайски, португалски, руски и френски). Библиотеката стартира с 1170 заглавия, повече от половината от които неанглоезични. Има дори седем ранни български заглавия, сред които Неделникът на Софроний Врачански, Рибният буквар на Берон, Кратка политическа география за обучение на българската младеж на Архимандрит Неофит. Те до едно са предоставени от Конгресната библиотека.
Търсенето и отсяването на информация от ползувателите на СЦБ може да става по различни критерии, като търсенето може да бъде конкретизирано или разширявано – примерно с цел сравняване на постижения в дадена област в различни части на света по едно и също време.
Билингтън споменава за възможни проблеми, свързани с чувствителни теми, особено от най-новата история на някои страни, които техните правителства биха предпочели да се забравят или фалшифицират, нещо, което според него трудно би могло да се случи поради отворения характер на проекта за всички страни на дебата.
Съдейки от наличните източници в интернет, технологичните предизвикателства пред СЦБ се състоят в начина на дигитализиране на съдържанието, установяването на стандарти и създаването на добра навигация. Само Google през последните години е дигитализирал около 5000 заглавия от Конгресната Библиотека, но все още не е ясно кои от тях ще предостави на СЦБ. Сред партньорите на тази библиотека са такива солидни институции, като Александрийската библиотека, библиотеката на Brown University, Египетската национална библитека и архив, Международната федерация на библиотечните асоциации и иинституции, Конгресната библиотека, националните библиотеки на Япония, Бразилия, Китай, Франция, Израел, Русия, Сърбия, Швеция, Уганда, библиотеката на Йейлския университет и много други.
Във връзка с цялото това суетене около цифровизирането на съдържание, всеки, който досега е ползвал ресурси, като Google Library&Google Book Search, интернет архива на Yahoo&MSN, Amazon’s Search Inside’s, проекта Publisher Macmillian’s BookStore и любимия на много от нас Project Gutenberg, не може да не се запита какви ще са отношенията на СЦБ с тези вече утвърдени източници на дигитално съдържание? Конкурентни? Или с цел да се избегне съперничеството, дублирането на усилия и хаоса от стандарти, ще се установи някаква форма на сътрудничество?
В мрежата вече се срещат догадки за бъдещ Алианс за свободно съдържание (Open Content Alliance), както и въпроси относно евентуалното участие на Google в такъв един алианс, но това е нещо, което бъдещето ще покаже.
Едно единствено нещо смущава и изненадва сега: никъде в мрежата не се открива и намек за приложение на семантични web технологии в този иначе грандиозен и многоезичен проект.
Тезей в информационния лабиринт | Култура – Брой 31 (2514), 19 септември 2008
Наскоро си размених мейли с гл.ас. д-р Невена Панова по повод на „Тезей‛, един проект на Катедрата по класическа филология в СУ, чиято цел е да събере в електронна библиотека преводи от старогръцки и да улесни съпоставянето на българските варианти на имена и реалии и съотвентото им актуализиране и уеднаквяване. Тя сподели с мен основните си тревоги около проекта и – те разбира се бяха свързани с авторски права. Съгласно съществуващия в момента Закон за авторското право у нас, позволено е свободното ползване на текстове с образователни цели. Как обаче да се гарантират образователните цели на тъкмо такъв ресурс, който верно, е с научни намерения, но те не се подразбират по начина, по който това става при библиотеки, правещи достъпни за студентите трудни за намиране, но важни текстове? Там „образователната и научна цел‛ се подразбира от самата учебна програма, която изисква тези текстове, а в случая имаме проект за сравняване на преводачески концепции. Освен това: веднъж качен в интернет един текст би бил достъпен за всички, не само за изследователи, (ако не бъде ограничен достъпът с парола), това не би ли поставило под съмнение пред закона единствено научните му цели? И не на последно място: как точно се уреждат нещата с правото да се копира в интернет, където броят копия е практически неограничен? Предполагам, пред сайтове като „Тезей‛ стоят и други въпроси. Например, как самият ресурс да направи така, че да му се гарантира че ще бъде цитиран в библиографии наравно с други ползвани източници, както е при ‛Perseus‛, ‛British Library‛ или Конгресната библиотека.
Очевидно липсва детайлна яснота по въпросите засягащи проприетарните отношения между виртуалните библиотеки, научните институти с които те са свързани и собствениците на авторски права, но доколкото съм общувала със специалисти от подобни области (лингвисти, които разбира се, не са преводачи, но изследват съвременни текстове и то езиково) мисля, че в случая с „Тезей‛, съставителите му трябва да имат предвид не толкова опита на библиотеки като горепосочените, колкото опита на българските версии на Brown Corpus, Treebank1. Те ползват съвременни текстове (текстове от пресата), които са обект на авторско право (на съответната медия). А този опит отново опира в необходимостта да се иска разрешение за публикуване на всеки отделен текст и следване на познатата изнервяща процедура: писане на писма, чакане на отговор, получаване на отказ или разрешение.
Въпреки не винаги уредените отношения с автори и издатели, интернет библиотеките имат бъдеще. Те стават все повече, все по-богати и все по-предпочитани. Те просто са извънредно удобен инструмент за работа. Те са огромен каталог, в който не само всяка една дума е индексирана, но е и по-лесно намираема – нещо което пести неимоверно много време.
Разбира се, тази леснота си има и обратен медал, при това не само „копирайтен‛.
Информационните технологии са област прекалено динамична, за да е винаги в услуга на изследователите на класически текстове. Компаниите изгряват и залязват, технологиите биват изваждани от строя от нови технологии, бази данни стават недостъпни, а за библиотеките е важно да оцеляват през вековете и да не ги засяга малотрайността с която е обременена в самата си същост всяка една информационна стока. (Да си спомним съдбата на дискетите и компактдисковете? Колко от нас продължават да упорстват и не ползват флаш-памети?)
Но не само машините или софтуерът им имат качеството да остаряват бързо. Вековната мъдрост сведена до запис в двоичен код може чисто и просто да изчезне. Информацията не се подчинява на законите на материалния свят, не се преобразува от един вид в друг, битовете просто деградират и изчезват.
Не на последно място са проблем самите търсачки. Те откриват мигновено това, което се търси, но също така и позволяват лесно да се ограничава това търсене. Има ли механизъм, който да гарантира, че целите на собственика на такъв един инструмент винаги ще са научни?
1. Brown corpus и Treebank – най-общо казано, това са обширни и структурирани колекции от текстове, в помощ на изследвания в областта на корпусната и изчислителната лингвистика.
Обществено достояние | Култура – Брой 1 (2484), 11 януари 2008
Някои мрежови общности ( http://www.boingboing.net/2008/01/01/happy-
public-domain.html , http://www.xanga.com/publicdomain ) на първи януари
си честитят Public Domain Day. Първият ден от всяка една година е
всъщност датата на която голям брой художествени произведения, научни
трудове, изображения, нотни партитури, сменят статута си и от охраняван
обект на притежание стават достояние на човечеството. В различните
страни законите за авторско право са различни, но приблизително може да
се каже, че цивилизованият свят се дели на две половини, в едната от тях
произведенията минават в публичния домейн 50 години след смъртта на
автора, а в другата това ограничение достига до 70 години. Канада
например е от първата група страни, докато Австрия е от втората и тъкмо
тази разлика доведе миналата година до закриването на един ценен
мрежови ресурс – International Music Score Library Project (
http://www.imslp.org/ ). Тази виртуална библиотека, изградена на уики-
принцип, от датата на своето създаване (16 февруари, 2006) до деня в
който получи от адвокатите на виенската фирма Universal Edition нота за
преустановяване на дейността си, успя да събере в архива си, поне според
wiki, над 15 000 партитури за близо 9000 произведения от над 1000
композитори. На 19 октомври м.г. International Music Score Library Project
просто престана да съществува, макар по общо мнение да имаше немалко
шанс да осъди в замяна австрийците.
По подобен начин през 2004 в Германия заради нарушаване на правата над
произведенията на Адорно бе заплашен със закриване сайтът textz.com, а
основателят на общността, Себастиян Лютгерт, със затвор. Теxtz е
студентски проект, стартирал през 2001 и събрал с невероятна скорост
богата библиотека предимно от медийна теория, циркулираща свободно из
мрежата или пък скенирана от печатни носители, страница по страница,
обработвана след това с програми за разпознаване на текст и после
трансформирана в ASCII* код. Себастиан се отърва от затвора, а
общността продължи да съществува макар и в някаква по-затворена форма,
но това бе постигнато не без съпротива. В мрежата през 2004 се
подписваха петиции и циркулираше слоганът „copy adorno, go to jail?
textz.com doesn’t think so”.
Напоследък няма много анархия и романтика в мрежата, затова пък
отвреме на време има по някоя добра новина. Америка, която също като
Австрия е една от life+70 страните и бди с орлов поглед за нарушения в
копирайта, тази година свободно предоставя на света творбите на
Гершуин, Лъвкрафт, Вилхелм Райх, а от страните с 50 годишно
ограничение, публично достояние стават Никос Казандзакис, Ян Сибелиус
… също както съгласно с преминаването от 1 януари, 2008-ма към ново копирайтно законодателство, от руската wikipedia изчезват произведенията
на Ахматова и Пастернак, Маршак и Агния Барто, Манделштам,
Паустовски, Хармс, Гумильов, Платонов, любимите от детството ни
Чуковски и Каверин. Те ще могат да бъдат четени свободно едва през
втората половина на века. А ‘Майсторът и Маргарита’, публикувана през
1960-те ще бъде забранена някъде докъм 2030-та.
Копирайтът има своята логика – печалба, основана на голям брой
продадени копия. Има обаче и други видове логика, незадвижвана от
алчност и това е логиката на тези, които искат да четат. Не е нужно да
кръстосваме дълго интернет, за да открием такива. Има ги достатъчно и в
българоезичната web. Ще припомня един особено фрапантен пример,
който дава доста сериозен повод за размисъл – сблъсъка между ИК Труд и
Виктор Любенов, създателят на библиотеката bezmonitor.com през
пролетта на 2006. Най отвратителното в случая бе, че претенциите на
издателската къща бяха насочени към ресурс за незрящи хора.
Не са много тези, които се вълнуват (http://www.gatchev.info/blog/?p=577 )
какво и как се случва с едно произведение след изтичането на авторските
права над него, дали то се превръща в обществено достояние или става
притежание на държавата и има ли изобщо някакво официално становище
по въпроса. Още по-малко са тези, които се питат цензура ли е копирайтът
или чисто и просто бизнес. Немногобройността на мислещите обаче
съвсем не винаги означава неспособност за оказване на съпротива при
рекет.
…
*ASCII – американски стандартен код за обмен на информация.