Nu iubim și cărțile vechi?
Am primit o recomandare de carte, Călători străini în Țările Române, vol. 1 care se găsește gratuit pe site-ul bibliotecii digitale a Bucureștilor. Ceea ce e excelent, doar că formatul e pdf, ceea ce înseamnă că e greu de citit. Paginile sunt mari, nu pot fi modificate, nu pot să-mi trimit cartea pe Kindle, nu pot s-o citesc ușor de pe tabletă, dacă o dau cu copy-paste văd tot felul de bazaconii.
E de înțeles că formatul e pdf: după ce scanezi o carte, e relativ simplu să transformi „pozele” imaginilor într-un singur volum. E varianta cea mai simplă de a digitiza o carte și, nu mă înțelegeți greșit, sunt foarte fericită că există cărți vechi care au fost digitizate în felul acesta – e mult mai bine decât să nu fi fost deloc.
Doar că se poate și mai bine și se poate și mai confortabil. Uite aici, o carte cu poze care a fost transformată în html. A fost ceva de muncă pentru ea, dar munca merită pentru toți cei care vor s-o citească sau s-o răsfoiască.
De fapt, sunt mai multe motive pentru care vrei să ai o carte în html și nu în pdf:
- e mai ușor de citit pentru publicul larg
- e mult mai ușor să găsești pasaje și să citezi din ea
- e mai ușor de retipărit/printat (dacă vrei așa ceva)
- ocupă mult mai puțin spațiu, lucru de care mie ca utilizator îmi pasă puțin, dar care contează mult pentru biblioteca digitală. Cartea care mi-a fost recomandată are 17,2 MB – sunt dimensiuni la care gigabiții încep să dispară rapid. Project Gutenberg, în schimb, oferea în 2006 un DVD cu 17.000 de cărți. N-au nevoie de foarte mult spațiu și nici traficul lor de date nu e îngrozitor, de-aia nu cârâie tot timpul după fonduri.
Nu vreau să spun că biblioteca ar trebui să se ocupe de asta. E ceva de muncă dacă vrei să transformi o carte scanată într-un ebook de vreun fel sau altul. Însă țara noastră are voluntari disperați să facă voluntariat – i-am văzut uneori pe străzi, voluntariind cu îmbrățișări grauite și fluturași de diverse. Probabil că ar fi interesați și de așa ceva.
Mai demult, am făcut voluntariat pentru Project Gutenberg (unul dintre cele mai bune site-uri cu cărți gratuite) fix pentru treaba asta, prin Distributed Proofreaders – doar că textele respective erau în engleză, nu în română, pentru că n-aveau nici cărți în română, nici voluntari români prea mulți. Procesul prin care trecea cartea acolo nu era complicat, doar lung:
- Se trece cartea scanată printr-un program de OCR, care să recunoască cea mai mare parte din textul din imagine și să-l transforme în text electronic.
- Cineva corectează textul electronic, ca să se asigure că îi corespunde textului inițial (pentru că programul poate citi o-uri în loc de e-uri, „L” mic în loc de „i” mare și alte asemenea).
- Cineva vine și adaugă tag-uri html pentru chestii cum ar fi italicele, bold-urile și sublinierile.
- Cineva face post-procesarea cărții, ca să transforme munca celor de dinainte într-o carte electronică efectivă. Dacă sunt poze în cartea inițială, de exemplu, le taie și le inserează în cartea electronică.
Și, efectiv, la Distributed Proofreaders se înscrie oricine vrea. Începi din poziția de corector (proofreader), în prima rundă, cea pentru oamenii noi. Apoi treci în runda a doua de corecturi, în care se presupune că ai ceva experiență și te-ai prins cum merge treaba. Apoi, dacă vrei, poți ajunge în runda a treia de corecturi, în care sunt cei foarte buni la treaba asta.
După cele trei runde de corectură, vin două de formatare (în care ajungi după ce ai corectat câteva pagini și ai prins mișcarea acolo – nu trebuie să fii super-corector pentru asta), una pentru cei nou-veniți, una pentru cei care sunt deja buni la ce fac.
După ce cartea a fost corectată și răscorectată, după ce toate tag-urile de formatare sunt acolo unde trebuie, cineva ia cartea și îi face post-procesarea, ca să o strângă într-o formă bună. Se verifică să fie cartea în regulă, apoi e postată pe Project Gutenberg.
Procesul nu trebuie neapărat să dureze mult. Munca se poate distribui între mai mulți corectori și mai mulți oameni care se ocupă de formatare și poate fi chiar distractivă. Citești câteva pagini, te prinzi ce-i cu cartea, eventual o citești pe toată dacă te interesează – sau rămâi doar cu frunzăreala.
Merită, deci. Merită pentru viitorii cititori, merită pentru voluntari. Trebuie doar demarat ceva, împinse niște forțe care există deja (voluntariatul, eforturile de digitizare ale bibliotecii) către un scop comun.
Mai e o chestie: să zicem că o bibliotecă n-are oamenii necesari să creeze un site sau o platformă pe care voluntarii s-o acceze simplu și ușor. E în regulă: pot colabora direct cu Distributed Proofreaders. Ei au tot ce le trebuie din punct de vedere tehnic, chiar dacă site-ul e neschimbat de pe vremea lui Pazvante. Sigur, textele ar ajunge și pe Project Gutenberg – dar e o problemă?
Singura chestie ar fi să se găsească niște voluntari pentru treaba asta, iar apoi să se discute cu șefii de la DP – nu pentru permisiune, ci ca să se negocieze niște avantaje, gen tratament preferențial pentru cărțile în română (dacă-mi aduc bine aminte, cărțile în română erau trecute la „alte limbi” și n-ar fi indicat să fie blocate după un dicționar danez-esperanto, cel mai lung roman în slavonă și cine știe ce alte chestii).
N-ar fi așa de greu.