Ziua datelor deschise
Autor: Cătălin Bindea
Pe 7 Martie, în fiecare, an sărbătorim Ziua Datelor Deschise, o zi importantă în biroul Code for Romania. Pentru că accesul la date deschise, parte din raportul de Transparență din Civic Labs, și una dintre cele șapte propuneri publice pentru digitalizarea României, este unul dintre obiectivele cele mai importante ale organizației noastre, și nu doar pentru că lucrăm cu ele zi de zi. Datele deschise pot aduce avantaje economice semnificative, pot îmbunătăți cercetarea socială și pot duce la inovații și veritabile salturi înainte în societate. La Timișoara, de exemplu, a fost nevoie de un singur flux de date deschise privind transportul public ca să apară o suită de aplicații gratuite de transport care au ușurat viața timișorenilor. Pentru că avem încredere în datele deschise și pentru a stimula acest gen de mici schimbări cu impact major, de 7 Martie vrem să vă vorbim despre Data Portal.
Data Portal este o platformă de date deschise care găzduiește și servește, prin API, seturi de date, configurat la standardele europene de deschidere a datelor, integrat cu un sistem de vizualizare de date (Tableau) care va crește gradul de accesibilitate al cetățenilor la informații și va servi ca bază de fundamentare pentru decizii luate la nivel local atât în spațiul public, cât și în cele private sau non-profit. Code for Romania asigură, cu ajutorul voluntarilor inimoși, dezvoltarea platformei, integrarea ei cu sistemele existente în instituții publice și automatizarea (acolo unde este posibil) a colectării de date de interes public la nivelul fiecărei primării. Soluția este gândită să poată oferi un portal de date la cheie pentru orice instituție ce se arată interesată, instalarea și configurarea ei fiind doar o chestiune de ore.
De ce toate acestea? Trăim în epoca “big data”, în care seturile de date, ajunse în mâinile care trebuie pot schimba o comunitate, un oraș sau, de ce nu, o țară. Proiectul Data Portal vrea să facă acest lucru facil și să stimuleze creșterea unei comunități în jurul ideii de hub de date la standard înalt, idee scalabilă atât în jos, la nivel local, unde avem deja trei parteneriate pilot, cât și în sus, la nivel internațional. În plus, Code for Romania nu înseamnă doar programatori. Printre oamenii care fac voluntariat în cadrul organizației avem un “sâmbure” de sociologi, statisticieni și data scientists din mediul universitar, membrii ai societății civile sau ai mediului de business, antreprenorial local, cu care construim strategii și ne aliniem proiectele pentru viitor. Invariabil, între oamenii care lucrează cu date există un consens că România e deficitară la capitolul date publice - să ne amintim de exemplu că 2014 este ultimul an în care ministerul mediului, apelor și pădurilor a încărcat seturi de date în portalul național sau că avem peste 7.7 milioane de declarații de avere care nu sunt digitalizate deci nu se pot face corelații sau analize reale pe baza lor. Nu numai că marea majoritate a datelor nu sunt deschise dar datele ce pot fi accesate public sunt de cele mai multe ori de calitate inferioară, seturi de date poluate, grosiere, pline de entry-uri incomplete, erori de formatare sau grafice construite greșit și complet nearmonizate cu alte seturi de date. Toate acestea înseamnă că este extrem de dificil să lucrezi cu seturile de date ce pot fi accesate în acest moment în România și că, de cele mai multe ori, trebuie să investești mult timp și resurse în aducerea acelor date la un standard minim utilizabil.
Din punctul nostru de vedere, România nu are momentan un portal de date deschise gândit pentru public sau pentru terțe părți. Portalele de date existente nu sunt gândite din perspectiva ușurinței de a fi utilizate sau citite și sunt de obicei seturi compacte de date încărcate “pentru că trebuie”. În egală măsură datele prezente în puținele baze de date existente nu îndeplinesc niște criterii de bază de “curățenie” și structură a datelor care le-ar face mult mai utile în cercetare. Și aici intervine proiectul nostru, Data Portal, care are două componente: la nivel local, Data Portal-urile celor trei (pentru moment) orașe pilot ce urmează a fi lansate curând (Timișoara, Cluj și Iași) ce vor centraliza datele publice și, cu ajutorul comunității universitare locale, vor crea seturi de date standardizate ce pot fi folosite de data scientists, sociologi, jurnaliști și statisticieni pentru a extrage informații utile pentru o Românie mai informată. Portalul național Data Portal administrat de Code for Romania va centraliza date deschise din societatea civilă (va cuprinde inclusiv seturile de date pe care Code for Romania le deține), din sectorul privat și alte zone cu date valoroase ce nu pot fi puse pe portalul de date al Guvernului. Echipa de voluntari Data Portal va organiza după aceeași structură ca în cazul Portalurilor locale toate seturile de date, astfel încât seturile să fie compatibile între ele și să permită o analiză pe toate palierele.
Ne dorim ca proiectul Data Portal să devină un proiect de bază pentru dezvoltarea unei comunități robuste de Open Data în România. Credem că este unealta tehnologică perfectă prin care vom pune infrastructura de date și know-how-ul nostru la dispoziția voluntarilor interesați de “deschiderea” și “curățarea” datelor publice din România dar și a societății pe de-a-ntregul.
Profit de ocazie să îi invit la discuții despre Open Data și soluția Data Portal dezvoltată de Code for Romania atât pe cei ce dețin date și doresc să le facă disponibile publicului cât și reprezentanților de orașe care își doresc transparență în relația cu cetățenii săi.