Atviri duomenys! Statistinė analizė! Duomenimis remti sprendimai!

Pavadinime yra mano pagrindiniai rinkimų šūkiai.

Gali būti, kad ne visi supras šių šūkių prasmę taip, kaip aš. Todėl pasakysiu kaip tai suprantu aš Man atrodo, kad svarbu yra paaiškinti savuosius šūkius. Galbūt tai kam nors paskambins skambučiu*.

Atviri duomenys

Daugelis turi supratimą ar įsivaizdavimą apie tai kas yra atviri duomenys. Paaiškinimas tam yra gan paprastas, bet atvirų duomenų kokybė (arba standartizavimas) yra gan plati tema. Du teiginiai apibendrinantys Wikipedia straipsnį:

  • tai yra viešai pasiekiami duomenys
  • tai yra duomenys neapriboti jokiomis autorinėmis teisėmis (t.y. duomenis naudoti ir juos interpretuoti gali kiekvienas kaip nori – be jokių apribojimų)

Nuo savęs dar pridėčiau, kad tų duomenų atvėrimas turi atitikti GDPR (arba BDAR). Ir dar pridurčiau, jog pagrindinės atvirų duomenų charakteristikos yra: kokybė, aktualumas, struktūra.

Tame pačiame Wikipedia straipsnyje yra išskirti valstybiniai atviri duomenys kaip itin svarbi to dalis. Ir tikrai tai yra labai svarbu.

Demokratijoje valdžia yra skaidoma į dalis ir suteikiama dažniausiai laikinai konkretiems žmonėms. Tai yra saugikliai apsaugantys visuomenę nuo absoliučios valdžios koncentracijos siauruose ratuose ir nuo jos piktnaudžiavimo. Išlaikyti tą status quo nėra paprasta, nes žmonės yra linkę kaupti valdžią, ją koncentruoti ir ja piktnaudžiauti. Turi būti nuolat veikiantys, patikimi ir prižiūrimi saugikliai. Tokiais saugikliais, kaip minėjau, yra valdžios padalinimas, institucijos kaip Vyriausioji Rinkimų Komisija, biurokratiniai barjerai ir kiti dalykai numatyti Konstitucijoje. Visi tie saugikliai veiks tik tuo atveju, jeigu informacijos srautai bus skaidrūs ir neiškraipyti.
Įvairūs melai, propaganda, gali teikti iškreiptą vaizdą institucijoms, rinkėjams ir saugikliai nebeveiks. Pavyzdžiui: koks nors politikas sugalvotų korupcinę valdžios piktnaudžiavimo schemą, ją realizuotų ir gautų iš to pinigų, o vėliau juos išsiplautų, pavyzdžiui, pasistatydamas namą. Koks nors landus žurnalistas galimai paklaustų iš kur pinigai tokiam namui, o politikas galėtų atsakyti, kad tai jo tėvų pinigai. Ir skandalas arba pasibaigtų arba ne. Jeigu pasibaigtų, tai politikas ir toliau darytų savo makles ir jas plėstų.

Tad, ko reiktų, kad skandalas nesibaigtų, kad korupcines schemas kuriantis politikas būtų nubaustas? Arba dar geriau: ko reiktų, kad politikas net nenorėtų korupcinių schemų kurti? Kaip padidinti bausmės neišvengiamumo jausmą norinčiam nusikalsti asmeniui? Ogi reikia apriboti galimybes meluoti ir išvengti tų melų atskleidimo. Vienas geriausių būdų kuo objektyviau atspindėti realybę ir išvengti melagingų jos interpretacijų – atviri duomenys.
Atviri duomenys nėra kažkoks stebuklas kuris imtų ir užkardytų korupciją iš karto. Ne. Atviri duomenys potencialiai gali padėti beveik stebuklus kurti, jeigu jie kokybiški, jeigu jie nuolat atnaujinami ir kaupiami, ir jeigu jie yra analizuojami. Įsivaizduokite, jeigu kokioje nors susisiekimo ministerijoje būtų realizuota atvirų duomenų iniciatyva ir duomenys apie finansinius srautus, užsakymus, atliekamus darbus, problemas ir t.t. būtų saugomi laisvai prieinamoje viešoje vietoje. Įsivaizduokite, jeigu tie duomenys būtų struktūrizuoti, lengvai iškoduojami. Įsivaizduokite, kad bet koks programuotojas laisvalaikiu galėtų suprogramuoti skript’ą, kurio pagalba galėtų tuos duomenis analizuoti įvairiais kampais. Arba tiesiog įsivaizduokite ministerijas savo duomenis atveriančias taip kaip Vilniaus savivaldybė**.
Iniciatyvių, laisvų tiek širdimi tiek protu žmonių ir net programuotojų yra. Aš keletą pats pažįstu. Štai kad ir, pavyzdžiui, Mantas padarė labai įdomią Vilniaus pastatų administravimo įmonių statistinę analizę iš duomenų, kuriuos atvėrė registrų centras (atsidarę pascroll’inkit truputį ir pamatysite grafikus). Pas jį GitHub’e dar įdomesnių dalykų rasite. Taip pat galite rasti ir rekomendacijas standartizacijai, kaip atverti duomenis. Galima būtų specialiai tam manifestui kurti įstatymą ir diegti jį visose valdiškose institucijose.
Dabar prisiminkime bausmės neišvengiamumo jausmą. Kaip manote, ar jis sustiprėtų? Ar sustiprėtų, jeigu turintis pagundą nusikalsti asmuo žinotų, kad pėdsakai yra fiksuojami ir jei ne iš karto, tai galbūt vėliau viską bus galima atkapstyti ir to niekaip negalėtum kontroliuoti?

Statistinė Analizė

Man mokykloje neblogai sekėsi tikslieji mokslai. Bet aš tiek mokykloje tiek universitete ne visai supratau koks galingas ir geras įrankis yra statistinė duomenų analizė. Matematika yra faktų kalba. Faktų ir dėsnių kalba. Su aksiomomis nelabai pasiginčysi. Nevaidinsiu, kad labai gerai išmanau statistinę analizę, bet aš labai aiškiai suprantu, kokia naudinga ji gali būti (ypač šios pandemijos atveju).
Iš tokių įdomesnių – Benford’o dėsnis, kuris, jei labai trumpai, reiškia, kad natūraliuose skaičiuose yra specifinės tikimybės būti didesniems ar mažesniems skaitmenims. Natūraliuose, tai tuose, kurie aprašo kažkokius realaus gyvenimo skaičius – pavyzdžiui kainas, tarifus, kiekį kažkokių daiktų ir pan. Tai štai, pirmas skaitmuo natūraliuose skaičiuose, pagal Benford’o dėsnį dažniau būna mažesnis. Ir tai nėra kažkoks prietaras ar empirinis pastebėjimas. Tai turi gan stiprų pagrindimą (žr. “Benford’s law” kur nors googlėj, pvz wikipedia). Aš netgi mėginau tai mėgėjiškai pritaikyti atvertiems Grindos duomenims paanalizuoti. Vėliau girdėjau, kad auditų firmos naudoja šį dėsnį ieškodamos neatitikčių kokiuose nors finansiniuose duomenyse.
Įsivaizduokite, jei ministerijų duomenys būtų atveriami ir valstybės kontrolė galėtų greitai ir patogiai naudoti įvairius statistinės analizės įrankius (tame tarpe ir Benfordo dėsnį) tų duomenų analizavimui ir neatitikčių identifikavimui.

Duomenimis remti sprendimai

Tai yra sprendimai, kurie padaromi remiantis duomenimis. Principe tiek. Atrodo paprasta, bet tai irgi nėra labai lengvai pritaikoma, nes nebūna duomenų, nes nebūna kas galėtų analizuoti tuos duomenis, nes nebūna, kas tą analizės rezultatus galėtų interpretuoti. Įsivaizduokite, jeigu ministerijose būtų atveriami duomenys pagal vienodą standartą, tie duomenys būtų apdorojami ir analizuojami naudojant įvairias priemones (tame tarpe statistinę analizę) ir įsivaizduokite, jei tuos duomenis ministerijų darbuotojai sugebėtų suprasti, interpretuoti ir daryti sprendimus remiantis tomis išvadomis.

 

Tam kad kuo daugiau žmonių suprastų, kas tie duomenys, kas ta statistinė analizė, kaip ir kodėl svarbu daryti sprendimus remiantis faktais reikia šiokio tokio matematinio išprusimo. Žvelgdamas į pastarųjų dienų aktualijas dėl prastų valstybinio matematikos egzamino rezultatų galėčiau nusivilti savo entuziazmu  dėl atvirų duomenų. Bet nenusiviliu 🙂 Tie prasti rezultatai nebūtinai reiškia, kad ta 1/3 jaunų žmonių negali suprasti viso to naudos.  Man atrodo, kad tai labiau reiškia, jog matematika, kaip dalykas jų nesudomino, nes niekas neįrodė kokia to nauda praktiniame gyvenime.

Kaži ar nesusidomėtų vaikas matematika jei jam pasakytumėm, kad visi tie kompiuterių, išmaniųjų telefonų ir panašių įrankių, kuriuos bene kiekvienas abiturientas naudoja, ir apskritai IT veikimas paremtas matematikos/fizikos dėsniais. Ar nebūtų įdomiau mokytis matematikos, jei vaikui parodytumėm koks yra jos praktinis pritaikymas? Pavyzdžiui naudojant atvirus duomenis. Manau, kad būtų***.

Aš manau, kad Lietuvai ir Lietuvos Seimui bei Vyriausybei labai trūksta atvirų duomenų, jų analizės ir jais paremtų logiškų protingų sprendimų. Todėl ateikite šį rudenį į rinkimus ir balsuokite už Laisvės Partiją, ten reitinguokite mane (nr. 32) ir jeigu galite paremkite mano rinkiminę kampaniją, kad savo idėjomis galėčiau sudominti kuo daugiau rinkėjų:

Tai rinkiminė agitacija parengta ir išplatinta paties kandidato turimais įrankiais bei kanalais.

——————————————-

* – Šitą nusižiūrėjau nuo vieno žymaus publicisto, kurio vardo ir pavardės nenoriu minėti, nes tuoj sulėks heiteriai. T.y. naudoti tiesioginius angliškų posakių vertinius. Šitas yra “rings a bell”.

** – Ten, straipsnyje, yra graži vartotojui suprantama informacija, o patys duomenys yra saugomi čia: https://github.com/vilnius. Visi grafikai, žemėlapiai ir kt. įrankiai yra pagaminti iš duomenų, kurie struktūrizuojami, nuolat atnaujinami ir dedami į tą Github. Github irgi yra įrankis leidžiantis programuotojų automatizuotiems script’ams naudoti ten esančius duomenis ir kt. kodą.

*** – Ir dar manau, kad būtų kur kas mažesnis entuziazmas naudoti internetinį balsavimą valdžios rinkimuose.

Skirmantas Tumelis

Sudėtingi dalykai susideda iš paprastų. O patys sunkiausi yra paprasti dalykai.

What do you think?

Note: Your email address will not be published

You may use these HTML tags and attributes:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> <div align="" class="" dir="" id="" lang="" style="" xml:lang=""> <embed style="" type="" id="" height="" width="" src="" object=""> <iframe width="" height="" frameborder="" scrolling="" marginheight="" marginwidth="" src=""> <img alt="" align="" border="" class="" height="" hspace="" longdesc="" vspace="" src="" style="" width="" title="" usemap=""> <map name="" area="" id=""> <object style="" height="" width="" param="" embed=""> <param name="" value=""> <pre style="" name="" class="" lang="" width="">

Popo.lt tinklaraščiai. Hosting powered by   serverių hostingas - Hostex
Skip to toolbar