Schema #64. Apie 2020 Seimo rinkimų komisijų pirmininkus

MeWe socialiniame tinke kilo nedidelė diskusija rinkimų komisijų pirmininkų tema. O tiksliau dėl Kauno Centro-Žaliakalnio apygardos. Ten net trims apylinkėms pirmininkaus tomaševskininkų siūlyti žmonės. Kauniečiui, t.y. Kaune gyvenančiam žmogui, tai pasirodė keista.

Tam, kad suprastumėm ar tai atsitiktinumas, ar tai kažkokia tendencija – turime paanalizuoti daugiau duomenų. Pačiame vrk.lt tuos duomenis apie komisijų pirmininkus, t.y. juos siūlančias organizacijas, pasiimti nelengva. Todėl paprašiau šios informacijos VRK emeilu. Man pačiam nelabai tikėtai gavau informaciją labai greitai (per dieną ar dvi). Tai puiku! VRK būna dėmesio centre per kiekvienus rinkimus ir paprastai geruoju jų niekas nemini. Tai aš čia juos, šiuo atveju, miniu geruoju. Žinoma, būtų geriau, jei būtų aiškus atveriamų duomenų standartas* ir tokie kaip aš galėtumėm pasiimti šią info patys iš vrk.lt, o ne prašyti emeilais.

Aišku yra viena smulkmena, kuri keista ir nustebino – excelyje, kurį man atsiuntė, jie negalėjo įdėti pirmininkų vardų/pavardžių dėl asmens duomenų apsaugos. Tie vardai ir pavardės vrk.lt matomi viešai. Bet exceliu jų atsiųsti nenorėjo. Keista. Bet vardai/pavardės neesmė. Man įdomiau yra pirmininkus siūliusios organizacijos. Taigi, čia bus to excelio duomenų analizė.

Continue reading Schema #64. Apie 2020 Seimo rinkimų komisijų pirmininkus

Atviri duomenys! Statistinė analizė! Duomenimis remti sprendimai!

Pavadinime yra mano pagrindiniai rinkimų šūkiai.

Gali būti, kad ne visi supras šių šūkių prasmę taip, kaip aš. Todėl pasakysiu kaip tai suprantu aš Man atrodo, kad svarbu yra paaiškinti savuosius šūkius. Galbūt tai kam nors paskambins skambučiu*.

Atviri duomenys

Continue reading Atviri duomenys! Statistinė analizė! Duomenimis remti sprendimai!

Schema #61. Laisvės partijos kandidatų reitingavimas.

Tai pirmas post’as po gan ilgos pertraukos. Neberašiau į čia ir netgi, tiesą sakant, pamiršdavau į čia rašyti, nes daugiausiai bendravau ir postinau į Facebook’ą, truputuką į MeWe ir dar truputuką į Reddit’ą. O šią wordpress’o platformą visai apleidau. Dabar prisiminiau, nes tai puikus kanalas nagrinėti man įdomias temas centralizuočiau ir labiau kontroliuojamai. Nes soc. tinklų algoritmai nulemia tai ką auditorijos matys, o čia aš galiu daugiau valdyti.

Tai be tolimesnių įžangų – čia papostinsiu Laisvės partijos kandidatų į Seimą 2020 rinkimuose reitingavimo rezultatus keliomis formomis (tame tarpe tinklo diagramą).

Continue reading Schema #61. Laisvės partijos kandidatų reitingavimas.

Kaip aš spėliojau rinkimų rezultatą.

Ar galima prognozuoti rinkimus Lietuvoje? Labai panašiu pavadinimu yra Mažvydo Jastramskio ir kitų autorių knyga. Ten jis ir jo kolegos mėgina prognozuoti Seimo rinkimus.
Aš, savo ruožtu, mėginau prognozuoti Vilniaus miesto mero rinkimus iš karto po pirmojo turo. Mėginau du kartus. Pirmas buvo Remigijui Šimašiui: 55.2% (Artūrui Zuokui: 44.8% atitinkamai):

Pirmasis spėjimas
Pirmasis spėjimas

Continue reading Kaip aš spėliojau rinkimų rezultatą.

Balsų pirkimo skandalas VMS rinkimuose

Darant man savo analizes apie sąrašų kokybę pas vrk.lt aptikau įdomų dalyką:

Ponas Valerij Stankevič išbrauktas iš sąrašo dėl šiurkščių pažeidmų
Ponas Valerij Stankevič išbrauktas iš sąrašo dėl šiurkščių pažeidmų

VRK sako, kad išbrauktas kandidatas dėl šiurkščių įstatymo pažeidimų. Paklausinėjau frakcijos kolegų – paaiškėjo, kad kažkoks skandalas su balsų pirkimais. Neva Valerij Stankevič papirkinėjo rinkėjus, kad šie jį reitinguotų biuleteniuose.

Nagi, pasižiūrime ką mums sako duomenys.

Continue reading Balsų pirkimo skandalas VMS rinkimuose

Rinkiminė statistika, analizė: sąrašų kokybė. Schema #58

Praėjusią schemą užpostinau per ~20 minučių. T.y. paskubomis. Gavau pastabų dėl žemėlapių aiškumo. Tai sekančiai žemėlapių dozei pasistengsiu atsižvelgti į pastabas ir padarysiu geriau.

O čia dabar bus sąrašų kokybės pamatavimas pagal mano paties sugalvotą metodą. Prieš trejus metus tuo metodu pamatavau LRLS sąrašo sudarymo kokybę. Dar palyginau su kitais sąrašais. Ir dar to paties LRLS sąrašų kokybę per skirtingus rinkimus.

Idėja tokiems matavimams man atsirado dalyvaujant partiniuose sąrašų reitingavimo renginiuose ir matant kaip ten viskas vyksta. Tie sąrašų sudarymai yra gan svarbūs partijai ir ten visada būna daug intrigų. Ir dažnai tos intrigos dėl lokalių optimumų dilemos kenkia partijoms. Apie tai kas yra lokalūs optimumai ir kaip jie veikia paskaitykite pas Rokiškį. Jei labai trumpai apie lokalius optimumus politikoje, tai kai koks nors kaimiškosios vietovės politikas įgauna neadekvačiai didelę įtaką ir nacionaliniame sąraše papuola į pirmąjį dešimtuką. Partijoje jį visi pažįsta, bet Lietuvoje – ne. O jeigu dar paprasčiau, tai lokalus optimumas yra kai ant tiltelio susitinka du ožiukai ir praeiti nei vienas negali.

Aš mąsčiau kaip parodyti ar įrodyti partiečiams šios problemos svarbą. T.y. blogas, lokalių optimumų sudarytas sąrašas gali surinkti mažiau balsų, nei objektyvesnis/geresnis. Matomi, aktyvūs, gerai kalbantys, protingi žmonės turėtų būti sąrašo viršuje. Šitaip jie motyvuos ir rinkėjus ir žemiau esančius kandidatus tapti geresniais bei imti gerą pavyzdį. O žmonės, kurie atsiduria sąrašo viršuje, nes prasuko kokią nors varkę – demotyvuoja rinkėjus, o kitus kandidatus motyvuoja taip pat imtis intrigų ir tokia sistema pati save gadina.

Problemos su kuriomis susidūriau mėgindamas pamatuoti sąrašo kokybę: kilti/leistis sąrašo viršuje daug sunkiau – ten reikia surinkti kur kas daugiau balsų, kad galėtum pakilti, nei sąrašo apačioje. O taip pat kiekvienas sąrašas gauna skirtingą kiekį balsų ir jų sąrašų kokybę lyginti tarpusavyje nėra taip trivialu – duomenis reikia normalizuoti.

Pirmąją problemą sugalvojau išspręsti suteikdamas kiekvienai vietai reitingų svorius – kuo aukštesnei vietai – tuo didesnį pagal tų vietų surinktus reitingus. Savotiška Paretto diagrama, tik skaičiuoju ne procentus, o reitingo balsus. Šitaip kandidatai esantys sąrašo viršuje gauna didelį svorį pagal visų žemiau esančių kandidatų reitingų sumą. Ir tada pagal tai kur kandidatas buvo prieš rinkimus sąraše ir po – surandamas tų svorių skirtumas. Jeigu kandidatas krenta sąraše – gaunamas neigiamas skaičius, jei kyla – teigiamas.

Supaišiau visus sąrašus į excelį, padariau paveikslėlius ir štai kas man gavosi:

Continue reading Rinkiminė statistika, analizė: sąrašų kokybė. Schema #58

Rinkiminė statistika, analizė ir duomenys. Schema #57

Rinkimai baigėsi. Prasideda rinkimai.

Visų pirma ačiū visiems, kurie balsavote už Vilnių, kuriuo didžiuojamės Vilniaus miesto savivaldybės rinkimuose. Ir ačiū visiems, kurie balsavote už Remigijų Šimašių. Ir ačiū visiems, kurie reitingavote mane. Čia yra mano Vilnius:

Continue reading Rinkiminė statistika, analizė ir duomenys. Schema #57

Už Vilnių, kuriuo didžiuojamės reitingavimas. Schema #53

Praėjo keletas dienų/mėnesių nuo paskutinio mano post’o į čia. Mokausi dirbti Agile’u, taikome SAFe’ą, tai laiko mažai labai lieka laisvo, o jei lieka, tai nesinori į ekraną žiūrėti (o pažiūrėjus JIRA akyse stovi).

Su sąlyga, kad dabar esu trumpose atostogose – laiko atsirado ir blogui.

O nuo paskutinio mano įrašo čia įvyko įdomių dalykų. LRLS Vilniaus skyrius, nusprendęs į savivaldybių rinkimus eiti komitetu, sukėlė sąmyšį partijos valdžioje. Partijos valdžia nutarė, jog geriau praras dabartinį Vilniaus skyrių, nei leis tokią šventvagystę.

Kiek žinau, visa liberalų Vilniaus savivaldybės frakcija išėjome iš partijos ir dabar esame “Už Vilnių, kuriuo didžiuojamės” komiteto nariais. Aš dar tuo pačiu pasiprašiau pas Aušrinę į partiją, kuri yra dabar, jei suprantu teisingai, steigiama. Na, o LRLS, mano galva, liko instituciniai fanai-idealistai ir kitokie žmonės, kuriuos aš mažiau pažįstu. Bet čia aš ne apie juos. Aš apie mus, apie “Už Vilnių, kuriuo didžiuojamės“.

Continue reading Už Vilnių, kuriuo didžiuojamės reitingavimas. Schema #53

Schema #44. Lietuvos rinkėjų žemėlapis 1 dalis.

Nebesugalvoju kažko dvasingo parašyti į blogą. Vis schemos ir schemos. Bet tikiuosi, kad kam nors įdomu bus ir tai.

VRK atvėrė visus Lietuvoje balsavusiųjų rinkėjų biuletenių duomenis.

ATVĖRĖ BIULETENIŲ DUOMENIS!!! Tai yra didžiulis  kokybinis šuolis skaidrumo ir įdomumo link. Ponas Jonas Bačelis, kuris yra pats geriausias duomenų analitikas, kokį žinau (jis dar, jeigu neklystu, Švedijos Geteborgo universiteto genetikos mokslų daktaras) truputį parodė ką galima su tokiais duomenimis padaryti:

 

Aš, ta proga, sudėjau visus tuos biuletenius į savo mėgstamą Gephi. Gephi per maždaug ~1 naktį nupiešia vienos partijos žemėlapį. Tai aš per porą naktų paprašiau kompo nupiešti man LRLS i TS-LKD žemėlapius. Šiuose žemėlapiuose yra tik tie rinkėjai, kurie reitingavo nors vieną kandidatą balsuodami už sąrašą:

Continue reading Schema #44. Lietuvos rinkėjų žemėlapis 1 dalis.

Schema #43. Sąrašo pokyčių koreliacijos su rezultatais.

Aš tikriausiai jau įgrisau jums su savo rinkiminėm schemom. Bet va vieną dar sugalvojau čia įdėti. Vėliau mėginsiu ką nors dvasingesnio parašyti. Gal net kas gausis.

O čia dabar bus mano paties sugalvotas ir jau beveik standartizuotas metodas, parodantis pokyčių Seimo rinkimų sąraše mastą. O tas mastas, savo ruožtu, galbūt atsitiktinai visai koreliuoja su galutiniais rinkimų rezultatais.

O rinkiminis sąrašas, žinia, yra viena karščiausių temų partijos viduje ir taip pat gan gausiai aptarinėjama viešojoje erdvėje. Gerą sąrašą sudaryti nelengva: jis gan svarbus rinkėjams, todėl partija turi suprasti ką rinkėjai galvoja; sąrašas tai pat svarbus kandidatams, todėl jie daro tokią savotišką rinkiminę kampaniją partijos viduje. Tos vidinės kampanijos būna įvairios: nuo kokių nors straipsnių rašymo vidiniuose portaluose ar emeilų siuntinėjimo iki visokių intrigų schemų kūrimo. Suvaldyti visą šį procesą tikrai nelengva.

Continue reading Schema #43. Sąrašo pokyčių koreliacijos su rezultatais.