Schema #47. 2016-2020 kadencijos Seimo frakcijos iki šiandien

Mantas Zimnickas savo stebuklinga galva ir rankomis sugalvojo kaip iš ganėtinai OpenData not friendly lrs.lt nuscrapinti duomenis apie balsavimus.Tai nuscrapino. Rado balsavimus nuo 1997. Gal tik nuo tada ta informacija buvo renkama patogiu būdu.
Čia žiūrėkite ką jis su kažkokiu “Jupyter” įrankiu prigamino. Man ši informacija įdomi tuo, kad matome kas daugiausiai prisidėjo prie to, kur šiandien esame savo sprendimais paspausti “už”, “prieš” ar “susilaikė”. Dar įdomu, kad daugiausiai balsavimų buvo 2002 ir 2009 metais. 2009 – “naktinės reformos” metai. Metai, kai Lietuvą Kubilius gelbėjo iš krizės. Dėl 2002 metų nepamenu kas ten buvo. Reikia pafollowupinti.

Na, o aš, savo ruožtu, padariau tai ką dariau su Vilniaus taryba. Sudėjau šios kadencijos Seimo narius į Gephi ir padariau realių frakcijų analizę. Ne tai ką politikai suokia, o tai ką paspaudžia pultelyje Seimo posėdžių salės konsolėje. Jei kas nors norės pasiginčyti – eikit ginčytis su skaičiais.

Primenu, kad Gephi turi tokį “Force atlas” algoritmą, kuris padaro štai ką:

Continue reading Schema #47. 2016-2020 kadencijos Seimo frakcijos iki šiandien

Schema #46. Vilniaus miesto tarybos sprendimų analizė.

Šiandien duše sugalvojau, kad Vilniaus miesto tarybos darbą galima analizuoti ne tik tarybos narių balsavimo kontekste, bet ir sprendimų priėmimo kontekste. T.y. pažiūrėti kurie klausimai buvo priimti ar atmesti mažiausiu balsų skirtumu, bei kurie klausimai buvo sprendžiami daugiausiu ar mažiausiu tarybos narių kiekiu. Na ir, žinoma, už kuriuos daugiausiai balsuota ir prieš kuriuos daugiausiai balsuota, bei dėl kurių daugiausiai susilaikyta nekalbant apie bendru sutarimu priimtus sprendimus.

Ką mums tai duoda? Ogi tai, kad tai mums padės suprasti/charakterizuoti šios kadencijos tarybą.

Pradedu nuo prieštaringiausių klausimų. T.y. klausimų kurių sprendimas buvo nusvertas mažu tarybos narių balsų kiekiu. Pagalvojau, kad mažai yra 5 ir mažiau. Čia mano toks sugalvojimas. Tokie klausimai yra:

Continue reading Schema #46. Vilniaus miesto tarybos sprendimų analizė.

Schema #45. Vilniaus miesto savivaldybės koalicijos

Savo 36 schemoje pasakojau apie Vilniaus miesto tarybos koalicijas per balsavimus. Tai yra, paimame mano mylimą Gephi ir sudėliojame balsuotojus į vieną žemėlapį. Balsuotojai pasiskirsto taip, kad už tuos pačius klausimus balsavę žmonės atsiduria daug maž toje pačioje vietoje 2D erdvėje. Ir tie žmonės susidėlioja daug maž taip, kokios frakcijos/koalicijos yra.

Tai dabar aš padariau lygiai tą patį, tik duomenų dabar turime truputį daugiau lyginant su praėjusiu kartu. Tuo pačiu pasitikriname ar pasikeitė kas ar ne ir jei pasikeitė tai kaip.

Čia yra visų balsavimų “UŽ” žemėlapis, kur skaičiukai yra klausimų ID, o linijos reiškia, kad tas žmogus už tą klausimą balsavo (kuo burbulas didesnis – tuo daugiau tas tarybos narys balsavo “UŽ”):

Čia įdedu tą paveiksliuką tik todėl, kad jis gražus.
Čia įdedu tą paveiksliuką tik todėl, kad jis gražus.

O čia yra paveiksliukas paaiškinantis ką reiškia vietos (spalvos, kaip jau tikiuosi spėjote suprasti, yra frakcijos):

Continue reading Schema #45. Vilniaus miesto savivaldybės koalicijos

Schema #44. Lietuvos rinkėjų žemėlapis 1 dalis.

Nebesugalvoju kažko dvasingo parašyti į blogą. Vis schemos ir schemos. Bet tikiuosi, kad kam nors įdomu bus ir tai.

VRK atvėrė visus Lietuvoje balsavusiųjų rinkėjų biuletenių duomenis.

ATVĖRĖ BIULETENIŲ DUOMENIS!!! Tai yra didžiulis  kokybinis šuolis skaidrumo ir įdomumo link. Ponas Jonas Bačelis, kuris yra pats geriausias duomenų analitikas, kokį žinau (jis dar, jeigu neklystu, Švedijos Geteborgo universiteto genetikos mokslų daktaras) truputį parodė ką galima su tokiais duomenimis padaryti:

 

Aš, ta proga, sudėjau visus tuos biuletenius į savo mėgstamą Gephi. Gephi per maždaug ~1 naktį nupiešia vienos partijos žemėlapį. Tai aš per porą naktų paprašiau kompo nupiešti man LRLS i TS-LKD žemėlapius. Šiuose žemėlapiuose yra tik tie rinkėjai, kurie reitingavo nors vieną kandidatą balsuodami už sąrašą:

Continue reading Schema #44. Lietuvos rinkėjų žemėlapis 1 dalis.

Schema #43. Sąrašo pokyčių koreliacijos su rezultatais.

Aš tikriausiai jau įgrisau jums su savo rinkiminėm schemom. Bet va vieną dar sugalvojau čia įdėti. Vėliau mėginsiu ką nors dvasingesnio parašyti. Gal net kas gausis.

O čia dabar bus mano paties sugalvotas ir jau beveik standartizuotas metodas, parodantis pokyčių Seimo rinkimų sąraše mastą. O tas mastas, savo ruožtu, galbūt atsitiktinai visai koreliuoja su galutiniais rinkimų rezultatais.

O rinkiminis sąrašas, žinia, yra viena karščiausių temų partijos viduje ir taip pat gan gausiai aptarinėjama viešojoje erdvėje. Gerą sąrašą sudaryti nelengva: jis gan svarbus rinkėjams, todėl partija turi suprasti ką rinkėjai galvoja; sąrašas tai pat svarbus kandidatams, todėl jie daro tokią savotišką rinkiminę kampaniją partijos viduje. Tos vidinės kampanijos būna įvairios: nuo kokių nors straipsnių rašymo vidiniuose portaluose ar emeilų siuntinėjimo iki visokių intrigų schemų kūrimo. Suvaldyti visą šį procesą tikrai nelengva.

Continue reading Schema #43. Sąrašo pokyčių koreliacijos su rezultatais.

Schema #42. Seimo rinkimai 2016, demografija

Nepasakosiu labai čia daug, o tiesiog reikia galų gale kažką į blogą parašyti. Užteks tiesiog šiaip sau į soc. tinklus paveiksliukus šarinti.

Na, tik užsiminsiu, kad buvau Vienoje ir ten išgirdau tokį žodį “Tableau”. Tai labai smagus žaislas – ypač, kai VRK atvėrę savo duomenis patogesniu būdu, nei buvo iki šiol.

Čia bus keletas dot-plot’ų apie amžių grupes registruotas balsuoti ir realiai balsavusias apygardų smulkumu.

Nuo 75 vyrai

Atnaujinimas:

Continue reading Schema #42. Seimo rinkimai 2016, demografija

Schema #41. Seimo rinkimai 2016

2016 metų Seimo rinkimų pirmoji dalis jau baigėsi. Dabar, kaip juokauja Aušrinė – tarpušventis. Antrojo turo vienmandačių kandidatai toliau varinėja į D2D, kviečia dar kartą ateiti žmones prie urnų.

Ta proga prašau pažiūrėti šį Tapino postą.

Na, o aš gavau vėl medžiagos savo schemom. Po savivaldybių rinkimų pripaišiau tokių irgi.

Mano šios visos schemos nuolat tobulėja. Anoms priskaičiavau visokių svorių ten reitingų, įvertinant ten kažką… Bet tada supratau, kad čia per daug sudėtingai viską mėginu daryti, nes net pats neprisimenu kaip ten buvo 😀

Taigi, šįsyk irgi bus kiek panašios schemos, t.y. rodysiu kuo skiriasi partinis reitingavimas nuo rinkėjų ir kaip toli partijos yra nuo realybės, kiek visokios intrigos ir lokalūs optimumai trukdo daryti gerus sprendimus.

Tai pirmiausiai įdėsiu diagramą, o tada paaiškinsiu ką čia padariau:

Continue reading Schema #41. Seimo rinkimai 2016

Schema #40. Šiek tiek statistikos apie 2016 kandidatus į Seimą

Per Laisvės TV, kur mes ir jie laikomės ten, Andrius Tapinas panagrinėjo kandidatų mokesčių ir pajamų statistiką:

 

Tai man pasirodė visai įdomu ir aš pagalvojau, kad galiu irgi paanalizuoti tuos duomenis kažkaip. Viena tik bėda – duomenis gauti gan keblu. VRK.lt viskas yra, bet duomenys sumėtyti į subpage’us visokius. Jeigu reiktų rankiniu būdu rinktis duomenis, tai užsi…tum. Ėmiau ieškoti kokių nors įrankių, kurių pagalba tą procesą galėčiau automatizuoti. Kažką radęs papostinau į Feisbook’ą džiaugsmingą “ParseHub” atradimą.

Continue reading Schema #40. Šiek tiek statistikos apie 2016 kandidatus į Seimą

Schema 38. Vilniaus darželiai

Tęsiu duomenų paiešką ir analizę. Praėjusį kartą analizavau Grindą, užpraitą kartą VMS tarybos narių balsavimai su visokiom koalicijom ir opozicijom.

Šį kartą akis užkliuvo už darželių. Šitie duomenys gan aktyviai yra naudojami, tai aš nežinau ar ką nors įdomaus ar naudingo galėsiu pasiūlyti. Visko nežiūrėjau. Pažiūrėjau tik laukiančių eilėje ataskaitą. Man regis šita skausmingiausia Vilniui, Vilniaus mamoms ir tėvams.

Pradžiai nusibraižiau laukiančių eilėje vaikų gimimo metų histogramą:

Continue reading Schema 38. Vilniaus darželiai

Schema #37. Grindos duomenys

Kaip jau rašiau anąkart – einu į github.com/Vilnius, žiūriu į duomenis, medituoju, ką nors sugalvoju ir dedu čia.

Šį kartą užsimeditavau ties Grinda. O dar tiksliau gatvių avarine tarnyba.

Duomenys baisiai netvarkingi. Vieni failai CSV, kiti XLS, kiti vienas kito kopija. Išmėtyti padieniui. Bet mes jau pripratę. Dažnai tenka gauti excelius su baisiai įmantriu visokių lentelių formatavimu, fontais, tarpais tarp skaičių, kableliais vietoje taško ir kitokia velniava. Duomenų tvarkymas būna total-košmar.

Reiktų vieningo formato failų. O dar geriau – vieno failo. Jokių formatavimų. Geriausia CSV. Bet visi viską žino. Džiugu, kad tie duomenys ten yra.

Paanalizavau tik vėliausią ten rastą kovo mėnesį. Ir taip pavargau dėlioti tas kiekvienos dienos lenteles į vieną failą. Garantuotai privėliau kažkokių klaidų, nes tos lentelės ten net ne vienodos. Bet per daug nesinervavau, o tiesiog paėmiau tuos duomenis, kurie išsiparsino vienu ar kitu būdu.

Iš ten esančios informacijos man pasirodė vertingi tik registracijos laikas, sprendimo laikas ir problemos aprašymai. Iš registracijos ir sprendimo laikų gavosi histogramos, o iš aprašymų – žodžių debesys.

Continue reading Schema #37. Grindos duomenys