Labb

Journalism++ Stockholm deltog i helgen, förstärkta av Sebastian Kraus och Édouard Ricard från J++ Berlin och  i hackathonet Fajkhack som ordnades på Södertörns högskola för tredje gången. På 24 timmar fick vi ihop en fungerande nyhetsapp och ett pilotgräv i 8000 sidor kommunstyrelseprotokoll.

1. Politinder

Politinder Politinder Politinder

Vi översköljs av valkompasser som alla följer i stort sett samma upplägg. Man svarar på ett låååångt formulär med frågor och matchas sedan mot kandidater och partier. De lider alla av att man som användare behöver sätta in en stor portion engagemang innan man kommer till resultat.

Samtidigt står vi inför ett EU-val som i allt väsentligt behandlas som ett nationellt val i mängden. Vi har ingen aning om vilka kandidater som ställer upp i  de andra länderna trots att de i praktiken kommer att fatta en mängd beslut som påverkar oss.

Det här var utgångspunkten när vi byggde Politinder. Inspirationen kommer från dejtingsajten Tinder som erövrar världen med sitt beroendeframkallande gränssnitt.

Du svarar på tio snabba påståenden och får sedan bläddra bland kandidater från alla länder. Ser det här ut att vara en kandidat du kan tänka dig att rösta på? Precis som på Tinder får du slänga eller behålla kandidater baserat på deras profilbilder. Om de har samma åsikter som du signalerar appen en match.

2. ProtoKollen

Vi tankade ner alla protokoll, från alla kommunstyrelsemöten, i alla kommuner i Dalarna, från hela innevarande mandatperiod, med alla bilagor. Det blev väldigt, väldigt mycket text (sisådär 8 000 A4-sidor) .

Vi analyserade den med Python, NLTK, Tableau och LibreOffice/Excel, och det här är vad vi hittade:

För att få ner alla protokoll var vi först tvungna att lista ut var de låg. Svenska kommuners sajter har väldigt lite gemensamt, så för varje kommun har vi letat rätt på sidan med länkar till protokollen, och skrivit ett xpath-uttryck som hittar länkarna. Därefter har lät vi ett Python-skript ladda ner alla pdf:er, och slutligen fick vi komplettera missade kommuner manuellt.

Vi konverterade alla pdf-filerna (och i några få fall Word-dokument) till rena textfiler. Därefter har vi använd Natural Language ToolKit (NLTK) och Python för att undersöka hur ofta olika ämnen avhandlas i kommunen. Varje ämne (t.ex. ”trafik” definieras av en uppsättning ord (t.ex. ”rondell, trafik, cykel”). Med NLTK sökte vi efter förekomster av orden, med alla deras böjningar, och jämförde frekvensen av ord från olika kategorier i olika kommuner.

Efter att ha pressat vår lilla netbook till det yttersta i ungefär en halvtimme, spottade Pythonskriptet till sist ut en prydlig csv-fil, med en kolumn för varje ämne (”trafik”, ”skola”, ”Stockholm”), och en rad för varje dalakommmun. Csv:n var ett riktigt smörgåsbord av nyhetsuppslag.

Trackbacks/Pingbacks

  1.  PolyTinder – inspirerende fra J++ | Sunnmørsposten LAB
  2.  Protokollen: Superinsamling av kommundata | Journalism++ Stockholm

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *