Enkla myndighetsdata – lågt hängande PSI-frukter (gästinlägg)

På senare tid har det talats en del om att myndighetsdata (t.ex. SMHIs väderdata, Lantmäteriets kartdata och Post- och telestyrelsens telefonnummerdata) borde göras fritt tillgängligt för återanvändning. De två huvudargumenten är att detta möjliggör utveckling av nya tjänster som skapar ett samhällsekonomiskt värde, och att det kan öka transparensen i den offentliga sektorn. PSI-direktivet från EU och den därpå följande lagen (2010:566) om vidareutnyttjande av handlingar från den offentliga förvaltningen, har givit entreprenörer och öppenhetsivrare stora förhoppningar.

Det går långsamt

Av flera orsaker går det dock ganska långsamt framåt. Dels är inte alla data i ett sådant skick att de lämpar sig för exponering. Det kan kräva både filtrering av sekretessbelagd information, kvalitetsbearbetning och investeringar i infrastruktur. Dels finns det ibland ekonomiska intressen hos myndigheterna som kan tyckas tala mot kostnadsfria eller billiga API:er. Myndigheterna har helt enkelt betydande intäkter för försäljning av data och vill därför inte släppa dem fria. Med rätta ifrågasätts också nyttan med att publicera alla data öppet. För en redan hårt belastad myndighet är det oansvarigt att lägga resurserna på ett API om ingen har nytta av det!

Enkelt data med stort värde

Men myndighetsdata måste inte vara antingen gigantiska databaser eller ostrukturerade ordbehandlingsdokument. Myndighetsdata kan också vara enkla listor, sifferserier och koder. Till exempel listan med namn och koder för landets kommuner, eller aktuellt basbelopp.

Fördelen med dessa enkla myndighetsdata är att normalt är de inte sekretessbelagda, inte ostrukturerade, inte särskilt dyra att producera, och inte heller står de för några större intäkter som skulle hotas om de släpptes fria.

Nykvarns kommun bildades 1999, men finns fortfarande inte i sökformuläret på ”Sveriges nationalatlas”

Faktum är att många av dem redan är fria. Exempelvis publicerar SCB aktuella listor med län och kommuner, med koder, på både html, pdf och Excel-format. Men syftet tycks inte vara att underlätta elektronisk återanvändning via API:er

Det finns tusentals formulär på olika webbplatser där användaren förväntas välja sin kommun från en lista – en lista som typiskt fylls med innehåll av utvecklaren en gång för alla när formuläret skapas. Något år senare har några kommuner slagits samman eller bytt namn eller delat på sig, och då är formulärlistan inte längre aktuell. Jag vet av egen erfarenhet att behov av denna typ av grunddata uppstår igen och igen och igen. Senast för någon vecka sedan hade jag i min roll som konsult (hos en myndighet) ett konkret behov av just aktuella listor med kommuner och län.

Andra exempel på enkla myndighetsdata är alla postorter och postnummer, alla valutor, namn på myndigheter, examina och yrkeslegitimationer, riktnummerområden, basbelopp, konsumentprisindex och så förstås listan med alla länder och landskoder. Visste du att den landlista som är inbyggd i Microsofts utvecklingsplattform .NET saknar Kuba, måhända eftersom USA inte erkänner den staten? Kanske kunde vara en uppgift för Utrikespolitiska institutet att publicera en API-metod för den som vill lista länder som Sverige anser vara länder?

Beständig aktuell information

Om det fanns en maskinläsbar lista (XML-fil eller WebService-metod eller liknande) på en adress som kan förväntas vara beständig och med ständigt aktuell information, så skulle det gå ganska enkelt att bygga onlineformulär som ständigt är aktuella. Av prestandaskäl skulle det oftast inte vara lämpligt att hämta listan för varje gång formuläret ska visas upp, men genom att hämta listan automatiskt någon gång per dygn eller vecka eller så skulle kvaliteten kunna höjas i landets formulär, och därmed databaser.

Det går i och för sig, med något större ansträngning, att automatiskt och regelbundet hämta den Excel- eller html-fil som SCB redan idag publicerar och med hjälp av denna åstadkomma ungefär det jag ovan har skisserat. Men för att det ska vara lämpligt med en automatiserad koppling behöver man veta att formatet inte kommer att förändras, att adressen är beständig osv. Helst skulle tjänsten serveras från en betrodd aktör (gärna myndighet) över ett skyddat kommunikationsprotokoll också. Och med klokt konstruerad versionshantering för att robust kunna hantera förändringar över tid. Det är inte helt trivialt, men inte heller rocket science. SCB kanske inte kan klämma in detta i befintlig budget, men för statskassan skulle det vara en försumbar kostnad i jämförelse med andra investeringar av strategisk betydelse för landets infrastruktur.

Kan du påverka din IT-politiker att ge någon myndighet ett sådant uppdrag? Eller finns det något bättre sätt?