En verktygslåda för bättre samhällsförståelse
Jag har under en tid arbetat med att ta fram en samling verktyg som ger AI-assistenter med stöd för MCP-protokollet (Model Context Protocol) direkt tillgång till nordiska parlaments- och rättsdata. Nu har det dags att berätta vad verktygslådan innehåller, vad den kan användas till och de kända begränsningar som fortfarande finns.
Hur har de nordiska länderna reglerat plattformsarbete? Vad ansåg kommunerna i Stockholms län om Utjämningskommitténs förslag till kostnadsutjämning för grundskolan? Hur har den svenska socialtjänstlagen förändrat över tid?
Det är inga svåra frågor i den meningen att svaren saknas. De finns, i riksdagstryck, betänkanden, remissvar och propositioner som är offentliga och tillgängliga för alla. Problemet är att de är utspridda i ett dussintal separata system, på fem-sex olika språk, och sträcker sig i vissa fall 500 år bakåt i tiden.
Utan bra verktyg riskerar den stora mängd information som svenska och nordiska parlament, domstolar och myndigheter publicerar att förbli praktiskt otillgänglig för alla utom experter med tid och vana att navigera systemen.
Vad verktygslådan är
Verktygslådan består av fjorton datakopplingar och ett paket med sök- och analysverktyg, byggda enligt det öppna MCP-protokollet (Model Context Protocol). Det innebär att de fungerar med alla AI-assistenter som stödjer protokollet och inte är bundna till en enda leverantör. Sök- och analysverktygen är bygda som Skills för Claude men kan anpassas till liknande funktioner i andra AI-system, exempelvis Geminis Gems.
Varje datakoppling ger AI-assistenten direkt och strukturerad tillgång till ett specifikt källsystem: riksdagens handlingar, domar, propositioner, nordiska parlament eller europeisk rätt.
Alla datakällor är offentliga. Verktygen lägger inget nytt skikt av tolkning ovanpå materialet utan sänker tröskeln för att komma åt det som redan är tillgängligt.
Det historiska materialet
En datakoppling mot Kungliga bibliotekets digitaliserade riksdagstryck ger tillgång till ståndsriksdagens handlingar från 1521 till representationsreformen 1866. Det täcker samtliga stånd, adel, präster, borgare och bönder, 345 år av riksdagsdebatt, och är avgörande för den som vill följa politik och lagstiftningskedjor bakåt i tiden. Många moderna lagar har rötter som sträcker sig förbi 1867, och utan tillgång till det äldre materialet är kedjan bruten.
Den svenska parlamentariska processen
Riksdagens öppna data-API täcker mer än 400 000 dokument från 1867 till i dag: propositioner, motioner, betänkanden, protokoll, statens offentliga utredningar och kommittédirektiv. Datakopplingen möjliggör semantisk sökning inne i långa propositioner och betänkanden, inte bara träff på dokumentets titel.
En proposition kan vara flera hundra sidor. Att hitta rätt stycke i ett sådant dokument, ett resonemang om en rättslig princip, ett avsnitt om en reforms påverkan på kommuner, är det som skiljer ett timmes arbete från en kväll. Linköpings universitets strukturerade databas över SOU:er kompletterar riksdagens API med strukturerade metadata över 4 900 utredningar.
Ytterligare datakopplingar täcker Domstolsverkets rättspraxis med vägledande domar från Högsta domstolen och Högsta förvaltningsdomstolen, med möjlighet att söka direkt på specifika lagrum, och Regeringskansliets författningssamlingsregister, som visar vilka paragrafer som ändrades i varje ändrings-SFS, när de trädde i kraft, vilket EU-direktiv som eventuellt låg bakom och i vilken proposition förändringen avhandlades.
Regeringen och remissväsendet
Regeringskansliet har inget officiellt öppet API. Den datakoppling som täcker regeringsdokument bygger i stället på g0v.se, utvecklat av Pierre Mesure. Projektet speglar och strukturerar innehållet från Regeringen.se och gör det tillgängligt via ett API. Ett stort tack till Pierre för det arbetet.
Via g0v.se hämtas lagrådsremisser, remissmissiv och remissvar, förordningsmotiv, internationella överenskommelser samt kommenterade dagordningar med Sveriges officiella position inför EU-rådet. Därutöver täcker datakopplingen regeringens veckovisa ärendeförteckningar fram till september 2024. Information om enskilda beslut från regeringssammanträdena, från september 2024 och framåt, hämtas via det underliggande API:et som förser regeringen.se med samma information.
Remissväsendet är en viktig informationskälla för att förstå hur politik och lagar formas. Myndigheter, kommuner och intresseorganisationer ger sina synpunkter på varje lagförslag i skriftliga remissvar. Att sammanställa dessa synpunkter manuellt mot specifika förslag i ett betänkande tar normalt dagar. Med rätt verktyg är det en fråga om minuter.
Europeisk rätt
Två datakopplingar täcker den europeiska dimensionen. Via EUR-Lex och CELLAR-API:et finns direktiv, förordningar och domar från EU-domstolen tillgängliga. Eftersom Regeringskansliets register innehåller CELEX-nummer för EU-härledd lagstiftning går det att följa kedjan direkt från en svensk paragraf till det direktiv som låg bakom den. Det går också att följa kedjan från motsatt håll genom EU:s förteckning av medlemsstaternas implementering av en reglering.
Datakopplingen mot Europadomstolens rättspraxissystem HUDOC täcker vägledande domar och beslut från domstolen i Strasbourg. Materialet är primärt på engelska och franska. En dom om rätt till rättvis rättegång i ett mål mot ett annat konventionsland kan vara direkt relevant för ett svenskt lagstiftningsärende.
Akademisk litteratur
Primärkällor och sekundärkällor hör ihop. En propositionsmening på en halv rad kan bygga på decennier av rättsvetenskaplig diskussion. Datakopplingar mot Kungliga bibliotekets tidskriftsdatabas Publicera och DiVA-portalen ger tillgång till vetenskapliga tidskrifter och 1,5 miljoner publikationer från svenska lärosäten: avhandlingar, artiklar, rapporter och examensarbeten inom statsvetenskap, juridik, förvaltningsrätt och nordisk rätt.
Det nordiska perspektivet
De nordiska länderna har mycket gemensamt. Lagstiftare tittar regelbundet på hur grannländerna hanterat samma frågor. Utan systematisk tillgång till det nordiska materialet är den jämförelsen svår att göra.
Datakopplingar mot Stortinget och Lovdata (Norge), Folketing och Retsinformation (Danmark) samt Eduskunta och Finlex (Finland) ger tillgång till parlamentariska handlingar och lagstiftning i samtliga tre länder. Island täcks via Alþingi och Lagasafn, men tillgången till det parlamentariska materialet är för närvarande begränsad. Alþingis webbplats skyddas av Cloudflares bot-shield, som blockerar automatiserade anrop. En begäran om vitlistning har skickats till Alþingi, och jag hoppas på en snar lösning. Mer om hur sökningen hanterar flerspråkigheten finns i nästa avsnitt.
Sök- och analysverktyg
Utöver de fjorton datakopplingarna innehåller verktygslådan fyra specialiserade verktyg som arbetar ovanpå datakällorna och löser problem som inte ryms inom en enskild koppling.
Historisk begreppsexpansion. Det äldsta materialet i Kungliga bibliotekets riksdagstryck är skrivet på 1500-, 1600- och 1700-talets svenska, med inslag av latin. En sökning på “yttrandefrihet” ger låg täckning i det materialet eftersom begreppet inte användes i sin moderna form. Verktyget expanderar automatiskt moderna söktermer till historiska ekvivalenter och latinsk terminologi innan sökning körs. “Yttrandefrihet” söks parallellt som “censur”, “tryckerier” och “privilegium impressorii”.
Nordisk sökning. Verktyget expanderar svenska söktermer till norska, danska, finska och isländska och söker parallellt i tillgängliga parlamentariska datakällor. Det löser det praktiska problemet att en fråga om nordisk reglering av exempelvis plattformsarbete kräver söktermer på fyra språk för att ge fullständig täckning. Resultaten presenteras med en förklaring av vad respektive nordiskt dokumentformat motsvarar på svenska.
Flerspråkig sökning. För vetenskaplig litteratur och europeisk rätt befinner sig relevant material ofta på engelska, franska och tyska. Verktyget expanderar söktermer till dessa språk och täcker DiVA, Kungliga bibliotekets tidskriftsdatabas, EUR-Lex och Europadomstolens praxisdatabas i ett anrop. Europadomstolens avgöranden skrivs uteslutande på engelska eller franska, vilket gör flerspråkig sökning nödvändig för att inte missa relevant praxis.
Remissammanställning. Remissväsendet genererar stora mängder synpunkter, men att sammanställa dem systematiskt är tidskrävande. Det fjärde verktyget identifierar och kategoriserar remissinstansernas synpunkter på specifika förslag i ett betänkande och presenterar dem strukturerat, förslag för förslag. Verktyget arbetar med datakopplingarna mot Riksdagen och Regeringen.se.
Konkreta exempel
Verktygen kan hjälpa till att svara på frågor om hur kommunala utjämningssystem ser ut i andra nordiska länder, vad kommuner i Stockholms län ansåg om Utjämningskommitténs förslag till kostnadsutjämning för grundskolan eller hur det svenska kommunala utjämningssystemet har förändrats över tid.
På samma sätt går det att fråga vilka EU-regleringar som finns kring uppehållstillstånd, hur de har implementerats i svensk lag och hur svenska domstolar tillämpar dessa bestämmelser.
Begränsningar och ett bredare problem
Finlands Finlex-databas kräver att en lokal kopia av lagstiftningsdatabasen byggs upp. Detta är ett mycket tidskrävande arbete. Alþingis data är ett tydligare exempel på samma typ av hinder. Alþingis saknar ett dokumenterat API och automatiserade anrop till befintligt API blockeras. Fem av Islands tio verktyg returnerar för närvarande felmeddelanden tills en vitlistningsbegäran, skickad till Alþingi, besvaras. Isländsk lagstiftning via lagasafnet och förordningsregistret fungerar däremot utan hinder.
Kvaliteten på hur nordiska länder tillgängliggör sina parlamentariska och juridiska data för vidareutnyttjande varierar påtagligt. Strukturerade API:er, maskinläsbara format, konsekvent dokumentation, möjligheter att söka i data utan att behöva bygga upp egna kopior av databasen och stabil åtkomst är inte självklart. Alla nordiska länder, Sverige inkluderat, har mer att göra på det området. Potentialen i det offentliga material som produceras är avsevärd, men den realiseras inte om datat bara finns tillgängligt i form som kräver manuell handpåläggning.
Varför detta
Verktygslådan är ett personligt projekt, drivet av ett stort intresse för samhällsfrågor och digitalisering, och en önskan att får en bättre förståelse för hur AI-baserade system fungerar i praktiken. Jag är ingen programmerare. All kod har tagits fram i samarbete med AI-assistenter.
Avsikten är att verktygen ska kunna användas av intresserade medborgare, utredare, forskare, inom utbildning med mera. De svar som verktygen hjälper till att ta fram är grundade i primärkällor som finns tillgängliga för vem som helst. Om ett dokument är OCR-skannat, om ett remissvar saknas, om ett sökresultat hämtas från en äldre källa, framgår det. Inga svarta lådor.
Verktygslådan är öppen källkod under AGPL-3.0-licensen. Källkod och konfiguration finns tillgängliga på GitHub.


