Quellen &
Methodik

Alle Daten stammen aus amtlichen, öffentlichen Quellen. Die Pipeline ist vollständig reproduzierbar.

01

Verfassungsorgane

Struktur
Quelle
Deutscher Bundestag — Glossar „Verfassungsorgane"
URL
bundestag.de/…/verf_organe
Format
HTML (gescrapt)
01

Entity-Mapping

Normalisierung in ein Register mit stabilen IDs. Zuordnung zu Einzelplänen über kuratierte Zuordnungstabelle. Umlaute werden transliteriert (ä→ae, ö→oe, ü→ue, ß→ss).

02

Haushaltsberechnung

Extraktion aus CSV. Filterung auf Ausgaben (A), Gruppierung nach Einzelplan, Summierung der Soll-Werte. Multiplikation ×1.000 (CSV-Einheit: Tsd. €).

03

Personalextraktion

PDF-Download, Text-Extraktion via pdf-parse. Regex-Parsing der Planstellen-Übersicht über 5 Personalabschnitte (Beamte, Richter, Professoren, Arbeitnehmer, Soldaten).

04

Graph-Layout

Offline-Berechnung mit ELK Layered-Algorithmus. Positionen in graph.json vorberechnet.

Alle Quelldaten sind öffentlich und weiterverwendbar. Pipeline-Code ist MIT-lizenziert.