Täglich entstehen in Behörden, Gerichten und öffentlichen Einrichtungen Dokumente, die vor Wissen nur so strotzen – und doch kaum jemandem zugänglich sind. Der Grund? Sie enthalten sensible Daten, die nicht ohne Weiteres geteilt werden dürfen. Das schützt die Privatsphäre, blockiert aber gleichzeitig den Zugang zu Informationen, die Prozesse verbessern, Fehler vermeiden und Entscheidungen fundierter machen könnten.Das österreichische Bundesministerium für Justiz (BMJ) und das Bundesrechenzentrum (BRZ) haben gemeinsam mit EBCONT eine Lösung entwickelt, die diesen Datenschatz hebt – ohne die Privatsphäre zu gefährden.
Der Ausgangspunkt: Wertvolle Daten hinter hohen Mauern
Gerichtsurteile enthalten eine Fülle wertvoller Informationen – von Begründungen über Gesetzesauslegungen bis hin zu Verweisen auf ähnliche Fälle. Gleichzeitig sind sie voller sensibler Daten wie Namen, Adressen oder Geburtsdaten. Ohne Anonymisierung dürfen diese Dokumente daher kaum weitergegeben oder ausgewertet werden.
Bislang bedeutete das für die Justiz: aufwändige manuelle Bearbeitung, eine Vielzahl unterschiedlicher Formate und ein hohes Fehlerrisiko bei komplexen Fällen. Das Bundesministerium für Justiz (BMJ) hat daher den Anspruch formuliert, den Zugang zu diesen Inhalten schneller und sicherer zu gestalten – bei gleichzeitig höchstem Datenschutz.
Warum Standard-KI hier nicht ausreicht
Standard-KI stößt bei juristischen Texten schnell an Grenzen: Fachbegriffe werden falsch interpretiert, regionale Besonderheiten übersehen und der Kontext oft missverstanden. Deshalb entwickelte das BMJ gemeinsam mit EBCONT maßgeschneiderte Modelle, die auf die österreichische Rechtssprache zugeschnitten sind.
Die Lösung erkennt und anonymisiert automatisch Namen, Adressen, Aktenzeichen oder Rollen im Verfahren – und erhält dabei die Lesbarkeit der Dokumente. Möglich macht das ein hybrider Ansatz aus NER, Deep Learning, regelbasierten Verfahren und OCR. Dank On-Premise-Hosting bleiben die Daten souverän und DSGVO-konform. Das Ergebnis: über 90 Prozent Erkennungsgenauigkeit – ohne Abhängigkeit von US-Clouds.
Kontinuierliche Verbesserung als Erfolgsfaktor
Juristische Texte sind komplex und voller Sonderfälle. Damit das System flexibel bleibt, kombiniert es regelbasierte Verfahren mit Machine Learning, wird laufend nachtrainiert und durch Feedback aus der Praxis optimiert. So bleibt die Lösung aktuell und zuverlässig, auch wenn Anforderungen sich ändern.
Und der Mehrwert geht weit über die Justiz hinaus. Mit der neuen Lösung kann das BMJ gerichtliche Entscheidungen schneller und effizienter aufbereiten – und sie gleichzeitig einem breiteren Nutzerkreis zugänglich machen, ohne den Datenschutz zu gefährden. Das bringt klare Vorteile: beschleunigte Prozesse, DSGVO-konforme Nutzung, besser strukturierte Daten für Analysen und neue digitale Services. Das Konzept ist zudem übertragbar – von Ministerien über Polizei bis hin zum Gesundheitswesen.
Die Plattform soll kontinuierlich erweitert werden – etwa um Audio-Transkriptionen, mehrsprachige Übersetzungen oder interaktive Abfragen per generativer KI. Damit entwickelt sich die Anonymisierungslösung zu einer umfassenden Datenplattform für die Justiz – und zu einem Modell, von dem auch andere Behörden profitieren können.
Das Projekt zeigt, dass sensible Daten nicht nur geschützt, sondern auch zum Motor für Digitalisierung und Innovation werden können – vorausgesetzt, Datenschutz, Fachwissen und Technologie greifen ineinander.
Fazit: Sensible Daten als Chance statt Risiko
Frederick Bednar, Data Analytics and Data Science Consultant von EBCONT: ,,Das Projekt des BMJ zeigt, dass sensible Daten nicht im Widerspruch zur Digitalisierung stehen müssen – im Gegenteil: Wenn Datenschutz, Technologie und Fachwissen zusammen spielen, werden sie zum echten Wettbewerbsvorteil.”
Für Entscheider:innen im öffentlichen Sektor bedeutet das: Wer auf Datensouveränität und maßgeschneiderte KI-Lösungen setzt, kann Prozesse beschleunigen, Innovation vorantreiben und Vertrauen stärken – ohne Kompromisse bei Sicherheit oder Compliance.