Wie funktioniert eine on-prem KI-Plattform die Datenschutz, Compliance, Self-Improvement und Audit gleichzeitig löst — ohne dass der Nutzer das alles selbst koordinieren muss? Diese Page führt dich konkret durch einen echten Use-Case.
Eine Anwältin schickt eine NDA via Telegram. Was sie nicht sieht: Vier Filter-Schichten haben die Anfrage geprüft, ein lokales KI-Modell hat geantwortet, eine Wissens-Datenbank wurde abgefragt, und die ganze Reasoning-Spur wurde revisionssicher abgelegt.
Drei unabhängige Schichten, drei Verantwortliche, drei austauschbare Komponenten. Wenn morgen ein besserer Filter verfügbar ist, wechseln wir nur die eine Schicht — die anderen bleiben unangetastet.
| Wer prüft | Microsoft Presidio |
| Was | 8 Entity-Typen (EMAIL, PHONE, IBAN, NAME, ...) |
| Aktion | REPLACE/MASK vor LLM-Call |
| Wer haftet | Compliance-Officer |
| Wer prüft | 12 Regex-Patterns DE+EN |
| Was | Jailbreak-Versuche, Prompt-Injection |
| Aktion | BLOCK ab 70% Score |
| Wer haftet | Security-Lead |
| Wer prüft | BERT Output-Scanner (W69) |
| Was | Halluzinationen, Toxic-Content |
| Aktion | FLAG für Review |
| Wer haftet | AI-Governance-Lead |
Niemand will einen Generalisten der alles ein bisschen kann. Wir haben fünf spezialisierte KI-Bots — Claws — die jeder eine Domäne abdecken. Ein Superagent entscheidet welche Claw welchen Teil der Anfrage übernimmt.
Keine Cloud. Kein Vendor-Lock-In. Eigene Hardware, eigener Strom, eigene Verantwortung.
Telegram-Bots, Web-Chats, API-Endpoints. Alles über einen Cloudflare-Tunnel — kein offener Port.
Jede Funktion ein eigener Baustein. Fällt einer aus, startet er sich neu (autoheal).
Ein NVIDIA DGX Spark trägt das Ganze. Roadmap: Q4 → 4-Node-Quorum-Cluster.
Eine Plattform die nur dann Wert bringt wenn sie 24/7 läuft, kann nicht von einem Menschen gepflegt werden. Sie pflegt sich selbst — und meldet nur, wenn ein Mensch wirklich entscheiden muss.
Stürzt ein Container ab? Restart in unter 30 Sekunden.
Jede Änderung → automatisch ins Git-Repo committed.
Container down? Update verfügbar? Disk voll? Telegram-Notification.
Auto-Improver schreibt Optimierungs-Patches → Review → Deploy.
SecClaw findet Schwachstellen BEVOR Externe sie finden.
90% der Mitarbeiter-Fragen direkt beantwortet ohne Ticket.
Wenn morgen ein EU-AI-Act-Auditor kommt und fragt 'Warum hat eure KI das geantwortet?' — dann gibt es nicht 'tja, das ist halt eine Black-Box'. Hier ist die komplette Spur.
Cloud-LLMs rechnen pro Token ab. Bei aktiver Plattform-Nutzung sind das schnell 4-stellige Beträge pro Monat. Wir routen 60-80% lokal.
Compliance ist nicht ein Sticker den man aufklebt, sondern ein architektonisches Pattern. Hier ist die Mapping-Tabelle.
| Anforderung | Quelle | Erfüllt durch |
|---|---|---|
| Logging jeder KI-Inferenz | EU-AI-Act Art. 12 | Langfuse-Trace + Paperclip Issue + Postgres-Append-only |
| Menschliche Aufsicht (Override-Möglichkeit) | EU-AI-Act Art. 14 | L3 BERT-Scanner FLAGGED (W69) → Mensch reviewt vor Versand |
| Transparenz · KI-Disclosure | EU-AI-Act Art. 50 | Disclosure-Banner in OWUI · Audit-Badge in Telegram-Antwort |
| Datenschutz · Daten-Minimierung | DSGVO Art. 5 | L1 Presidio · PII redacted vor LLM-Call · keine Cloud-Egress bei sensitivem Tag |
| Auftragsverarbeitungs-Vertrag | DSGVO Art. 28 | Per Tenant · medialine intern · keine US-Cloud bei sensitiven Daten |
| Drittland-Transfer-Vermeidung | DSGVO Art. 44-49 | Lokales Routing für sensitive Daten · Audit beweist Lokalität |
| Auslagerung · Provider-Management | BaFin MaRisk AT 9 | On-prem = keine Auslagerung. LLM-Provider als Auslagerung erfasst (Cloud-Anteil). |
| Aenderungs-Management für KI | BaFin MaRisk AT 7.2 | Frozen-Model + Version-Pinning · Git-tracked Container-Images |
| Internal-Audit · Stichproben | BaFin MaRisk BT 3.1 | SecClaw nightly + manuelle Stichproben über Paperclip-Filter |
Vollständiges Skript für Avatar-basiertes Erklär-Video (Synthesia / D-ID / Sora-2) liegt im Bundle:
outputs/_AI-Plattform-Bundle/architektur-page/STORYBOARD-DEEPDIVE-5min.md
Bis das echte Video fertig ist, kannst Du die ganze Story durchscrollen — sie deckt alle Themen ab die das Video adressieren wird.