Die Doppelte Wesentlichkeitsanalyse (DMA) gilt als die anspruchsvollste Teildisziplin im CSRD-Workflow — und gleichzeitig als der größte Hebel für strukturelle KI-Unterstützung. Diese Bewertung zerlegt den Workflow in acht Teilaufgaben und prüft jede einzelne entlang der vollen Methodik (Stages 0–4). Ergebnis: eine differenzierte Empfehlung pro Aufgabe statt einer pauschalen „DMA-Quote".
Per-Teilaufgabe-Bewertung
Stage 0 — Operationalisierung pro Teilaufgabe
Bevor die eigentliche Bewertung startet, wird für jede Teilaufgabe ein konkretes Setup festgelegt: welche Inputs herangezogen werden, welche Rubrik die Bearbeitung strukturiert, welche Tools eingesetzt werden, welches Output-Format entsteht und welche Reviewschritte vorgesehen sind.
Für die Kontextanalyse beispielsweise wird festgelegt, den aktuellen Geschäftsbericht, das Organigramm, eine Standort-Liste und das Branchen-Profil als Inputs zu verwenden. Diese werden mithilfe eines LLM gegen die EFRAG IG 1 Checkliste ausgewertet. Als Output entsteht eine strukturierte Kontext-Notiz, die als Grundlage für das nachfolgende Topic Screening dient.
Analog wird jede der acht Teilaufgaben vor der Bewertung sauber operationalisiert. Ohne diesen Schritt — also bei intuitiver KI-Nutzung ohne festgelegtes Setup — fallen die Zeitersparnis-Werte deutlich und das Fehlerrisiko steigt.
Modell-Fähigkeiten — Stage 2
Die Bewertung der Modell-Fähigkeiten erfolgt im aktuellen Modellstand (Frontier-LLMs 2026, Claude / GPT / Gemini).
Stark:
- Text- und Struktur-Verarbeitung (D20b Modalität: Text dominiert; D10b Kontext-Fenster: 200k+ Token reichen).
- Recherche-Aggregation aus heterogenen Dokumenten via RAG (D04a-Anforderungen erfüllbar).
- Kategorisierung und Mustererkennung in Themen-Feldern (D07 Regel-Logik gut).
Schwach:
- Kalibrierung / Metakognition (D08) — Modelle erkennen ihre Wissensgrenzen nur teilweise. OECD ACI: Frontier-Modelle auf L2 von 5 — sub-median. Heißt für die DMA: Selbst-Einschätzungen der Modelle („dieses IRO ist klar materiell") sind nicht belastbar.
- Revised ESRS 2026 — Out-of-Distribution (D26a / D09) — Der Entwurf vom 6. Mai 2026 ist außerhalb der Trainings-Daten der Modelle. Verweise auf Paragrafen müssen aus RAG-Quellen kommen, nicht aus Modell-Erinnerung.
Deployment-Bereitschaft — Stage 3
Die Standard-Annahme bildet eine typische Client-Situation ab: digitale Dokumenten-Ablage, ERP/DMS vorhanden, Sustainability-Team mit 1–3 Personen, IT-Abteilung mit klarer EU-Cloud-Policy.
Client-seitige Voraussetzungen, die getragen werden müssen:
- D04b Inputs digital verfügbar: Geschäftsbericht, Standort-Listen, Peer-DMAs müssen in Text-Form vorliegen (PDFs OK, gescannte Bilder nicht).
- D11 Nutzer-Skill: Sustainability-Team hat grundlegende Erfahrung mit RAG-basierten Workflows oder lässt sich einarbeiten.
- D12 Tool-Integration: LLM-API-Zugang (Anthropic/OpenAI/Google) in EU-Cloud-Region geklärt; keine ERP-Tiefenintegration nötig für die DMA selbst.
- D26b Monitoring: ein dokumentierter Review-Rhythmus für KI-Output, bevor Ergebnisse in den Bericht fließen.
- D02b Blast Radius: Limited Assurance per ISSA 5000 ab CSRD-Jahr 1, später Reasonable Assurance. Erfordert auditierbaren Trail (siehe Stage 4).
Bei deutlich höher entwickelten Setups (eigenes LLM-Ops-Team, etablierte Ground-Truth-Pipelines, dedizierte Assurance-Funktion) kann die Bereitschaft auf 85–90 % steigen — und die Empfehlungen entsprechend höher rücken.
Governance — Stage 4
Governance entscheidet, welche Kontrollen beim KI-Einsatz erforderlich werden — unabhängig davon, ob die Aufgabe technisch automatisierbar ist.
Besonders relevant für die DMA:
- Nicht-delegierbare Verantwortung. Die Materialitäts-Entscheidung und die Board-Präsentation bleiben in menschlicher Hand. Berichts-Verantwortung lässt sich nicht an KI delegieren. Bezug: IAASB Professional Skepticism, ISSA 5000.
- Nachvollziehbarer Audit-Trail. ESRS 1 verlangt eine dokumentierte, reperformbare DMA-Methodik. Jeder KI-gestützte Schritt muss zurück zu Quelle, Eingabe und Reviewer-Entscheidung verfolgt werden können. Bezug: ESRS 1 §3+§6, ISSA 5000.
- Grundrechte-Folgen. Wenn die DMA auf Stakeholder mit besonderen Schutzbedürfnissen wirkt — eigene Belegschaft, betroffene Gemeinden, vulnerable Gruppen in der Wertschöpfungskette — greift die FRIA-Pflicht nach EU AI Act. Stakeholder-Validierung (T7) bleibt strukturell Mensch-only.
Weniger kritisch in diesem Kontext:
- Missbrauchs-Risiko bei Dual-Use-Anwendungen ist niedrig — die DMA ist keine sicherheitskritische Aufgabe.
- Fairness- und Bias-Governance wirkt nur indirekt, weil die Materialitäts-Logik nicht über Einzelpersonen entscheidet.
Empfohlene Kontrollen für den DMA-Einsatz:
- 4-Augen-Review auf allen Materialitäts-Entscheidungen und Schwellenwerten — durch eine zweite fachlich qualifizierte Person.
- Vollständige Methoden-Dokumentation mit Modellversion, Eingaben, Prompts und Reviewer-Entscheidung pro Bewertungsschritt — als Grundlage für die Reperformance durch die Prüferin.
- Auftragsverarbeitungs-Vertrag (AVV) + EU-Cloud-Setup für alle personenbezogenen Stakeholder-Inputs (DSGVO Art. 28).
Empfehlung zum weiteren Vorgehen
Für die DMA als Workflow lassen sich drei Lesarten ableiten.
Erstens — der Hebel sitzt im AI-freundlichen Mittelteil. T2 (Topic Screening) und T3 (IRO-Identifikation) machen typischerweise 30–40 % des Gesamt-Aufwands aus. Genau hier liegt die Zeitersparnis von 65–80 % bzw. 50–70 %. Eine schlanke Pipeline für diese zwei Aufgaben bringt mehr als ein Versuch, T7 oder T8 zu „automatisieren".
Zweitens — Stage 0 ist die Bedingung, nicht die Folge. Die Bandbreiten oben gelten nicht für naive Chat-Nutzung. Sie setzen voraus, dass Inputs, Rubrik, Tools und Review pro Teilaufgabe festgelegt sind — das ist der Setup-Aufwand, den eine erste Diagnose-Runde abdeckt.
Drittens — Stage 4 wirkt bindend, nicht als Option. T7 und T8 bleiben strukturell Mensch-only. Das ist keine Schwäche der Methodik, sondern eine Eigenschaft der Aufgabe: Verhandlung, Vermittlung und nicht-delegierbare Verantwortung sind Tätigkeiten anderer Form.
Methodik im Detail
Vollständige Methodik einsehen →
Die hier verwendete Bewertungs-Methodik (5 Stufen, 42 Dimensionen, 41 Institutionen) ist auf der Methodik-Seite dokumentiert — einschließlich Stage-0-Operationalisierung, vollständiger Quellenmatrix und Empfehlungs-Logik auf der Autonomie-Skala.