Doppelte Wesentlichkeitsanalyse — KI-Potenzial bewertet · Beispielbewertung

Die Doppelte Wesentlichkeitsanalyse (DMA) gilt als die anspruchsvollste Teildisziplin im CSRD-Workflow — und gleichzeitig als der größte Hebel für strukturelle KI-Unterstützung. Diese Bewertung zerlegt den Workflow in acht Teilaufgaben und prüft jede einzelne entlang der vollen Methodik (Stages 0–4). Ergebnis: eine differenzierte Empfehlung pro Aufgabe statt einer pauschalen „DMA-Quote".

Per-Teilaufgabe-Bewertung

Kontextanalyse · Geschäftsmodell, Wertschöpfungskette, regulatorischer Rahmen

KI als Consultant50–70 % Zeitersparnis

High-Level Topic Screening · ESRS-Themen-Liste auf Pre-Relevanz prüfen

KI als Collaborator65–80 % Zeitersparnis

IRO-Identifikation · Impacts, Risks, Opportunities pro Themenfeld benennen

KI als Consultant50–70 % Zeitersparnis

Schwellenwert-Festlegung · Materialitäts-Schwellen je IRO-Typ kalibrieren

KI als Tool30–50 % Zeitersparnis

Erstbewertung · IROs entlang Scale × Scope × Remediability bewerten

KI als Consultant50–70 % Zeitersparnis

SME-Review · Fachexpert:innen-Validierung der Erstbewertung

KI als Tool30–50 % Zeitersparnis

Stakeholder-Validierung · externe Stakeholder-Konsultation

Mensch only0 % Zeitersparnis

Board-Präsentation · Top-Level-Schlussfolgerungen & Entscheidungsvorlage

Mensch only0 % Zeitersparnis

Aggregat über alle acht Aufgaben: Mittel bis Hoch · 50–65 % Zeitersparnis (gewichtet nach typischer Aufwandsverteilung im Workflow).

Stage 0 — Operationalisierung pro Teilaufgabe

Bevor die eigentliche Bewertung startet, wird für jede Teilaufgabe ein konkretes Setup festgelegt: welche Inputs herangezogen werden, welche Rubrik die Bearbeitung strukturiert, welche Tools eingesetzt werden, welches Output-Format entsteht und welche Reviewschritte vorgesehen sind.

Für die Kontextanalyse beispielsweise wird festgelegt, den aktuellen Geschäftsbericht, das Organigramm, eine Standort-Liste und das Branchen-Profil als Inputs zu verwenden. Diese werden mithilfe eines LLM gegen die EFRAG IG 1 Checkliste ausgewertet. Als Output entsteht eine strukturierte Kontext-Notiz, die als Grundlage für das nachfolgende Topic Screening dient.

Analog wird jede der acht Teilaufgaben vor der Bewertung sauber operationalisiert. Ohne diesen Schritt — also bei intuitiver KI-Nutzung ohne festgelegtes Setup — fallen die Zeitersparnis-Werte deutlich und das Fehlerrisiko steigt.

Modell-Fähigkeiten — Stage 2

Die Bewertung der Modell-Fähigkeiten erfolgt im aktuellen Modellstand (Frontier-LLMs 2026, Claude / GPT / Gemini).

Deckung der CAPAB-Anforderungen

~75 %

Stark:

Text- und Struktur-Verarbeitung (D20b Modalität: Text dominiert; D10b Kontext-Fenster: 200k+ Token reichen).
Recherche-Aggregation aus heterogenen Dokumenten via RAG (D04a-Anforderungen erfüllbar).
Kategorisierung und Mustererkennung in Themen-Feldern (D07 Regel-Logik gut).

Schwach:

Kalibrierung / Metakognition (D08) — Modelle erkennen ihre Wissensgrenzen nur teilweise. OECD ACI: Frontier-Modelle auf L2 von 5 — sub-median. Heißt für die DMA: Selbst-Einschätzungen der Modelle („dieses IRO ist klar materiell") sind nicht belastbar.
Revised ESRS 2026 — Out-of-Distribution (D26a / D09) — Der Entwurf vom 6. Mai 2026 ist außerhalb der Trainings-Daten der Modelle. Verweise auf Paragrafen müssen aus RAG-Quellen kommen, nicht aus Modell-Erinnerung.

Deployment-Bereitschaft — Stage 3

Standard-Annahme — Mittelständisches Unternehmen mit kompakter Nachhaltigkeitsfunktion

~65 %

Die Standard-Annahme bildet eine typische Client-Situation ab: digitale Dokumenten-Ablage, ERP/DMS vorhanden, Sustainability-Team mit 1–3 Personen, IT-Abteilung mit klarer EU-Cloud-Policy.

Client-seitige Voraussetzungen, die getragen werden müssen:

D04b Inputs digital verfügbar: Geschäftsbericht, Standort-Listen, Peer-DMAs müssen in Text-Form vorliegen (PDFs OK, gescannte Bilder nicht).
D11 Nutzer-Skill: Sustainability-Team hat grundlegende Erfahrung mit RAG-basierten Workflows oder lässt sich einarbeiten.
D12 Tool-Integration: LLM-API-Zugang (Anthropic/OpenAI/Google) in EU-Cloud-Region geklärt; keine ERP-Tiefenintegration nötig für die DMA selbst.
D26b Monitoring: ein dokumentierter Review-Rhythmus für KI-Output, bevor Ergebnisse in den Bericht fließen.
D02b Blast Radius: Limited Assurance per ISSA 5000 ab CSRD-Jahr 1, später Reasonable Assurance. Erfordert auditierbaren Trail (siehe Stage 4).

Bei deutlich höher entwickelten Setups (eigenes LLM-Ops-Team, etablierte Ground-Truth-Pipelines, dedizierte Assurance-Funktion) kann die Bereitschaft auf 85–90 % steigen — und die Empfehlungen entsprechend höher rücken.

Governance — Stage 4

Governance entscheidet, welche Kontrollen beim KI-Einsatz erforderlich werden — unabhängig davon, ob die Aufgabe technisch automatisierbar ist.

Besonders relevant für die DMA:

Nicht-delegierbare Verantwortung. Die Materialitäts-Entscheidung und die Board-Präsentation bleiben in menschlicher Hand. Berichts-Verantwortung lässt sich nicht an KI delegieren. Bezug: IAASB Professional Skepticism, ISSA 5000.
Nachvollziehbarer Audit-Trail. ESRS 1 verlangt eine dokumentierte, reperformbare DMA-Methodik. Jeder KI-gestützte Schritt muss zurück zu Quelle, Eingabe und Reviewer-Entscheidung verfolgt werden können. Bezug: ESRS 1 §3+§6, ISSA 5000.
Grundrechte-Folgen. Wenn die DMA auf Stakeholder mit besonderen Schutzbedürfnissen wirkt — eigene Belegschaft, betroffene Gemeinden, vulnerable Gruppen in der Wertschöpfungskette — greift die FRIA-Pflicht nach EU AI Act. Stakeholder-Validierung (T7) bleibt strukturell Mensch-only.

Weniger kritisch in diesem Kontext:

Missbrauchs-Risiko bei Dual-Use-Anwendungen ist niedrig — die DMA ist keine sicherheitskritische Aufgabe.
Fairness- und Bias-Governance wirkt nur indirekt, weil die Materialitäts-Logik nicht über Einzelpersonen entscheidet.

Empfohlene Kontrollen für den DMA-Einsatz:

4-Augen-Review auf allen Materialitäts-Entscheidungen und Schwellenwerten — durch eine zweite fachlich qualifizierte Person.
Vollständige Methoden-Dokumentation mit Modellversion, Eingaben, Prompts und Reviewer-Entscheidung pro Bewertungsschritt — als Grundlage für die Reperformance durch die Prüferin.
Auftragsverarbeitungs-Vertrag (AVV) + EU-Cloud-Setup für alle personenbezogenen Stakeholder-Inputs (DSGVO Art. 28).

Empfehlung zum weiteren Vorgehen

Für die DMA als Workflow lassen sich drei Lesarten ableiten.

Erstens — der Hebel sitzt im AI-freundlichen Mittelteil. T2 (Topic Screening) und T3 (IRO-Identifikation) machen typischerweise 30–40 % des Gesamt-Aufwands aus. Genau hier liegt die Zeitersparnis von 65–80 % bzw. 50–70 %. Eine schlanke Pipeline für diese zwei Aufgaben bringt mehr als ein Versuch, T7 oder T8 zu „automatisieren".

Zweitens — Stage 0 ist die Bedingung, nicht die Folge. Die Bandbreiten oben gelten nicht für naive Chat-Nutzung. Sie setzen voraus, dass Inputs, Rubrik, Tools und Review pro Teilaufgabe festgelegt sind — das ist der Setup-Aufwand, den eine erste Diagnose-Runde abdeckt.

Drittens — Stage 4 wirkt bindend, nicht als Option. T7 und T8 bleiben strukturell Mensch-only. Das ist keine Schwäche der Methodik, sondern eine Eigenschaft der Aufgabe: Verhandlung, Vermittlung und nicht-delegierbare Verantwortung sind Tätigkeiten anderer Form.

Caveat: Alle Zeitersparnis-Werte gelten unter der Bedingung professioneller Operationalisierung pro Teilaufgabe. Ohne saubere Stage-0-Definition (Inputs, Rubrik, Tools, Output, Review) liegen die Werte deutlich niedriger — typischerweise 0–30 % mit erhöhtem Fehler-Risiko.

Methodik im Detail

Vollständige Methodik einsehen →

Die hier verwendete Bewertungs-Methodik (5 Stufen, 42 Dimensionen, 41 Institutionen) ist auf der Methodik-Seite dokumentiert — einschließlich Stage-0-Operationalisierung, vollständiger Quellenmatrix und Empfehlungs-Logik auf der Autonomie-Skala.

Doppelte Wesentlichkeits­analyse — KI-Potenzial bewertet

Per-Teilaufgabe-Bewertung

Stage 0 — Operationalisierung pro Teilaufgabe

Modell-Fähigkeiten — Stage 2

Deployment-Bereitschaft — Stage 3

Governance — Stage 4

Empfehlung zum weiteren Vorgehen

Methodik im Detail

Bewertung für Ihren Kontext anfragen

Doppelte Wesentlichkeitsanalyse — KI-Potenzial bewertet