Generative KI in Steuerabteilungen: Nur Euphorie oder Innovation?
Generative KI hat gegen Ende des Jahres 2022 entscheidende Fortschritte erzielt. Erstmalig scheint die Delegation von anspruchsvoller Wissensarbeit an Maschinen in greifbarer Nähe zu sein. Oder wird die von generativer KI ausgelöste Euphorie einer Ernüchterung wie bei der Blockchain weichen?
Potenzielle Anwendungshindernisse
Im Jahr 2023 gibt es zwei vermeintliche Argumente gegen den Einsatz von generativer Künstlicher Intelligenz in Steuerabteilungen: Erstens sei schwer zu verstehen, wie generative KI funktioniere (Black-Box-Argument). Zweitens habe generative KI unerwünschte Eigenschaften (Limitations-Argument).
Das Black-Box-Argument kritisiert generative KI als System, bei dem von Anwenderseite nicht verstanden wird, wie Eingaben in Ausgaben transformiert werden. Gegen dieses Argument spricht zum einen, dass Taxi-Unternehmer auch nicht im Detail verstehen müssen, wie Motoren funktionieren, um mit der Personenbeförderung Geld zu verdienen. Zum anderen kann generative KI in Form von Large Language Models vereinfacht als System beschrieben werden, das Texte automatisch vervollständigt, indem es zu einem vorangegangenen Wort das nachfolgende Wort mit der höchsten Wahrscheinlichkeit aus seinem Wortschatz auswählt. Fast alle Menschen kennen einfache Varianten dieser Idee bereits von Mobiltelefonen, die Nutzern beim Verfassen von Textnachrichten nach der Eingabe der ersten Buchstaben Vorschläge für vollständige Wörter machen. Kurz gesagt ist das Black-Box-Argument gegen den Einsatz generativer KI in Steuerabteilungen nicht haltbar, da generative KI durch Analogien zu bekannten Technologien zumindest grob verstanden und auch ohne Detailkenntnisse über ihre Funktionsweise gewinnbringend eingesetzt werden kann.
Das Limitations-Argument kritisiert an generativer KI insbesondere, dass sie Unwahrheiten verbreitet. Zudem wird generativer KI vorgeworfen, dass sie nicht aus Erfahrungen lernt, alte und möglicherweise falsche Daten verwendet, dieselbe Frage in zwei aufeinanderfolgenden Minuten unterschiedlich beantwortet, vom Nutzer nur eine begrenzte Anzahl an Zeichen entgegennimmt, Quellen nicht (korrekt) angibt und möglicherweise den Datenschutz missachtet. Dem Limitations-Argument ist zum einen entgegenzuhalten, dass es die Vorteile von generativer KI im Gegensatz zu menschlicher Intelligenz übersieht, da generative KI leicht skaliert werden kann und nicht ermüdet. Zum anderen beziehen sich die Kritikpunkte des Limitations-Arguments teilweise auf Nachteile von generativer KI, die Steuerabteilungen nicht exklusiv zur Verfügung steht. Tatsächlich kann private generative KI individuell trainiert und unter Beachtung des Datenschutzes verwendet werden. Kurz gesagt ist das Limitations-Argument gegen generativer KI in Steuerabteilungen unzureichend, da es die Vorteile der generativer KI gegenüber menschlicher Intelligenz ignoriert und übersieht, dass einige Kritikpunkte durch private generative KI hinfällig werden.
Chancen
Im Gegensatz zu anderen zunächst euphorisch diskutierten Technologien wie der Blockchain, die außer in Kryptowährungen bislang keine prominenten Anwendungsgebiete gefunden hat, ist davon auszugehen, dass generative KI die Steuerabteilungen langfristig verändern wird. Grund für diese optimistische Prognose ist der bereits heute klar erkennbare Nutzen von generativer KI in Steuerabteilungen, beispielsweise beim Erstellen von grammatikalisch fehlerfreien Anschreiben oder beim Zusammenfassen bzw. Verschlagworten von Gerichtsurteilen. Auch in Nebenprozessen wie dem Verfassen von Stellenausschreibungen, Zielvereinbarungen und Arbeitszeugnissen können Steuerabteilungen von generativer KI profitieren.
Der Bedarf an generativer KI wird sogar noch wachsen, da sie dem Fachkräftemangel in den Steuerabteilungen bzw. in der Steuerberatung entgegenwirkt und vermutlich noch erhebliches Entwicklungspotenzial bietet. Obwohl sich nach den jüngsten Durchbrüchen bei generativer KI deren Entwicklung wieder verlangsamen könnte, erscheinen „KI-Winter“, die es in den letzten Jahrzehnten mehrfach gab, unwahrscheinlich. Vielmehr dürfte die hybride Intelligenz praxisrelevant werden, bei der Menschen einzelne Prozessschritte an generative KI delegieren und anschließend die maschinelle Arbeit kontrollieren bzw. korrigieren. Wird das Ergebnis der Kontrolle bzw. Korrektur an die generative KI übermittelt, wird sie durch diese Rückmeldung zusätzlich trainiert.
Aufgrund des klar erkennbaren Nutzens und der erheblichen Entwicklungschancen ist generative KI in Steuerabteilungen mit traditionell zahlreichen textbasierten Leistungsprozessen nicht nur Euphorie, sondern eine wichtige Innovation. Folglich sollten die derzeitigen Limitationen von generativer KI nicht als Argumente gegen deren Verwendung in Steuerabteilungen fehlgedeutet werden. Stattdessen sollten die derzeitigen Limitationen generativer KI als Chancen begriffen werden, Effizienzvorteile gegenüber Unternehmen zu erlangen, die sich aufgrund des Black-Box- oder Limitations-Arguments nicht mit KI befassen.
Im Übrigen könnte KI langfristig von den Fortschritten bei der Entwicklung von Quantencomputern profitieren. Quantencomputer können im Gegensatz zu klassischen Computern in ihrem Kern nicht nur zwischen 0 und 1, sondern auch alle Dezimalzahlen zwischen 0 und 1 unterscheiden. Mit dieser bauartbedingten Fähigkeit zu feingliedrigen Unterscheidungen könnte sich KI der menschlichen Intelligenz annähern, einen weiteren Innovationsschub auslösen und erhebliche Chancen für KI in Steuerabteilungen eröffnen.
Kompetenzen
Bei der Anwendung von generativer KI werden Pre-Training, Fine-Tuning und Prompt Engineering unterschieden. Die Reihenfolge dieser Kompetenzen spiegelt ihre abnehmende Zeitintensität wider:
- Beim Pre-Training werden einer generativen KI anhand von großen, nicht gekennzeichneten Datensätzen allgemeine Merkmale und Muster beigebracht, die auf verschiedene Aufgaben angewendet werden können. Die im Pre-Training vermittelten Grundlagen sind die Voraussetzung für das Fine-Tuning.
- Beim Fine-Tuning wird einer generativen KI anhand eines kleineren, gekennzeichneten Datensatzes fachgebiets- oder aufgabenspezifisches Wissen vermittelt.
- Beim Prompt Engineering werden Prompts entwickelt, um generative KI für einzelne Aufgaben effizient nutzen zu können. Ein Prompt ist ein Befehl oder ein Bündel von Befehlen, der die Fähigkeiten von generativer KI verfeinert. Hochwertige Prompts können Fine-Tuning teilweise ersetzen.
Generative KI hat das Potenzial, den Leistungsprozess von Steuerabteilungen zu optimieren. Ziel dabei ist es, einzelne Tätigkeiten zu optimieren. Da eine auf steuerliche Aufgaben trainierte generative KI bisher nicht existiert, kann der Einsatz von generativer KI im Steuerbereich nur mit dem nötigen Maß an Sorgfalt erfolgen.
Anwendungsbeispiel
Die Qualität steuerlicher Beiträge (Aktennotizen, Gutachten, Betriebsprüfungsantworten, Einspruchschreiben, Literaturbeiträge, …) wird wesentlich durch die Verarbeitung sämtlicher steuerlicher Literaturquellen und deren korrekte Zitierung bestimmt. Diese Literatur wird heute zumeist mittels Stichwortsuchen in den Datenbanken der steuerlichen Fachverlage recherchiert. Die Trefferlisten werden manuell gesichtet, auf Relevanz geprüft und schließlich im Beitrag verwertet.
Das Ziel des folgenden Anwendungsbeispiels ist es, die Ergebnisauswertung der Suchmaschinentreffer zu verbessern und die Relevanzbeurteilung zu erleichtern. Dabei werden mehrere Technologien miteinander kombiniert. Die Treffer werden zunächst mittels generativer KI und Prompt Engineering analysiert. Anschließend werden die Ergebnisse mit einer Business-Intelligence-Software dargestellt.
Die einzelnen Schritte sind:
- Die Datenbanken von steuerlichen Fachverlagen werden nach einem bestimmten Thema wie „Verrechnungspreise für Konzernfinanzierungen“ durchsucht und die gefundenen Dokumente gespeichert.
- Für die gefundenen Dokumente werden mithilfe generativer KI diverse Stamm- und Inhaltsdaten erhoben. Die Stammdaten in diesem Kontext sind beispielsweise die Dokumentenart (Rechtsprechung, Verwaltungsschreiben, Kommentar oder Aufsatz), das Veröffentlichungsdatum, die Verfasser und ggf. das Aktenzeichen. Dagegen umfassen die Inhaltsdaten beispielsweise Inhaltszusammenfassungen, Schlagworte und Verweise auf andere Dokumente. Während die Stammdaten zumindest theoretisch mit aufwändiger Spezialsoftware extrahiert werden können, ist die generative KI beim Zusammenfassen, Verschlagworten und Erfassen der Verweise auf andere Dokumente unverzichtbar.
- Die relative Relevanz der Dokumente wird berechnet. Hierfür werden beispielsweise das Veröffentlichungsdatum (neuer ist tendenziell relevanter), die Anzahl der Verweise auf das Dokument (mehr Zitate sind tendenziell relevanter) und etwaige inhaltliche Widersprüche zu älteren Dokumenten (Widersprüche sind tendenziell relevanter als Übereinstimmungen) in Bezug gebracht. Während das Veröffentlichungsdatum und die Anzahl der Verweise auf das Dokument mit Standardsoftware sortiert werden kann, ist die generative KI beim Identifizieren von Widersprüchen zwischen den Inhaltszusammenfassungen unverzichtbar.
- Die Relevanzparameter sowie die wichtigsten Stamm- und Inhaltsdaten der Dokumente werden mit Business-Intelligence-Software visualisiert.
- Basierend auf den relevantesten Dokumenten kann die generative KI beispielweise eine Notiz, eine Präsentation, eine Konzernrichtlinie oder eine Antwort auf eine Betriebsprüfungsanfrage formulieren.
In der Abbildung wird exemplarisch die neuere Rechtsprechung zur steuerlichen Behandlung von Verrechnungspreisen bei konzerninternen Darlehen analysiert, um eine Antwort auf eine entsprechende Betriebsprüfungsanfrage vorzubereiten. Im oberen Teil der Abbildung wird zunächst die Rechtsentwicklung anhand der Verweise zwischen den Urteilen dargestellt. Der untere Teil der Abbildung zeigt die relative Relevanz der Urteile, die mithilfe generativer KI quantifiziert wurde.
Zum Vergrößern bitte auf die Grafik klicken.
Das Anwendungsbeispiel zeigt, wie sich mittels einer Kombination aus generativer KI, Expertenwissen und modernen Analysewerkzeugen die Recherche als zentrale Phase des Leistungsprozesses effizienter gestalten lässt und neue Erkenntnisse gewonnen werden können.
Handlungsempfehlungen
Viele Steuerabteilungen mittelständischer Unternehmen haben sich bislang kaum mit generativer KI befasst. Wir empfehlen einen schrittweisen Ansatz:
- Probieren Sie die Fähigkeiten von generativer KI selbst aus. Wir empfehlen, einer frei zugänglichen generativen KI allgemeine steuerliche Fragen zu stellen. Aus Gründen des Datenschutzes sollten Sie hierbei auf unternehmensspezifische Fragen verzichten oder zumindest die unternehmens- und personenbezogenen Daten anonymisieren.
- Verbessern Sie die Qualität der Antworten der generativen KI durch einfaches Prompt Engineering. Wenn Sie Ihrer steuerlichen Frage an die generative KI beispielsweise den Prompt „Du bist ein Steuerberater“ voranstellen, erhalten Sie typischerweise präzisere Antworten. Gleiches gilt, wenn Sie der generativen KI für die Beantwortung einer Frage, die nur mit gedanklichen Zwischenschritten gelöst werden kann (etwa die Berechnung des Bekanntgabedatums eines Steuerbescheids ausgehend von dessen Erstellungsdatum), konkrete Beispiele für korrekte Fristberechnungen mitgeben bzw. den Prompt „Denke schrittweise“ hinzufügen. Wahrscheinlich werden Sie feststellen, dass die generative KI mit der Fristenberechnung teilweise Schwierigkeiten hat – Prompt Engineering ist hier entscheidend. Die Expertengruppe der Steuerberatung von RÖDL bietet Schulungen zum Prompt Engineering, speziell im Umgang mit steuerlichen Fragestellungen an.
- Prüfen Sie, ob es in Ihrem Unternehmen bereits eine Daten- bzw. KI-Strategie gibt. Falls ja, sollte die Daten- bzw. KI-Strategie für die Steuerabteilung idealerweise in die unternehmensweite Digitalisierungsstrategie integriert und beispielsweise die gleiche generative KI verwendet werden. Falls dagegen noch keine unternehmensweite Daten- bzw. KI-Strategie existiert, muss zunächst grob festgelegt werden, welche Aufgaben die generative KI übernehmen soll. Um diese Ziele zu erreichen, wird anschließend entschieden, welche Datengrundlage benötigt wird, ob Prompt Engineering oder Fine-Tuning erforderlich ist und welche generative KI am besten geeignet ist. Auf Wunsch entwickeln die Experten von RÖDL eine unternehmensindividuelle Daten- bzw. KI-Strategie zusammen mit Ihrer IT-Abteilung.
- Beginnen Sie mit kleinen Pilotprojekten zum Einsatz von generativer KI, um alle Beteiligten abzuholen, etwaige Berührungsängste abzubauen und schnell motivierende Erfolge zu erzielen. Das Ziel eines Pilotprojekts sollte ein schnelles Minimum Viable Product (MVP) sein. Dieses MVP muss lediglich einen Teil der sonst üblichen Anforderungen erfüllen, bildet aber eine wichtige Grundlage für die erfolgreiche Implementierung von generativer KI in der Steuerabteilung. Die Expertengruppe der Steuerberatung von RÖDL unterstützt Sie bei der Ideenfindung und Umsetzung von MVPs.