Bachelor + Master Publishing
811 Bachelorarbeiten, 533 Masterarbeiten, 10.103 Diplomarbeiten

Digitalanalyse als Ansatz zur Betrugserkennung in Finanzdaten

Digitalanalyse als Ansatz zur Betrugserkennung in Finanzdaten
Über dieses Buch
  • Art: Diplomarbeit
  • Autor: Stephan Dlugosz
  • Abgabedatum: Januar 2004
  • Umfang: 126 Seiten
  • Dateigröße: 770,1 KB
  • Note: 1,0
  • Institution / Hochschule: Westfälische Wilhelms-Universität Münster Deutschland
  • ISBN (eBook): 978-3-8324-8743-0
  • ISBN (Paperback) :
    978-3-8324-8743-0 P
  • ISBN (CD) :978-3-8324-8743-0 CD
  • Sprache: Deutsch
  • Prämierung:
  • Arbeit zitieren: Dlugosz, Stephan Januar 2004: Digitalanalyse als Ansatz zur Betrugserkennung in Finanzdaten, Hamburg: Diplomica Verlag
  • Schlagworte: Benford's Law, Mantissenverteilung, Power Law, Simulation

Diplomarbeit von Stephan Dlugosz

Zusammenfassung:

Zusammen mit dem Bedarf an Kennzahlen für die Abbildung wirtschaftlicher Vorgänge wächst auch das Risiko, welches aus fehlerhaften Daten resultiert.

So sind neben den Finanzbehörden des Staates insbesondere Versicherungen, Kreditkarteninstitute und Telefongesellschaften von betrügerischen Handlungen betroffen. Aber auch große Unternehmen oder die Forschung, insbesondere die Medizin und Pharmazie, bei denen häufig viel Geld am Ausgang einer empirischen Studie hängt, leiden unter gefälschten Angaben.

Um dieses Risiko gefälschter Daten zu handhaben, wurden zur Vermeidung von fehlerhaften Daten Revisionssysteme für Unternehmen bzw. Prüfsysteme im weiteren Sinne eingeführt. Diese basieren grundsätzlich immer auf der Bildung von geeigneten Stichproben zur Prüfung, da eine vollständige Prüfung aller Vorgänge auf Grund deren Menge nicht durchführbar ist. Die Wahl dieser Prüfstichproben kann durch mathematisch-statistische Verfahren unterstützt werden.

Ziel dieser Arbeit ist es, verschiedene Ansätze für die Analyse von Einzeldaten vergleichend vorzustellen und auf Daten aus der Praxis anzuwenden. Dabei werden ausschließlich Ansätze zur Erkennung von Betrug in Einzelangaben ohne direkten Zusammenhang betrachtet. Dies sind insbesondere rein statistische Ansätze im Umfeld von Benford’s-Law, Verfahren auf Basis von Mischungsmodellen und Ansätze mit Hilfe der Partitionierungsverfahren.

Alle Verfahren basieren auf der Mantissenstatistik, welche von der Größe der Zahl abstrahiert und lediglich die verwendeten Ziffern und ihre relativen Positionen innerhalb der Zahl beschreibt.

Ein weiteres Ziel ist die Betrachtung der Mantissen einiger Standardverteilungen durch Simulationen. Dabei werden insbesondere die Abhängigkeit der Mantissenverteilung von den Parametern der Standardverteilung und der Basis untersucht. Ziel ist dabei, ein tieferes Verständnis der Mantissenverteilungen zu gewinnen, um in Zukunft verbesserte Ansätze zur Betrugserkennung basierend auf dieser Statistik gewinnen zu können.

Inhaltsverzeichnis:

Inhaltsverzeichnis i
Abbildungsverzeichnis iv
Tabellenverzeichnis vi
Einleitung 1
1. Begriffsdefinitionen 2
1.1 Betrug 2
1.2 Betrugserkennung 4
1.3 Digitalanalyse 5
1.4 Ansätze der Digitalanalyse 7
2. Digitalanalyse mit Hilfe von Erste-Ziffer-Gesetzen 8
2.1 Grundidee 8
2.2 Benford’s-Law als erster Ansatz zur Betrugserkennung 9
2.2.1 Definition und spezielle Eigenschaften 9
2.2.2 Betrugsanalyse mit Benford’s-Law 12
2.2.3 Distortion-Factor-Model 15
2.2.4 Erklärungen für das Auftreten von Benford’s-Law 17
2.2.5 Testansätze mit Benford’s-Law als Nullhypothese 22
2.2.6 Kritik an Benford’s-Law als Ansatz zur Betrugserkennung 25
2.3 Familie von Proxie-Verteilungen 26
2.3.1 Definitionen 26
2.3.2 Eigenschaften der Proxie-Verteilungen 28
2.4 Digitalanalyse mit Power-Laws 31
2.4.1 Definition 31
2.4.2 Eigenschaften der Power-Laws 31
2.5 Kritik an der Digitalanalyse mit Hilfe von Erste-Ziffer-Gesetzen 34
3. Bestimmung der Mantissenverteilung ausgewählter Standardverteilungen 35
3.1 Ziel 35
3.2 Simulationen der ersten signifikanten Ziffern 36
3.2.1 Simulationsergebnisse ohne Trunkierung 36
3.2.2 Simulationsergebnisse mit Trunkierung 39
3.3 Anpassungen von Standardverteilungen an Benford’s-Law 42
3.3.1 Simulationsergebnisse bei unterschiedlichen Basen 42
3.3.2 Simulationsergebnisse bei unterschiedlichen Skalen 44
4. Digitalanalyse mit Hilfe von Partitionierungsverfahren 46
4.1 Grundlagen der Partitionierungsverfahren 46
4.2 Partitionierungsverfahren zur Digitalanalyse 47
4.2.1 Wahl eines geeigneten metrischen Raums 47
4.2.2 Wahl eines geeigneten Verfahrens 48
4.3 Kritik an der Digitalanalyse mit Hilfe von Partitionierungsverfahren 49
5. Digitalanalyse mit Hilfe von Mischungsmodellen 51
5.1 Grundlagen der Mischungsmodelle 51
5.1.1 Definition und Eigenschaften 51
5.1.2 EM-Algorithmus 54
5.2 Anwendung von Mischungsmodellen zur Betrugserkennung 57
5.2.1 Vorgehensmodell 57
5.2.2 Angepasster EM-Algorithmus 57
5.3 Partitionierungsverfahren für Mischungsmodelle 60
5.3.1 Variante des EM-Algorithmus zum Partitionieren 60
5.3.2 Maximum-Likelihood-Ansatz 60
5.3.3 Klassifikation nach maximaler a-posteriori-Wahrscheinlichkeit 62
5.4 Erweiterung des Ansatzes mit Mischungsmodellen um Basis- bzw. Skaleninvarianz 62
5.5 Kritik an der Digitalanalyse mit Hilfe von Mischungsmodellen 63
6. Anwendung der Digitalanalyse 65
6.1 Datenquellen 65
6.2 Auswahl einer Stichprobe mit Hilfe von reinem Zufall 68
6.3 Ergebnisse der Analyse der Praxisdaten 68
6.3.1 Analyse mit Benford’s-Law 68
6.3.2 Analyse mit allgemeinen Erste-Ziffer-Gesetzen 72
6.4 Analyse und Vergleich der simulierten Daten 73
6.4.1 Analyseergebnisse 73
6.4.2 Vergleich der Ergebnisse 76
7. Ausblick 77
Zusammenfassung 79
Literaturverzeichnis 81
Anhang 84
A. Berechnungen zum theoretischen Fit ausgewählter Standardverteilungen mit Benford’s-Law 84
B. Simulationsergebnisse 88
B.1 Mantissenverteilungen ausgewählter Standardverteilungen 88
B.2 Simulationsergebnisse der Anpasssung von Standardverteilungen an Benford’s-Law 100
C. Ergebnisse der Analyse der Praxisdaten 105
D. Simulationsdaten für den Vergleich 115

Automatisiert erstellter Textauszug:

Abbildung 3.8: Kolmogoroff-Smirnoff-Statistik der konstruierten Verteilung zu verschiedenen Basen Diese Ergebnisse zeigen, dass - wie erwartet - die Mantissenverteilung der konstruierten Verteilung bei der Betrachtung zur Basis 10 durch Benford’s-Law gut angenähert werden kann, ansonsten allerdings nicht. Ebenfalls auffällig ist ein gewisses Zyklenverhalten der Statistiken, welche jeweils bei Zehnerpotenzen, d.h. bei 10k für beliebige ganze k > 0 lokale Minima aufweisen. Dieser Effekt tritt aber nicht nur bei dieser konstruierten Verteilung auf, sondern auch bei der Lognormal- und auch der Exponentialverteilung.61 Satz 3.6 (Stetigkeit der Mantissenfunktion) Sei f (x) eine stetige Dichtefunktion über R+ . Dann ist die zugehörige Mantissenfunktion zur Basis b mb,f (x) stetig. Sie ist insbesondere stetig in b. Beweis. Betrachtet man die Mantissenfunktion als eine Funktion g von R2 nach R, so sollte gelten: ∀(t, b) ∈ (R+ )2 : lim g(x) = g(t, b) [...]

Die Beobachtung, dass bei steigender Varianz die Verteilung der ersten signifikanten Ziffer eine gewisse Rechtsschiefe aufweist, soll mit den folgenden Simulationen untersucht werden. Dazu werden grundsätzlich die Verteilungen aus dem vorangegangenen Kapitel genutzt, und bei verschieden Höchstwerten g abgeschnitten. Auf diese Weise können sowohl linksals auch rechtsschiefe Ausgangsverteilungen erzeugt werden, deren Erste-Ziffer-Verteilungen aus den anderen Simulationen schon bekannt sind. Das Simulationsverfahren sieht dabei eine herkömmliche Simulation der Verteilungen vor, wobei das Überschreiten der Höchstgrenze eine Neusimulation der betroffenen Werte hervorruft. Damit wird die Wahrscheinlichkeitsmasse, welche sich hinter der Höchstgrenze befindet, proportional zum Wert der Dichte unter der Höchstgrenze aufgeteilt, so dass wiederum eine Wahrscheinlichkeitsdichte fu (x) := f (x) · entsteht. Der zu erwartende Effekt, dass die ersten Ziffern unterhalb der Grenze häufiger auftreten als die anderen, bestätigt sich in der Abbildung 3.4. Die Häufigkeit von ersten signifikanten Ziffern oberhalb der Grenze ist im Vergleich zu den Werten darunter deutlich geringer. Es zeigt sich, dass eine Verteilung, deren Dichte monoton ansteigt, eine monoton ansteigende Mantissenverteilung aufweist. Deutlich ist dies bei der Lognormalverteilung in Abbildung 3.5 erkennbar. [...]

In diesem Kapitel soll auf die (nicht unbedingt mit Benford’s-Law konforme) Verteilung der Mantissen bzw. der ersten signifikanten Ziffern eingegangen werden. Ziel ist dabei eine Erklärung für das (Nicht-)Auftreten von Benford’s-Law zu geben. Des weiteren ist zu prüfen, ob die in Kapitel 2.3 vorgestellten Proxieverteilungen die Einschränkungen von Benford’s-Law ausreichend auflösen können, um eine generelle Anwendung zu ermöglichen. Folgende Vermutungen sollen in diesem Kapitel geprüft werden: 1. Nicht jede Verteilung hat eine mit mit Benford’s-Law konforme Mantissenverteilung. 2. Nicht jede Verteilung besitzt eine monoton fallende Mantissenverteilung. 3. Die höchste Wahrscheinlichkeit weist zumeist diejenige erste Ziffer auf, welche mit der ersten signifikanten Ziffer des Modalwertes identisch ist. 4. Mit steigender Varianz werden die Mantissenverteilungen der Benford’schen optisch ähnlicher. 5. Linksschiefe Verteilungen haben eine linksschiefe Mantissenverteilung und rechtsschiefe Verteilungen haben eine rechtsschiefe Mantissenverteilungen der ersten signifikanten Ziffern. Dazu werden Simulationen durchgeführt, welche zunächst den Einfluss der Parameter auf die Mantissenverteilung untersuchen. Anschließend werden die Einflüsse der Beschränkung des Definitionsbereichs nach oben und zum Abschluss der Einfluss der gewählten Basis betrachtet. [...]

Arbeit zitieren:
Dlugosz, Stephan Januar 2004: Digitalanalyse als Ansatz zur Betrugserkennung in Finanzdaten, Hamburg: Diplomica Verlag

Schlagworte:
Benford's Law, Mantissenverteilung, Power Law, Simulation

Entdecken Sie mehr zum Thema

diplom.de
Bachelor + Master Publishing

Hermannstal 119 k
22119 Hamburg

Fon: +49 (0) 40 655992-0
Fax: +49 (0) 40 655992-22

Service-Telefon

Rufen Sie uns an:
+49 (0) 40 655992-0

Mo-Fr
09.00-16.00 Uhr

diplom.de in den Medien

Folgen Sie uns bei Twitter & werden Sie diplom.de-Fan bei Facebook!
Schreibtipps unserer Lektoren, Neuigkeiten aus dem Verlagsalltag und das Expertenwissen unserer Autoren als Tweet & Post!
Wir freuen uns auf Sie!

diplom.de BACHELOR + MASTER PUBLISHING

Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Magisterarbeiten, Dissertationen und andere Abschlussarbeiten aus allen Fachbereichen und Hochschulen können Sie bei uns als eBook sofort per Download beziehen oder sich auf CD oder als Buch zusenden lassen. Seit mehr als 15 Jahren ist diplom.de der seriöse, professionelle und erfolgreiche Partner für die Veröffentlichung wissenschaftlicher Abschlussarbeiten.

© Diplomica Verlag GmbH 1996-2011, AG Hamburg HRB 80293 - GF Björn Bedey, USt-IdNr.: DE214910002 - Verkehrsnummer: 12285 - Impressum
Index der Arbeiten - Index der Autoren