Digitalanalyse als Ansatz zur Betrugserkennung in Finanzdaten
- Art: Diplomarbeit
- Autor: Stephan Dlugosz
- Abgabedatum: Januar 2004
- Umfang: 126 Seiten
- Dateigröße: 770,1 KB
- Note: 1,0
- Institution / Hochschule: Westfälische Wilhelms-Universität Münster Deutschland
- ISBN (eBook): 978-3-8324-8743-0
-
ISBN (Paperback) :
978-3-8324-8743-0 P - ISBN (CD) :978-3-8324-8743-0 CD
- Sprache: Deutsch
- Prämierung:
- Arbeit zitieren: Dlugosz, Stephan Januar 2004: Digitalanalyse als Ansatz zur Betrugserkennung in Finanzdaten, Hamburg: Diplomica Verlag
- Schlagworte: Benford's Law, Mantissenverteilung, Power Law, Simulation
In den Warenkorb
74,00 €
Diplomarbeit von Stephan Dlugosz
Zusammenfassung:
Zusammen mit dem Bedarf an Kennzahlen für die Abbildung wirtschaftlicher Vorgänge wächst auch das Risiko, welches aus fehlerhaften Daten resultiert.
So sind neben den Finanzbehörden des Staates insbesondere Versicherungen, Kreditkarteninstitute und Telefongesellschaften von betrügerischen Handlungen betroffen. Aber auch große Unternehmen oder die Forschung, insbesondere die Medizin und Pharmazie, bei denen häufig viel Geld am Ausgang einer empirischen Studie hängt, leiden unter gefälschten Angaben.
Um dieses Risiko gefälschter Daten zu handhaben, wurden zur Vermeidung von fehlerhaften Daten Revisionssysteme für Unternehmen bzw. Prüfsysteme im weiteren Sinne eingeführt. Diese basieren grundsätzlich immer auf der Bildung von geeigneten Stichproben zur Prüfung, da eine vollständige Prüfung aller Vorgänge auf Grund deren Menge nicht durchführbar ist. Die Wahl dieser Prüfstichproben kann durch mathematisch-statistische Verfahren unterstützt werden.
Ziel dieser Arbeit ist es, verschiedene Ansätze für die Analyse von Einzeldaten vergleichend vorzustellen und auf Daten aus der Praxis anzuwenden. Dabei werden ausschließlich Ansätze zur Erkennung von Betrug in Einzelangaben ohne direkten Zusammenhang betrachtet. Dies sind insbesondere rein statistische Ansätze im Umfeld von Benford’s-Law, Verfahren auf Basis von Mischungsmodellen und Ansätze mit Hilfe der Partitionierungsverfahren.
Alle Verfahren basieren auf der Mantissenstatistik, welche von der Größe der Zahl abstrahiert und lediglich die verwendeten Ziffern und ihre relativen Positionen innerhalb der Zahl beschreibt.
Ein weiteres Ziel ist die Betrachtung der Mantissen einiger Standardverteilungen durch Simulationen. Dabei werden insbesondere die Abhängigkeit der Mantissenverteilung von den Parametern der Standardverteilung und der Basis untersucht. Ziel ist dabei, ein tieferes Verständnis der Mantissenverteilungen zu gewinnen, um in Zukunft verbesserte Ansätze zur Betrugserkennung basierend auf dieser Statistik gewinnen zu können.
Inhaltsverzeichnis:
| Inhaltsverzeichnis | i | |
| Abbildungsverzeichnis | iv | |
| Tabellenverzeichnis | vi | |
| Einleitung | 1 | |
| 1. | Begriffsdefinitionen | 2 |
| 1.1 | Betrug | 2 |
| 1.2 | Betrugserkennung | 4 |
| 1.3 | Digitalanalyse | 5 |
| 1.4 | Ansätze der Digitalanalyse | 7 |
| 2. | Digitalanalyse mit Hilfe von Erste-Ziffer-Gesetzen | 8 |
| 2.1 | Grundidee | 8 |
| 2.2 | Benford’s-Law als erster Ansatz zur Betrugserkennung | 9 |
| 2.2.1 | Definition und spezielle Eigenschaften | 9 |
| 2.2.2 | Betrugsanalyse mit Benford’s-Law | 12 |
| 2.2.3 | Distortion-Factor-Model | 15 |
| 2.2.4 | Erklärungen für das Auftreten von Benford’s-Law | 17 |
| 2.2.5 | Testansätze mit Benford’s-Law als Nullhypothese | 22 |
| 2.2.6 | Kritik an Benford’s-Law als Ansatz zur Betrugserkennung | 25 |
| 2.3 | Familie von Proxie-Verteilungen | 26 |
| 2.3.1 | Definitionen | 26 |
| 2.3.2 | Eigenschaften der Proxie-Verteilungen | 28 |
| 2.4 | Digitalanalyse mit Power-Laws | 31 |
| 2.4.1 | Definition | 31 |
| 2.4.2 | Eigenschaften der Power-Laws | 31 |
| 2.5 | Kritik an der Digitalanalyse mit Hilfe von Erste-Ziffer-Gesetzen | 34 |
| 3. | Bestimmung der Mantissenverteilung ausgewählter Standardverteilungen | 35 |
| 3.1 | Ziel | 35 |
| 3.2 | Simulationen der ersten signifikanten Ziffern | 36 |
| 3.2.1 | Simulationsergebnisse ohne Trunkierung | 36 |
| 3.2.2 | Simulationsergebnisse mit Trunkierung | 39 |
| 3.3 | Anpassungen von Standardverteilungen an Benford’s-Law | 42 |
| 3.3.1 | Simulationsergebnisse bei unterschiedlichen Basen | 42 |
| 3.3.2 | Simulationsergebnisse bei unterschiedlichen Skalen | 44 |
| 4. | Digitalanalyse mit Hilfe von Partitionierungsverfahren | 46 |
| 4.1 | Grundlagen der Partitionierungsverfahren | 46 |
| 4.2 | Partitionierungsverfahren zur Digitalanalyse | 47 |
| 4.2.1 | Wahl eines geeigneten metrischen Raums | 47 |
| 4.2.2 | Wahl eines geeigneten Verfahrens | 48 |
| 4.3 | Kritik an der Digitalanalyse mit Hilfe von Partitionierungsverfahren | 49 |
| 5. | Digitalanalyse mit Hilfe von Mischungsmodellen | 51 |
| 5.1 | Grundlagen der Mischungsmodelle | 51 |
| 5.1.1 | Definition und Eigenschaften | 51 |
| 5.1.2 | EM-Algorithmus | 54 |
| 5.2 | Anwendung von Mischungsmodellen zur Betrugserkennung | 57 |
| 5.2.1 | Vorgehensmodell | 57 |
| 5.2.2 | Angepasster EM-Algorithmus | 57 |
| 5.3 | Partitionierungsverfahren für Mischungsmodelle | 60 |
| 5.3.1 | Variante des EM-Algorithmus zum Partitionieren | 60 |
| 5.3.2 | Maximum-Likelihood-Ansatz | 60 |
| 5.3.3 | Klassifikation nach maximaler a-posteriori-Wahrscheinlichkeit | 62 |
| 5.4 | Erweiterung des Ansatzes mit Mischungsmodellen um Basis- bzw. Skaleninvarianz | 62 |
| 5.5 | Kritik an der Digitalanalyse mit Hilfe von Mischungsmodellen | 63 |
| 6. | Anwendung der Digitalanalyse | 65 |
| 6.1 | Datenquellen | 65 |
| 6.2 | Auswahl einer Stichprobe mit Hilfe von reinem Zufall | 68 |
| 6.3 | Ergebnisse der Analyse der Praxisdaten | 68 |
| 6.3.1 | Analyse mit Benford’s-Law | 68 |
| 6.3.2 | Analyse mit allgemeinen Erste-Ziffer-Gesetzen | 72 |
| 6.4 | Analyse und Vergleich der simulierten Daten | 73 |
| 6.4.1 | Analyseergebnisse | 73 |
| 6.4.2 | Vergleich der Ergebnisse | 76 |
| 7. | Ausblick | 77 |
| Zusammenfassung | 79 | |
| Literaturverzeichnis | 81 | |
| Anhang | 84 | |
| A. | Berechnungen zum theoretischen Fit ausgewählter Standardverteilungen mit Benford’s-Law | 84 |
| B. | Simulationsergebnisse | 88 |
| B.1 | Mantissenverteilungen ausgewählter Standardverteilungen | 88 |
| B.2 | Simulationsergebnisse der Anpasssung von Standardverteilungen an Benford’s-Law | 100 |
| C. | Ergebnisse der Analyse der Praxisdaten | 105 |
| D. | Simulationsdaten für den Vergleich | 115 |
Abbildung 3.8: Kolmogoroff-Smirnoff-Statistik der konstruierten Verteilung zu verschiedenen Basen Diese Ergebnisse zeigen, dass - wie erwartet - die Mantissenverteilung der konstruierten Verteilung bei der Betrachtung zur Basis 10 durch Benford’s-Law gut angenähert werden kann, ansonsten allerdings nicht. Ebenfalls auffällig ist ein gewisses Zyklenverhalten der Statistiken, welche jeweils bei Zehnerpotenzen, d.h. bei 10k für beliebige ganze k > 0 lokale Minima aufweisen. Dieser Effekt tritt aber nicht nur bei dieser konstruierten Verteilung auf, sondern auch bei der Lognormal- und auch der Exponentialverteilung.61 Satz 3.6 (Stetigkeit der Mantissenfunktion) Sei f (x) eine stetige Dichtefunktion über R+ . Dann ist die zugehörige Mantissenfunktion zur Basis b mb,f (x) stetig. Sie ist insbesondere stetig in b. Beweis. Betrachtet man die Mantissenfunktion als eine Funktion g von R2 nach R, so sollte gelten: ∀(t, b) ∈ (R+ )2 : lim g(x) = g(t, b) [...]
Die Beobachtung, dass bei steigender Varianz die Verteilung der ersten signifikanten Ziffer eine gewisse Rechtsschiefe aufweist, soll mit den folgenden Simulationen untersucht werden. Dazu werden grundsätzlich die Verteilungen aus dem vorangegangenen Kapitel genutzt, und bei verschieden Höchstwerten g abgeschnitten. Auf diese Weise können sowohl linksals auch rechtsschiefe Ausgangsverteilungen erzeugt werden, deren Erste-Ziffer-Verteilungen aus den anderen Simulationen schon bekannt sind. Das Simulationsverfahren sieht dabei eine herkömmliche Simulation der Verteilungen vor, wobei das Überschreiten der Höchstgrenze eine Neusimulation der betroffenen Werte hervorruft. Damit wird die Wahrscheinlichkeitsmasse, welche sich hinter der Höchstgrenze befindet, proportional zum Wert der Dichte unter der Höchstgrenze aufgeteilt, so dass wiederum eine Wahrscheinlichkeitsdichte fu (x) := f (x) · entsteht. Der zu erwartende Effekt, dass die ersten Ziffern unterhalb der Grenze häufiger auftreten als die anderen, bestätigt sich in der Abbildung 3.4. Die Häufigkeit von ersten signifikanten Ziffern oberhalb der Grenze ist im Vergleich zu den Werten darunter deutlich geringer. Es zeigt sich, dass eine Verteilung, deren Dichte monoton ansteigt, eine monoton ansteigende Mantissenverteilung aufweist. Deutlich ist dies bei der Lognormalverteilung in Abbildung 3.5 erkennbar. [...]
In diesem Kapitel soll auf die (nicht unbedingt mit Benford’s-Law konforme) Verteilung der Mantissen bzw. der ersten signifikanten Ziffern eingegangen werden. Ziel ist dabei eine Erklärung für das (Nicht-)Auftreten von Benford’s-Law zu geben. Des weiteren ist zu prüfen, ob die in Kapitel 2.3 vorgestellten Proxieverteilungen die Einschränkungen von Benford’s-Law ausreichend auflösen können, um eine generelle Anwendung zu ermöglichen. Folgende Vermutungen sollen in diesem Kapitel geprüft werden: 1. Nicht jede Verteilung hat eine mit mit Benford’s-Law konforme Mantissenverteilung. 2. Nicht jede Verteilung besitzt eine monoton fallende Mantissenverteilung. 3. Die höchste Wahrscheinlichkeit weist zumeist diejenige erste Ziffer auf, welche mit der ersten signifikanten Ziffer des Modalwertes identisch ist. 4. Mit steigender Varianz werden die Mantissenverteilungen der Benford’schen optisch ähnlicher. 5. Linksschiefe Verteilungen haben eine linksschiefe Mantissenverteilung und rechtsschiefe Verteilungen haben eine rechtsschiefe Mantissenverteilungen der ersten signifikanten Ziffern. Dazu werden Simulationen durchgeführt, welche zunächst den Einfluss der Parameter auf die Mantissenverteilung untersuchen. Anschließend werden die Einflüsse der Beschränkung des Definitionsbereichs nach oben und zum Abschluss der Einfluss der gewählten Basis betrachtet. [...]
In den Warenkorb
74,00 €
Link zur Arbeit:
http://www.diplom.de/ean/9783832487430
Arbeit zitieren:
Dlugosz, Stephan Januar 2004: Digitalanalyse als Ansatz zur Betrugserkennung in Finanzdaten, Hamburg: Diplomica Verlag
Schlagworte:
Benford's Law, Mantissenverteilung, Power Law, Simulation



