Flächenverschneidung in GIS
Effizienzbetrachtung und stochastische Modellierung
- Art: Diplomarbeit
- Autor: Peter Korduan
- Abgabedatum: Dezember 1997
- Umfang: 98 Seiten
- Dateigröße: 874,4 KB
- Note: 1,0
- Institution / Hochschule: Technische Universität Berlin Deutschland
- ISBN (eBook): 978-3-8324-7228-3
-
ISBN (Paperback) :
978-3-8324-7228-3 P - ISBN (CD) :978-3-8324-7228-3 CD
- Sprache: Deutsch
- Prämierung:
- Arbeit zitieren: Korduan, Peter Dezember 1997: Flächenverschneidung in GIS, Hamburg: Diplomica Verlag
- Schlagworte: Geo-Informationssystem, Datenqualität, Metainformation, Verschneidungsalgorithmus, Fehlerfortpflanzung
In den Warenkorb
38,00 €
Diplomarbeit von Peter Korduan
Einleitung:
Geo-Informationssysteme sind seit geraumer Zeit in vieler Munde. Viele Bestrebungen sind in Gang gesetzt worden, um alles mögliche in digitaler Form zu erfassen. Geo-Informationssysteme werden in Zukunft einen großen Teil, der sonst noch manuell erstellten Arbeiten, an Raumdaten ersetzen. Ist die Erfassung der Daten erst einmal abgeschlossen, wird damit begonnen, neue Daten zu produzieren, aufzuarbeiten und darzustellen. Dabei werden Analysefunktionen verwendet, die für den Bearbeiter auf Grund seiner Komplexität und Massenhaftigkeit nicht mehr nachvollziehbar sein werden. Die raumbezogenen Daten sind Meßgrößen. Jeder weiß, daß solche Größen immer fehlerbehaftet sind. Bei der Gewinnung von neuen Informationen aus diesen fehlerbehafteten Daten übertragen sich natürlich auch die Fehler. Um zunächst erst einmal Aussagen über die Qualität der Ausgangsdaten in einem GIS treffen zu können, ist die Kenngröße Genauigkeit mit in den Datenbestand aufzunehmen. Es kann auch keine Aussage über die Qualität des Analyseergebnisses getroffen werden, wenn man nicht weiß, wie sich die Fehler und in welchen Größenordnungen übertragen. Diese beiden Dinge, also Genauigkeit von geometrischen Objekten und die Fehlerfortpflanzung bei Datenanalysen sind wesentliche Voraussetzung für Qualitätsangaben in raumbezogenen Informationssystemen. Leider existieren keine GIS-Produkte auf dem kommerziellen Markt, die diese Aspekte durchgreifend verwirklichen. Zum einen liegt das daran, daß sich die Datenmengen bei mitgeführter Genauigkeit mehr als verdoppeln würden, zum anderen, daß die herkömmlichen Algorithmen zur Berechnung der Fehlerfortpflanzung sehr viel Zeit brauchen, die ganze Angelegenheit also uneffektiv zu sein scheint. Geodäten sind bekannt dafür, Meßgrößen hinsichtlich ihrer Genauigkeit zu beurteilen. Ergebnisse ohne Genauigkeitsbetrachtung sind für ihn nicht aussagekräftig. In der Zeit der schnellen Entwicklung der Computertechnik darf es nicht versäumt werden diesen Aspekt von Seiten der Geodäsie und Photogrammetrie mit in Informationssysteme einzubringen. Noch befinden sich einige Konzepte für GIS in der Entwicklungsphase. Sind GIS aber überall am Laufen, besteht auf Grund der Kosten kaum noch eine Möglichkeit zur Umstellung der Software. Ist ein Geoinformationssystem nicht in der Lage, Genauigkeiten zu erfassen und zu verarbeiten, kann es keine sicheren und vertrauenswürdigen Ergebnisse erzielen.
Gang der Untersuchung:
Am Beispiel der wichtigen Analysefunktion Flächenverschneidung wird gezeigt, dass es bei sinnvoller Speicherung und angepassten Algorithmen möglich ist, Fehlerfortpflanzung für große Datenmengen effektiv zu berechnen. Es wurde ein Programm in der Programmiersprache C++ geschrieben, in welchem effiziente Algorithmen für die Varianzfortpflanzung bei der Flächenverschneidung und geeignete Visualisierungen für die Ergebnisse implementiert wurde.
Zu Beginn der Arbeit wird ein Überblick über Datenstrukturen und Algorithmen gegeben. Dann wird die Problematik der Flächenverschneidung erörtert. Anschließend werden stochastische Modelle für die Flächenverschneidung vorgestellt, die entsprechenden Besetzungsstrukturen der vorkommenden Matrizen beschrieben und Formeln für die Ableitung der Schnittpunktkoordinaten nach den beteiligten Polygonpunktkoordinaten hergeleitet. In einem nächsten Abschnitt wird die Implementierung geeigneter Algorithmen in das Programm „ VFGCUTAS“ beschrieben und begründet. Eine Analyse der Laufzeiten und der Speicherbelegung soll die Wirksamkeit der verwendeten Algorithmen herausstellen und Schlussfolgerungen ermöglichen. Wenn in dieser Arbeit von „dem oder das Programm“ die Rede ist, wird damit das Programm „ VFGCUTAS“ gemeint. Zur Abarbeitung größerer Datenmengen mit PC´s wurde zusätzlich zu „VFGCUTAS“ ein modifiziertes Programm erstellt, welches die verwendeten Daten und Ergebnisse ausschließlich in Dateien speichert und davon zugreift. Dieses führt die Bezeichnung „VFGCUTDA“. Elemente einer Matrix, die ungleich Null sind, sollen Nicht-Null-Elemente heißen und werden mit NNE abgekürzt. Der Begriff Kovarianzmatrix wird verwendet für die Matrix, die Varianzen, Kovarianzen sowie Kreuzkovarianzen enthält.
Inhaltsverzeichnis:
| 1. | Einleitung | 1 |
| 1.1 | Motivation | 1 |
| 1.2 | Aufgabenstellung | 1 |
| 1.3 | Allgemeines | 1 |
| 2. | Datenstrukturen und Algorithmen | 2 |
| 2.1 | Speichertechniken | 2 |
| 2.1.1 | Lineare Felder | 3 |
| 2.1.2 | Mehrfach gekettete Speicherung | 5 |
| 2.1.3 | Dateispeicherung | 5 |
| 2.1.4 | Zwischen Unix und DOS | 7 |
| 2.2 | Zugriff auf Daten | 7 |
| 2.2.1 | Zugriff über Adressen | 8 |
| 2.2.2 | Suchalgorithmen | 8 |
| 2.3 | Sortieren von Daten | 9 |
| 2.4 | Relationale Datenstrukturen und Graphen | 10 |
| 2.5 | Raum - und Zeitkomplexität | 12 |
| 2.5.1 | Zeitkomplexität von Matrizenoperationen | 12 |
| 2.5.2 | Raumkomplexitäten der Matrizen beim VFG | 14 |
| 3. | Flächenverschneidung | 23 |
| 3.1 | Funktionales Modell | 23 |
| 3.2 | Methoden zur flächenhaften Findung von Schnittpunkten | 24 |
| 3.2.1 | Brut Force Methode | 24 |
| 3.2.2 | Uniform Grid Methode | 24 |
| 4. | Varianzfortpflanzung | 24 |
| 4.1 | Allgemeines | 24 |
| 4.2 | Stochastische Modelle | 25 |
| 4.2.1 | Best Case | 26 |
| 4.2.2 | Average Case | 26 |
| 4.2.3 | Worst Case | 26 |
| 4.2.4 | Kovarianzmodellierung | 26 |
| 4.3 | Besetzungsstrukturen der Matrizen und nötige Relationen | 27 |
| 4.3.1 | Funktionsmatrix F | 28 |
| 4.3.2 | Kovarianzmatrix der Ausgangspunkte - Best Case | 30 |
| 4.3.3 | Matrix der Kovarianzen zwischen den Ausgangspunkten und den Schnittpunkten | 33 |
| 4.3.4 | Kovarianzmatrix der Schnittpunkte | 35 |
| 5. | Ableitungen der Schnittpunktkoordinaten nach den Punktkoordinaten | 37 |
| 5.1 | Formeln mit zyklischer Vertauschung | 37 |
| 5.2 | Formeln ohne zyklische Vertauschung | 38 |
| 5.2.1 | Sonderfall | 39 |
| 6. | Beschreibung der im Programm verwendeten Datentypen und Algorithmen | 40 |
| 6.1 | Implementierte Datenstrukturen | 40 |
| 6.1.1 | Speicherung im Arbeitsspeicher | 40 |
| 6.1.2 | Speicherung in Dateien | 44 |
| 6.2 | Datenschnittstelle und Typen | 49 |
| 6.3 | Erzeugung des Beispieldatensatzes | 49 |
| 6.3.1 | Netzparameter | 49 |
| 6.3.2 | Dreiecksnetz | 50 |
| 6.3.3 | Wabennetz | 50 |
| 6.4 | Findung der Schnittpunkte | 50 |
| 6.4.1 | Aufstellen der Segmente-in-Zellen-Liste | 50 |
| 6.4.2 | Aufstellen der Schnittpunkt-Liste | 51 |
| 6.5 | Fehlerfortpflanzung Best Case | 52 |
| 6.5.1 | Datenextraktion | 52 |
| 6.5.2 | Aufstellen der Liste CovPS | 54 |
| 6.5.3 | Aufstellen der Liste CovSS | 55 |
| 6.6 | Fehlerrechnung Average Case | 57 |
| 6.6.1 | Datenextraktion | 58 |
| 6.6.2 | Aufstellen der Liste CovPP | 58 |
| 6.6.3 | Aufstellen der Liste CovPS | 59 |
| 6.6.4 | Aufstellen der Liste CovSS | 60 |
| 6.7 | Fehlerrechnung Worst Case | 60 |
| 6.7.1 | Aufstellen der Liste CovPP | 60 |
| 6.7.2 | Aufstellen der Liste CovPS | 60 |
| 6.7.3 | Aufstellen der Liste CovSS | 60 |
| 6.8 | Beschreibung des Viewers | 60 |
| 6.8.1 | Grafik der verschnittenen Flächen und Fehlerellipsen | 60 |
| 6.8.2 | Anzeige der Besetzungsstrukturen der Matrizen | 61 |
| 7. | Analyse der Laufzeiten und der Speicherbelegung | 61 |
| 7.1 | Konzept zur Ermittlung von Abhängigkeiten | 61 |
| 7.2 | Laufzeitanalyse | 62 |
| 8. | Zusammenfassung | 66 |
| 9. | Schlußbemerkung | 67 |
| 10. | Anlage A | 68 |
| Polygonnetze für die Flächenverschneidung | 68 | |
| 11. | Anlage B | 75 |
| Besetzungsstrukturen von Matrizen bei der Varianzfortpflanzung | 75 | |
| 12. | Anlage C | 86 |
| Approximierte Funktionen der Laufzeiten bei Speicherung im Arbeitsspeicher | 86 | |
| Approximierte Funktionen der Laufzeiten bei Speicherung in Dateien | 87 | |
| Literaturverzeichnis | 90 |
Die Parameter cx und cy legen den Anstieg der Funktionen fest. Mit deren Variation kann Einfluß auf die räumliche Reichweite der Korrelationen zwischen Punkten ausgeübt werden. 4.2.3. Worst Case In diesem Fall sollen zwischen allen Punkten Korrelationen bestehen, z.B. als Ergebnis einer Ausgleichung eines geodätischen Netzes. Daher wird die Kovarianzmatrix voll besetzt sein. Die Kovarianzen sollen vereinfacht über eine entfernungsabhängige Funktion modelliert werden. Die Funktion muß Kovarianzen erzeugen, die nach der Anwendung des VFG eine symmetrische Kovarianzmatrix und positive Varianzen für die Schnittpunkte ergeben. 4.2.4. Kovarianzmodellierung Grundsätzlich ist das VFG nur gültig, wenn auch alle Kovarianzen als Größe für die Korrelationen zwischen den Punkten gegeben ist. Dies setzt voraus, daß die Kovarianzen gespeichert werden können. Die Speicherung der Kovarianzen ist auf Grund ihrer Vielzahl nicht ganz unproblematisch. Für eine Fläche mit n Punkten ist die Anzahl der Kovarianzen im Worst Case ca. (4 ⋅n) ². Das führt bei großen Datenmengen schnell zu Speicherplatzproblemen. [...]
26 4.2.1. Best Case In diesem, dem "besten" Fall wird angenommen, daß keine Korrelationen zwischen den Ausgangspunkten vorliegen. Das bedeutet, daß nur die Hauptdiagonale der Kovarianzmatrix besetzt ist. Dieser einfachste Fall kann noch in 3 Untergruppen aufgeteilt werden. 1. Alle Varianzen der Ausgangspunkte sind gleich genau. In dem Fall läßt sich die Kovarianzmatrix durch ein Produkt aus Skalar und Einheitsmatrix darstellen. Der Skalarfaktor ist die Varianz der Punkte. 2. Die Punkte der beiden zu verschneidenden Flächen haben jeweils unterschiedliche Varianzen. Es treten also nur zwei verschiedene Varianzen auf. Die Kovarianzmatrix kann hier als Produkt zwischen einem Vektor der Länge n und einer Einheitsmatrix dargestellt werden. Wobei der Vektor nur zwei unterschiedliche Werte enthält, die vom Attribut des Punktes abhängen. 3. Alle Punkte haben unterschiedliche Varianzen. Die Kovarianzmatrix ist auf der Hauptdiagonale mit unterschiedlichen Werten besetzt. Praktisch gesehen besteht bei den 3 Fälle nur ein Unterschied hinsichtlich des Speicherplatzbedarfs, weil von der Speicherung der Kovarianzmatrix in einem Feld abgesehen wurde. 4.2.2. Average Case Der durchschnittliche oder mittlere Fall entspricht einem Modell mit zufälligen und systematischen relativen Fehleranteilen. Es bestehen Kovarianzen jeweils zwischen den y- und x-Koordinaten von Punkten, die über Segmente miteinander verbunden sind. Auch hier kann eine Unterteilung in Unterfälle erfolgen, die sich auf die Größe der Werte bezieht. Gleiche Werte werden bei den Kovarianzen kaum vorkommen, aber bei den Varianzen. Die Kovarianzmatrix läßt sich nicht mehr in eine Einheitsmatrix und einen Vektor oder Skalar aufgliedern, jedoch lassen sich mit Hilfe von Vorkenntnissen über die Varianzen Speicherplätze einsparen. Um die Kovarianzen für einen durchschnittlichen Fall zu modellieren, werden Kovarianzfunktionen eingesetzt. Das können entfernungsabhängige Funktionen sein. Hier soll die entfernungsabhängige Gauß´sche Glockenkurve zur Anwendung kommen. Die Funktion für die x-Koordinate aus /Kraus 93 a/: [...]
4.2. Stochastische Modelle Um geometrische Genauigkeiten berechnen und darstellen zu können, werden zunächst Modellierungsmethoden gebraucht. In /Glems/ sind einige davon beschrieben. Hier sollen nur zwei Ansätze dargestellt werden. Bei dem Attributansatz wird die gemoetrische Genauigkeit in einem Attribut zu jedem geometrischen Element mitgeführt. Dies könnte in relationalen Datenmodellen als Spalteneintrag erfolgen. Der Vorteil besteht darin, daß die Integration in GIS speicherplatzsparend ist. Nachteilig ist, daß der Ansatz eine Erweiterbarkeit des Sachdatenmodells voraussetzt. Für jeden Genauigkeitswert muß schon ein Attribut definiert sein, oder es muß explizit nach der Fehlerfortpflanzung definiert werden. Desweiteren sind in diesem Ansatz nur diskrete Werte bzw. Wertebereiche mit beschränkter Schrittweite für die Genauigkeitsangaben erfaßbar. Zudem wird die Speicherung von Kovarianzen auch im Attributmodell hinsichtlich der Kapazität Probleme mit sich bringen Eine weitere Methode, die in dieser Arbeit weiter behandelt werden soll, ist die der stochastischen Beschreibung. Dabei werden alle möglichen Abgrenzungen eines Objektes als Zufallsereignis interpretiert. Das arithmetische Mittel stellt eine mittlere Begrenzungslinie dar. Die Standardabweichung der Position eines beliebigen Punktes auf der Begrenzungslinie senkrecht zu dieser dient als Maß für die Variation der Objektumschreibung. Für die Flächenverschneidung kommt hier das in 3.1. beschriebene funktionale Modell zum Ansatz. Dabei werden die Koordinaten der 4 Ausgangspunkte der Geradensegmente als stochastische Größen X angesehen. Bei der Anwendung des Kovarianzfortpflanzungsgesetzes, früher allgemeines Varianzfortpflanzungsgesetzes, fließen die Varianzen und die Kovarianzen der Ausgangskoordinaten ein. Je nachdem, wie die Koordinaten miteinander korreliert sind, ist der Anteil an Kovarianzen größer, kleiner oder nicht vorhanden. Desweiteren wird zwischen den Fällen mit gleich großen oder unterschiedlichen Varianzen unterschieden und der Fall beschrieben, der bei mehrmaliger Ausführung von Flächenverschneidungen auftritt. /Bill 96b/ Laut Aufgabenstellung sind 3 verschiedene stochastische Modelle in die Arbeit einzubeziehen. Die Auswahl der dargestellten Modelle beruht auf der Vermutung, daß diese oft vorkommen und daß die Varianzfortpflanzung mit unterschiedlichen Algorithmen gelöst werden muß. Es wird kein Anspruch auf die Korrektheit der stochastischen Modelle im Bezug auf die Praxis erhoben. Es geht mehr darum, die Algorithmen aufzuzeigen, die für verschiedene Modelle entsprechend effektiv sind. Die verwendeten Bezeichnungen beziehen sich auf die Schwierigkeit der anzuwendenden Algorithmen im Bezug auf die Anzahl der besetzten Stellen in der VarianzKovarianzmatrix und das Laufzeitverhalten. [...]
In den Warenkorb
38,00 €
Link zur Arbeit:
http://www.diplom.de/ean/9783832472283
Arbeit zitieren:
Korduan, Peter Dezember 1997: Flächenverschneidung in GIS, Hamburg: Diplomica Verlag
Schlagworte:
Geo-Informationssystem, Datenqualität, Metainformation, Verschneidungsalgorithmus, Fehlerfortpflanzung



