Vergleich softwarebasierter Multiformat-Encoder
Analyse der Computerprogramme Cleaner, ProCoder und Squeeze
- Art: Diplomarbeit
- Autor: Frank Schönfelder
- Abgabedatum: Juni 2006
- Umfang: 152 Seiten
- Dateigröße: 3,5 MB
- Note: 1,0
- Institution / Hochschule: Hochschule Mittweida (FH) Deutschland
- ISBN (eBook): 978-3-8324-9701-9
-
ISBN (Paperback) :
978-3-8324-9701-9 P - ISBN (CD) :978-3-8324-9701-9 CD
- Sprache: Deutsch
- Prämierung:
- Arbeit zitieren: Schönfelder, Frank Juni 2006: Vergleich softwarebasierter Multiformat-Encoder, Hamburg: Diplomica Verlag
- Schlagworte: Cleaner, Procoder, Squeeze, Analyse, SSIM
In den Warenkorb
98,00 €
Diplomarbeit von Frank Schönfelder
Einleitung:
Ein Viertel unseres Gehirns dient der Verarbeitung visueller Sinneseindrücke, welche rund 80 Prozent jener Informationen ausmachen, die wir aus der Umwelt aufnehmen. Zur Kommunikation dieser Eindrücke konnten wir bis zum neunzehnten Jahrhundert ausschließlich auf visuell und sprachlich formulierte Zeichen zurückgreifen. Der Informationsgehalt wird durch sie auf das Wesentliche reduziert und über einen schmalen Kommunikationskanal übertragen, sei es in Form von Sprache oder einzelner Bilder. Dieser Vorgang kann jedoch bewusst oder unbewusst mit Fehlern behaftet sein, womit sich der Wunsch verbindet, visuelle Eindrücke direkt zu vermitteln.
Zunächst konnte die Fotografie diesem Anspruch gerecht werden, später Film und Fernsehen. Die Bereitstellung von analoger und nun auch digitaler Videotechnik ermöglicht es, visuelle und akustische Informationen einfach und preiswert zu speichern, zu verarbeiten und weiterzureichen. Der Kreislauf aus verfügbarer Technik, den daraus resultierenden Anwendungsfeldern und den durch sie wiederum steigenden Ansprüchen an leistungsstärkere Technik nimmt hier kein Ende: Computer werden schneller, es können höher aufgelöste Bilder verarbeitet werden, zur Effizienzsteigerung ist noch schnellere Hardware nötig.
Auch bei der Verteilung wachsen die Ansprüche, was an immer schnelleren Internetanbindungen sichtbar ist, an einem Ansteigen der Senderzahl im Fernsehen oder einer Kapazitätssteigerung von CD zu DVD sowie zu der nächsten Generation optischer Datenträger in Form von HD-DVD und Bluray Disc. Diese rasante Entwicklung wurde erst durch die Digitaltechnik ermöglicht. Bei ihr werden Informationen ähnlich wie bei der Sprache in Form von Symbolen ausgedrückt, jedoch in stark vereinfachter Form durch ein Alphabet, welches z. B. ausschließlich aus den Zeichen 0 und 1, den so genannten Bits, besteht. Ein Bit kann leicht durch Computer verarbeitet werden und besitzt eine geringe Fehleranfälligkeit.
Bildinformationen gehören zu den aufwendigsten Gebieten der Digitaltechnik. Ein beispielsweise 720 mal 576 Pixel messendes Video, welches aus 25 Einzelbildern pro Sekunde besteht, führt bei einer Stunde Laufzeit und 24 Bit/Pixel zu einer Datenmenge von 895.795.200.000 Bits bzw. 104 GiB, den Ton noch nicht mitgerechnet. Zu dessen Speicherung wären 24 handelsübliche DVDs (4,7 GB Speicherkapazität, Stand 2006) nötig, die Übertragung über eine moderne Internetanbindung mit 6 Mbit/s würde über 40 Stunden in Anspruch nehmen. Bei diesen Zahlen wird deutlich, dass die Datenmenge reduziert werden muss.
Hier kommt die Videokompression ins Spiel, die u. a. dafür sorgt, dass auf Video-DVDs ganze Spielfilme Platz finden, ohne dass ein nennenswerter Qualitätsverlust zu verzeichnen ist. Dies gelingt, indem man für das menschliche Wahrnehmungssystem irrelevante Informationen unterdrückt, Gemeinsamkeiten innerhalb eines Bildes und zwischen benachbarten Bildern zusammenfasst und Regelmäßigkeiten des sich ergebenden Datenstroms zu dessen Komprimierung ausnutzt. Hierfür haben sich verschiedene Techniken entwickelt, die in Codecs zur Anwendung kommen, einer Wortkreuzung aus COder und DECoder. Ein (En-) Coder wandelt ein Signal in ein für einen bestimmten Kanal geeignetes Format um, wobei unter Kanal u. a. der Fernsehkanal, das Internet oder ein Datenträger verstanden werden kann. Ein Decoder desselben Codecs wandelt dieses Format in das Ausgangssignal zurück, welches bei Verwendung verlustbehafteter Kompressionstechniken Abweichungen aufweisen kann. Je besser der Codec, desto geringer der Unterschied.
Wichtige Gründe für den Erfolg eines Codecs liegen nicht nur in seiner Fähigkeit, Bildqualität zu erhalten, sondern auch in seinem Preismodell, der Verbreitung seiner Decoder oder seiner Tauglichkeit für bestimmte Inhalte und Einsatzgebiete. Da diese Gebiete bisweilen sehr unterschiedlich ausfallen, wird es immer eine Reihe unterschiedlicher Codecs geben, die alle ihre speziellen Vor- und Nachteile besitzen. Moderne Computer verfügen meist von Haus aus über Software zur Dekodierung der gebräuchlichsten Codecs, aktuelle Schnittprogramme stellen ebenfalls verschiedene Codecs bereit. Um zwischen den Formaten zu übersetzen (zu „transkodieren“), sind spezielle Programme nötig. Multiformat-Encoder bieten dabei den Vorteil, auf ein oder mehrere Videos gleichzeitig verschiedene Codecs anwenden zu können.
Gang der Untersuchung:
In dieser Arbeit werden drei populäre Multiformat-Encoder auf Softwarebasis untersucht, die alle über eine vergleichbare Funktionsvielfalt, Preisfestlegung und Zielgruppe verfügen: Autodesk Cleaner XL, Canopus ProCoder sowie Sorenson Squeeze, jeweils in der zum Zeitpunkt der Arbeit aktuellen Version. Alle sind unter Windows XP für ca. 500 Euro erhältlich und erstellen als kleinsten gemeinsamen Nenner die Formate MPEG-1, MPEG-2 (4:2:0), RealMedia, QuickTime, Windows Media, AVI und DV (in den Varianten DV, DVCPro, DV50).
Sie bieten diverse Filter an und ermöglichen eine Batchverarbeitung: das Abarbeiten einer Liste von Aufgaben, währenddessen sich weiterhin mit dem Programm arbeiten lässt. Direkte Vergleiche der drei Programme in allen Disziplinen gibt es noch nicht. Häufiger lassen sich Vergleiche einzelner Codecs finden, die jedoch eines außer Acht lassen: in der Produktionswelt wird oft nicht nach den Formaten mit der besten Qualität verlangt (z.B. H.264, VC-1 oder Nero Digital AVC), sondern nach den gebräuchlichsten.
Die Arbeit versucht die Frage zu beantworten, wo die Stärken und Schwächen der drei oben erwähnten Programme liegen. Jedes Programm muss die fünf Formate MPEG-1, MPEG-2, QuickTime (mit Sorenson-Video-3-Pro-Codec), RealVideo 10 und Windows Media Video 9 erstellen, bei diesen Formaten verschiedene Bitraten-Bildauflösungs-Kombinationen beherrschen und verschiedene Geschwindigkeits-/Qualitäts-Stufen ermöglichen, sofern dies ein Codec vorsieht - Geschwindigkeit und Qualität der Enkodierung hängen oft umgekehrt proportional voneinander ab.
Es ergibt sich demnach je Programm eine dreidimensionale Matrix, die mit denen der anderen beiden Programme verglichen werden kann. Der Vergleich richtet sich nach drei Kriterien: Bildqualität, Kodiergeschwindigkeit und Einhaltung der zu erwartenden Dateigröße.
Zur Absicherung der Ergebnisse ist auch die Beantwortung folgender Fragen notwendig: Erzeugt ein Programm bei der Anwendung eines Codecs bei gleichen Einstellungen immer das gleiche Ergebnis? Hat ein Programm bzw. ein Codec Probleme mit bestimmten Bildinhalten? Diese Problemfelder werden stichprobenartig untersucht.
Neben dieser Kernuntersuchung müssen noch weitere Fragen beantwortet werden: Wie einfach lässt sich ein Programm bedienen? Sind alle Codec-Parameter einstellbar? Stürzt ein Programm hin und wieder ab? Welche Filter und Funktionen stehen zur Verfügung (Deinterlacing, PAL-NTSC-Wandlung und umgekehrt)? Taugt deren Qualität? Welche zusätzlichen Formate lassen sich erstellen? Welche Dateiarten können gelesen werden? Gibt es Unterschiede in der Audioqualität? Anhand von Tabellen wird eine Gegenüberstellung der Ergebnisse und somit eine Möglichkeit zur Entscheidungsfindung für eines der drei Programme geboten, ohne dass ein absoluter Gewinner in allen Disziplinen zu erwarten ist.
Die Arbeit gliedert sich in vier Teile: Zunächst wird auf die Grundlagen des menschlichen Wahrnehmungssystems und der Videokompression eingegangen, die fünf Codecs näher beschrieben sowie die softwarebasierten Multiformat-Encoder vorgestellt.
Im nächsten Kapitel werden Analyseverfahren, Referenzsequenz und Testumgebung beschrieben.
Das dritte Kapitel dient der Auswertung und ein letztes der Beantwortung der weiteren Fragen (Deinterlacing, Normwandlung, Handhabung etc.).
Ein Fazit fasst schließlich alle Ergebnisse zusammen und liefert in einer Tabelle ein Gesamtbild der Programme.
Inhaltsverzeichnis:
| Inhaltsverzeichnis | ||
| Abbildungsverzeichnis | ||
| Diagrammverzeichnis | ||
| Gleichungsverzeichnis | ||
| Tabellenverzeichnis | ||
| Glossar | 11 | |
| 1. | Einleitung | 16 |
| 1.1 | Datenkompression | 16 |
| 1.2 | Aufgabenstellung und Zielsetzung | 18 |
| 2. | Grundlagen | 20 |
| 2.1 | Menschliches Wahrnehmungssystem | 20 |
| 2.2 | Kompressionsverfahren | 23 |
| 2.2.1 | Redundanz und Irrelevanz | 23 |
| 2.2.2 | Bildaufbereitung | 24 |
| 2.2.3 | Intraframekodierung | 26 |
| 2.2.4 | Interframekodierung | 28 |
| 2.2.5 | Entropiekodierung | 30 |
| 2.2.6 | Audiokompression | 31 |
| 2.3 | Codecs, Dateiformate und Multimediaarchitekturen | 32 |
| 2.3.1 | Codecs | 32 |
| 2.3.2 | Bitratenverteilung | 32 |
| 2.3.3 | Dateiformate und Multimediaarchitekturen | 35 |
| 2.3.4 | Auswahlkriterien | 35 |
| 2.3.5 | MPEG-1 | 38 |
| 2.3.6 | MPEG-2 | 38 |
| 2.3.7 | QuickTime/Sorenson Video | 39 |
| 2.3.8 | Windows Media Video | 40 |
| 2.3.9 | RealVideo | 41 |
| 2.4 | Softwarebasierte Multiformat-Encoder | 42 |
| 2.4.1 | Autodesk Cleaner | 43 |
| 2.4.2 | Canopus ProCoder | 44 |
| 2.4.3 | Sorenson Squeeze | 45 |
| 3. | Analysekonzeption | 46 |
| 3.1 | Untersuchungsobjekte | 46 |
| 3.2 | Bewertungskriterien | 46 |
| 3.3 | Versuchsrahmen | 47 |
| 3.3.1 | Referenzsequenz | 49 |
| 3.3.2 | Codecparameter | 52 |
| 3.3.3 | Subjektive Bildbeurteilungsverfahren | 53 |
| 3.3.4 | Objektive Bildbeurteilungsverfahren | 54 |
| 3.3.5 | Dekoder | 57 |
| 4. | Analyse | 58 |
| 4.1 | Vorbemerkung | 58 |
| 4.2 | Erläuterungen zur Ergebnisdarstellung | 60 |
| 4.3 | MPEG-1 | 62 |
| 4.3.1 | Konfiguration | 62 |
| 4.3.2 | Ergebnisse bei 1500 kbit/s | 63 |
| 4.3.3 | Ergebnisse bei 5000 kbit/s | 65 |
| 4.3.4 | Fazit MPEG-1 | 65 |
| 4.4 | MPEG-2 | 67 |
| 4.4.1 | Konfiguration | 67 |
| 4.4.2 | Ergebnisse bei 1500 kbit/s | 68 |
| 4.4.3 | Ergebnisse bei 5000 kbit/s | 68 |
| 4.4.4 | Fazit MPEG-2 | 71 |
| 4.5 | QuickTime Sorenson Video 3 Pro | 71 |
| 4.5.1 | Konfiguration | 71 |
| 4.5.2 | Ergebnisse bei 30 kbit/s | 74 |
| 4.5.3 | Ergebnisse bei 300 kbit/s | 74 |
| 4.5.4 | Ergebnisse bei 1500 kbit/s | 76 |
| 4.5.5 | Fazit Sorenson Video 3 Pro | 76 |
| 4.6 | RealVideo 10 | 78 |
| 4.6.1 | Konfiguration | 78 |
| 4.6.2 | Ergebnisse bei 30 kbit/s | 79 |
| 4.6.3 | Ergebnisse bei 300 kbit/s | 82 |
| 4.6.4 | Ergebnisse bei 1500 kbit/s | 82 |
| 4.6.5 | Fazit RealVideo 10 | 84 |
| 4.7 | Windows Media Video 9 | 84 |
| 4.7.1 | Konfiguration und allgemeine Ergebnisse | 84 |
| 4.7.2 | Ergebnisse bei 30 kbit/s | 86 |
| 4.7.3 | Ergebnisse bei 300 kbit/s | 86 |
| 4.7.4 | Ergebnisse bei 1500 kbit/s | 89 |
| 4.7.5 | Fazit Windows Media Video 9 | 89 |
| 5. | Weitere Vergleichsfelder | 91 |
| 5.1 | Input-Formate | 91 |
| 5.2 | Deinterlacing | 93 |
| 5.2.1 | Weave | 94 |
| 5.2.2 | Skip Field | 95 |
| 5.2.3 | Skip Field mit Zeilenverdopplung | 97 |
| 5.2.4 | Skip Field mit Interpolation | 97 |
| 5.2.5 | Bobbing | 98 |
| 5.2.6 | Blending | 98 |
| 5.2.7 | Adaptives Deinterlacing | 98 |
| 5.2.8 | Motion Compensation | 101 |
| 5.2.9 | Automatisches Deinterlacing | 101 |
| 5.2.10 | Zusammenfassung Deinterlacing | 102 |
| 5.3 | Skalierung | 104 |
| 5.4 | Normwandlung | 109 |
| 5.5 | Filter | 112 |
| 5.6 | Output-Formate | 114 |
| 5.7 | Audiokodierung | 116 |
| 5.8 | Handhabung | 120 |
| 6. | Zusammenfassung und Ausblick | 123 |
| Anhang | 126 | |
| Erstellung der Referenzsequenz | 126 | |
| Messung von Dateigröße und Kodierungsdauer | 128 | |
| Szenenerkennung | 131 | |
| Ergebnisse | 136 | |
| Literaturverzeichnis | 143 |
ließ sich beim ProCoder kein 1,067-Seitenverhältnis konfigurieren. Zwar gibt es die Einstellung „CCIR601, 625line(0.9157), PAL“, jedoch erscheint das Ausgabebild dann leicht gestaucht und unschärfer. Als einzige Kombination bewährte sich hier die Verwendung eines 1:1-Pixelseitenverhältnisses sowohl in den Quell- als auch in den Zieleinstellungen, was bei der Wiedergabe zu leicht gestauchten Bildern führt, die aber ansonsten mit denen der anderen Programme vergleichbar sind. Squeeze bietet im Gegensatz zu seinen Konkurrenten keine Auswahl von Kodiergeschwindigkeit, GOP-Struktur, minimaler und maximaler Bitrate. Letztere sind bei Verwendung variabler Bitraten notwendig. Als Minimalwert wurden jeweils 192 kbit/s festgelegt, obwohl ProCoder sogar 0 kbit/s ermöglichen würde. Standardmäßig ist bei ProCoder eine für PAL-DVDs eigentlich untypische GOP-Länge von 15 Bildern eingestellt und die GOP-Struktur steht auf „Automatic“, was bei den anderern Programmen nicht möglich ist. Hier kann das Programm die GOP-Struktur dem Bildinhalt anpassen. Diese Voreinstellungen wurden separat untersucht und bewirkten einen leicht höheren MSSIM-Wert (um zirka einen bis anderthalb Prozentpunkte). [...]
Um eine bessere Zuordnung der Daten zwischen Tabellen und Diagrammen zu gewährleisten, wurde ein eindeutiger Farbcode für die einzelnen Werte erstellt, der sich nach den Produktfarben der drei Encoder richtet. Die Werte des Cleaner erscheinen in violetten Tönen, die des ProCoders in blauen und die von Squeeze in braun bis orange. Die jeweilige Staffelung von dunkel nach hell folgt der Reihenfolge CBR 1-pass, CBR 2-pass, VBR 1-pass, VBR 2-pass. Um auch in schwarz-weißen Abbildungen eine Zuordnung zu erlauben, wurde innerhalb der Diagramme zusätzlich ein Formencode angewendet, der den Cleaner-Werten quadratische Punkte zuweist, denen des Procoders dreieckige und denen von Squeeze Karos. [...]
Die Ergebnisse eines einzelnen Encoders lassen sich am besten zeigen, wenn man sie mit denen der Konkurrenzprogramme vergleicht. Sie werden dazu grafisch in Form von Diagrammen gegenübergestellt. Die ausführlichen Ergebnisse finden sich in den Tabellen im Anhang. Die verwendeten Größen sind in Abschnitt 3.3 beschrieben. Bei den Auswertungsdiagrammen gibt es zwei Arten. Eins zeigt analog zu dem Beispiel auf Seite 36 die Abhängigkeit der Bildqualität von der Kodierdauer an (Achtung: Kodierdauer und Geschwindigkeit verhalten sich umgekehrt). Auf der folgenden Seite ist dafür ein Beispiel dargestellt. Entlang einer der eingezeichneten Linien besitzen Videos die gleiche Effizienz, die in dieser Arbeit aus Qualität pro Kodierzeit definiert ist. Hier enthalten die Kodierungen von Video B und Video C die gleiche Effizienz, legen jedoch unterschiedlichen Wert auf Qualität und Geschwindigkeit. Video A wurde effizienter kodiert, da in fast der gleichen Zeit wie Video C die Qualität von Video B erreicht wurde. Diese Bewertungen machen jedoch keinen Sinn, wenn eine Prüfung der Dateigröße unterbleibt. Diese würde im Normalfall ergeben, dass die Dateigröße bei Video A überschritten wurde. Damit wurde der Kodierung eine zu hohe Qualität bzw. eine zu hohe Geschwindigkeit eingeräumt. Der Messpunkt müsste bei korrekter Dateigröße und damit niedrigerer Bitrate weiter unten bzw. rechts liegen. Minuszeichen an den Messpunkten geben somit eine negative Bewertung an und bedeuten, dass der Punkt zu weit oben bzw. links liegt. Pluszeichen merken an, dass noch ungenutztes Potenzial besteht. Ein einzelnes Minuszeichen markiert eine Überschreitung der Dateigröße von ein bis fünf Prozent, ein doppeltes Minuszeichen noch größere Überschreitungen - Plus und Doppelplus werden entsprechend bei Unterschreitungen vergeben. Da die Dateigröße [...]
In den Warenkorb
98,00 €



