Thema: Diskrete Cosinustransformation (DCT)

Fachbereich Medieninformatik Hochschule Harz

Diskrete Cosinustransformation (DCT) Referat

Björn Wöldecke 10954

Abgabe: 15.01.2007

Stand: Januar 2007

Autor: Björn Wöldecke

Thema: Diskrete Cosinustransformation (DCT)

Inhaltsverzeichnis Einleitung / Vorwort........................................................................................ 1 1. Methoden zur Datenreduktion................................................................... 1 2. Diskrete Cosinustransformation (DCT).................................................... 2 3. Quantisierung / Irrelevanzreduktion......................................................... 4 4. Redundanzreduktion.................................................................................. 4 5. Literaturverzeichnis................................................................................... 5

Stand: Januar 2007

Autor: Björn Wöldecke

Thema: Diskrete Cosinustransformation (DCT)

Einleitung / Vorwort In der heutigen Zeit, da die Digitalisierung der Medien immer weiter fortschreitet, werden auch die Kompressionsmethoden für multimediale Inhalte immer ausgefeilter. Eine wichtige Grundvoraussetzung für viele Datenreduktionsverfahren ist hierbei die diskrete Cosinustransformation, die unter anderem bei JPEG und MPEG zum Einsatz kommt.

1. Methoden zur Datenkompression Nach [SCHMIDT] gibt es zwei grundlegende Ansätze zur Datenkompression: die Redundanz- und die Irrelevanzreduktion. Mittels der Redundanzreduktion wird versucht, überflüssige (=redundante) Daten möglichst vollständig zu eliminieren. Die Daten werden dabei lediglich in eine kompaktere Form umgewandelt und es ist jederzeit möglich die ursprüngliche Form wiederherzustellen. Man spricht in diesem Zusammenhang auch von verlustloser Kompression. Die Irrelevanzreduktion ist dagegen radikaler. Unwichtige (=irrelevante) Daten werden hier einfach weggelassen. Man spricht dann von verlustbehafteter Kompression. Die DCT allein ist noch kein Kompressionsverfahren. Sie wird lediglich eingesetzt, um Bilddaten in eine günstigere Form für die nachfolgende Datenreduktion umzuwandeln. Dazu wird das Bild zuerst in Blöcke von jeweils 8x8 Pixeln zerlegt. Jeder dieser Blöcke durchläuft anschließend die diskrete Cosinustransformation. Vereinfacht ausgedrückt, werden dabei Regelmäßigkeiten im Bild gefunden und in Form von Zahlenwerten (DCT-Koeffizienten) wiedergegeben. Diese werden dann durch Quantisierung gemäß psychophysischer Parameter in ihrer Genauigkeit beschränkt (Irrelevanzreduktion) wodurch sie optimal für eine abschließende Redundanzreduktion vorbereitet sind.

Zerlegung in 8x8-Blöcke

DCT

Quantisierung

Redundanzreduktion

Abb. 1: Schema der JPEG-Kompression

Abb. 1 zeigt eine schematische Darstellung des Kompressionsvorgangs, wie er auch bei JPEG zum Einsatz kommt.

 Detaillierte Informationen zur JPEG-Kompression können bei [SCHMIDT] S. 138-142 und [REIMERS] S. 60-71 nachgelesen werden.

Stand: Januar 2007

Autor: Björn Wöldecke

Seite: 1

Thema: Diskrete Cosinustransformation (DCT)

2. Diskrete Cosinustransformation (DCT) Ein digitalisiertes Graustufen-Bild besteht aus einer Abfolge von Helligkeitswerten. Im Prinzip ist das nichts anderes als eine mathematische Funktion von diskreten Werten (diskrete Funktion), die in einer Wertetabelle niedergeschrieben wurden. Eine Funktion lässt sich jedoch mittels Fourier-Analyse in eine Form überführen, die aus mehreren Sinus- und Cosinusfunktionen besteht (vgl. [PAPULA] S. 158 ff).



Das bedeutet, dass sich die Bildinformation aus mehreren überlagerten Frequenzen zusammensetzen lässt. Da aber diskrete Werte vorliegen, muss die diskrete Fouriertransformation verwendet werden. Aufgrund der Möglichkeit, den unbenutzten negativen Wertebereich für t mit einer gespiegelten Version der Werte zu belegen, lässt sich eine gerade Funktion erzeugen. Dadurch werden alle Sinusanteile (ungerade Funktion) zu Null und fallen somit weg. Das heißt, man kann sich auf eine diskrete Cosinustransformation beschränken.

Helligkeitswerte 110 112 111 109 106 105 107 107 98

97

97

95

92

90

94

91

DCT 404

42

-1,2 -3,2

0,4 -0,8 1,2

-6,4

-0,4 -0,8 -0,4 -1,2 1,76 4,4 -0,8 -3,2 DCT-Koeffizienten Abb. 2: Transformation eines Bildblocks (die Zahlenwerte stammen aus [SCHMIDT] S. 140 Abb. 3.50)

 Eine genauere mathematische Abhandlung hierzu lässt sich bei [SCHMIDT] S. 138-140 nachlesen.

Stand: Januar 2007

Autor: Björn Wöldecke

Seite: 2

Thema: Diskrete Cosinustransformation (DCT)

Mit Gleichung (1.2) lassen sich die DCT-Koeffizienten für jeden Pixel eines Bild-Blocks bestimmen. Meistens wird N = 8 gewählt, so dass jeweils Blöcke von 8x8 Pixeln transformiert werden. Das Ergebnis ist dann wieder ein gleich großer Block bestehend aus den DCT-Koeffizienten (Abb. 2). Man kann sich das Ergebnis von Gleichung (1.2) auch als Überlagerung von DCT-Basisfunktionen vorstellen (Abb. 3). Jeder der Blöcke steht für eine horizontale und vertikale Ortsfrequenz. Von besonderem Interesse ist dabei der linke obere Block. Er besteht nur aus einer einheitlichen Fläche, die den durchschnittlichen Grauwert des Bild-Blocks angibt. In der bisherigen Betrachtung wurde der Einfachheit halber nur von einem Graustufen-Bild ausgegangen. Die Chrominanz-Werte (Farbton), die in Farbbildern zusätzlich zu den Luminanz-Werten (Helligkeit) gespeichert werden, lassen sich nach dem gleichen Prinzip transformieren.

Vertikale Ortsfrequenz

Horizontale Ortsfrequenz

Abb. 3: DCT-Basisfunktionen [REIMERS]

Stand: Januar 2007

Autor: Björn Wöldecke

Seite: 3

Thema: Diskrete Cosinustransformation (DCT)

3. Quantisierung / Irrelevanzreduktion Wie bereits in Abschnitt 2 erwähnt wurde, werden die DCT-Koeffizienten noch einer Irrelevanzreduktion unterzogen. Dies geschieht durch Division der DCT-Koeffizienten durch die Quantisierungsschrittweite und anschließender Rundung auf ganzzahlige Werte. Für jeden DCT-Koeffizienten wird eine eigene Quantisierungsschrittweite angegeben. Die Werte liegen als Quantisierungsmatrix (Abb. 4) vor, die dieselbe Größe hat, wie die DCT-Koeffizientenmatrix. Es existieren separate Quantisierungsmatrizen für Helligkeit und Farbe. Die Werte hierfür wurden empirisch in psychologischen Experimenten ermittelt. Dass die Quantisierung zu keinen bzw. nur gering sichtbaren Verlusten führt, liegt daran, dass der menschliche Sehsinn bei höheren Ortsfrequenzen schlechter zwischen Helligkeits- und Farbabstufungen unterscheiden kann. Da die hochfrequenten Anteile oft sehr klein sind, werden diese durch die Quantisierung meist vollständig eliminiert.

110 112 111 109 106 105 107 107

Quantisierung

101

10

0

1

0

0

0

-1

98

97

97

95

0

0

0

0

92

90

94

91

0

1

0

0

DCT-Koeffizienten (quantisiert)

DCT-Koeffizienten 4

4

5

6

4

5

6

7

5

6

7

8

6

7

8

8

Quantisierungsmatrix Abb. 4: Quantisierung und Sequenzierung von DCT-Koeffizienten (die Zahlenwerte stammen aus [SCHMIDT] S. 140 Abb. 3.50)

4. Redundanzreduktion Dadurch, dass die DCT-Koeffizienten durch die Quantisierung in ihrem Wertebereich beschränkt wurden, wird nicht mehr für alle Koeffizienten die gleiche Anzahl an Bits benötigt. Die höherwertigen Bits sind in den Fällen geringerer Bitanzahl also immer Null und können deshalb eingespart werden. Eine weitere Möglichkeit besteht darin, mittels RunLength-Encoding alle restlichen DCT-Koeffizienten, die den Wert Null haben, komplett wegzulassen. Dazu müssen die DCT-Koeffizienten aber in eine spezielle Zickzack-Reihenfolge (Abb. 4) gebracht werden. Dadurch wird sichergestellt, dass die höheren Frequenzen - bei denen die Wahrscheinlichkeit größer ist, dass sie Null werden - erst zum Schluss kommen. (vgl. [REIMERS] S. 65-66)

Stand: Januar 2007

Autor: Björn Wöldecke

Seite: 4

Thema: Diskrete Cosinustransformation (DCT)

5. Literaturverzeichnis [SCHMIDT]

Ulrich Schmidt, Professionelle Videotechnik, 4. aktualisierte und erweiterte Auflage, Springer Verlag, 2005

[REIMERS]

Ulrich Reimers, DVB, Second Edition, Springer Verlag, 2005

[PAPULA]

Lothar Papula, Mathematik für Ingenieure und Naturwissenschaftler, 10. Auflage, Friedr. Vieweg & Sohn Verlagsgesellschaft, 2001

Stand: Januar 2007

Autor: Björn Wöldecke

Seite: 5