Wavelet thresholding and noise reduction

Maarten Jansen

ABSTRACT

A wavelet transform decomposes data into a sparse, multiscale representation. This dissertation uses both features in wavelet based noise reduction algorithms.

Sparsity is the key to wavelet thresholding: coefficients with magnitude below a threshold are replaced by zero. After an introduction to wavelets and their applications, this text discusses the minimum risk threshold. This threshold minimizes the expected mean square error of the output. This error cannot be computed exactly when the uncorrupted data are unknown. We present a procedure based on generalized cross validation (GCV) to estimate the optimal threshold. An asymptotic argument motivates this estimation method. To this end, we first study the asymptotic behavior of the minimum risk threshold. We compare these minimum risk and GCV thresholds with the well known universal threshold.

The multiresolution character of a wavelet decomposition allows for refinements of the general threshold scheme. Tree structured thresholding reduces false structures in the output. Scale dependent thresholds are necessary to deal with correlated noise or non-orthogonal wavelet transforms. The synthesis from a non-decimated wavelet transform has an additional smoothing effect. We also investigate noise reduction in the framework of integer wavelet transform.

The next part concentrates on images. An approximation theoretic argument learns that wavelets might not be the ultimate basis functions for image processing. Moreover, selecting the coefficients with large magnitude is a local approach. A Bayesian procedure could lead to a more structured coefficient selection, which better preserves edges in the output. The geometric prior model favors clusters of important coefficients.

The last part investigates the applicability of threshold algorithms for non-equidistant data and second generation wavelets. Experimental results indicate that instability of the wavelet transform hinders the classification of the coefficients according to their importance. We propose an algorithm to overcome this difficulty.

Waveletdrempels en ruisonderdrukking

Maarten Jansen

SITUERING EN VULGARISERENDE SAMENVATTING

Wavelets vormen een wiskundige basis die bijzonder geschikt is voor bepaalde signaal- en beeldverwerkingsoperaties. Eén van die mogelijke toepassingen is beeldcompressie. Een waveletvoorstelling van een beeld bevat enkele grote getallen die de essentiële informatie dragen en vele kleine getallen voor de details. Een groot deel van die kleine getallen kan achterwege blijven zonder dat dit aanleiding geeft tot waarneembaar kwaliteitsverlies. Waar details (kleine getallen) toch een zichtbaar verschil uitmaken, gaat het dikwijls om ruis. Hetzelfde principe als dat van compressie ligt dus ook aan de basis van ruisonderdrukkingsschema's: laat de kleine getallen in de waveletvoorstelling weg. In dit proefschrift bestuderen we waar we de grens (de drempel) moeten trekken tussen belangrijke informatie en details of ruis. Als we de ruisvrije informatie kenden, zouden we de optimale grens exact kunnen berekenen. In deze tekst gaan we na hoe die optimale drempel zich globaal gedraagt en hoe we die kunnen schatten als we enkel over de gegevens met ruis beschikken. Daarna bespreken we enkele praktijkvoorbeelden. We stellen enkele eenvoudige verfijningen voor om het drempelprincipe ook te laten werken in meer complexe situaties. Vervolgens leiden we een techniek in om de randen in het uitvoerbeeld minder wazig te maken. Een laatste hoofdstuk voor het algemeen besluit bestudeert de moeilijkheden die optreden wanneer de invoer niet bestaat uit een regelmatig signaal of een beeld maar uit waarnemingen op onregelmatige tijdstippen.

KORTE INHOUD

Een wavelettransformatie ontbindt gegevens in een ijle voorstelling die bovendien verschijnselen op verschillende schalen ontleedt. Dit proefschrift gebruikt beide eigenschappen in waveletgebaseerde ruisonderdrukkingsalgoritmen.

Ijlheid ligt aan de basis van methoden met waveletdrempels: coëfficiënten met absolute waarde onder een drempel worden nul. Na een inleiding tot wavelets en hun toepassingen bespreekt deze tekst de drempel met minimale kwadratische fout in de uitvoer. Deze fout kunnen we niet exact berekenen als de ruisvrije gegevens onbekend zijn. We stellen een procedure voor, gebaseerd op veralgemeende kruisvalidatie (GCV - generalized cross validation) om de drempel met minimale fout te schatten. We tonen aan dat deze procedure asymptotisch optimaal is. Hiertoe bestuderen we eerst het asymptotisch gedrag van de drempel met minimale fout. We maken ook de vergelijking tussen deze drempel, de GCV-drempel en de bekende universele drempel.

Het multischaalkarakter van een waveletontbinding leidt tot verdere verfijning van het drempelalgoritme. Boomgestructureerde selectie van coëfficiënten vermindert het aantal storende, oneigenlijke structuren in de uitvoer. Schaalafhankelijke drempels zijn nodig als de ruis gecorreleerd (gekleurd) is of de transformatie niet orthogonaal is. Een niet-gedecimeerde wavelettransformatie veroorzaakt een bijkomende vereffening van de gegevens. We onderzoeken eveneens de mogelijkheden van een gehele-getallentransformatie in ruisonderdrukkingsschema's.

Een volgend deel gaat dieper in op toepassing op beelden. Een benaderingstheoretische redenering geeft aan dat wavelets voor tweedimensionale gegevens niet noodzakelijk de beste voorstelling opleveren. Bovendien is de selectie op basis van de grootte van iedere individuele coëfficiënt een erg lokale aanpak. Een Bayesiaanse procedure moet tot een meer gestructureerde selectie leiden, waarbij randen in de uitvoer beter bewaard blijven. Het ruimtelijk a priori model bevordert clusters van belangrijke coëfficiënten.

Het laatste deel onderzoekt de toepasbaarheid van drempelmethoden voor gegevens op onregelmatige afstand van elkaar. Hiervoor dienen wavelets van de tweede generatie. Experimentele resultaten wijzen op problemen ten gevolge van instabiliteiten in de transformatie: het is moeilijker het belang van een coëfficiënt af te lezen uit zijn grootte. We stellen een algoritme voor om deze moeilijkheden te omzeilen.


This page is maintained by Maarten Jansen ( Last update: 6 March 2000