Estimation spectrale (2)

Estimation spectrale de bruit

Dans la première partie sur l'estimation spectrale, nous avons appris différentes techniques pour estimer la transformée de Fourier d'un signal donné. Cette discussion était loin d'être triviale, essentiellement car la seule façon de traiter numériquement un signal était de traiter un nombre fini d'échantillons:

on ne pouvait obtenir un échantillon que tous les T_s secondes, car l'électronique prend un temps fini pour acquérir et transmettre des données
on ne pouvait mesurer le signal que sur une période finie T car nous devons commencer à un certain moment, et il faut bien s'arrêter à un moment donné afin de commencer à traiter les données.

Ces limitations des données concernant un signal en principe continu, de bande passante illimitée et de durée infinie, a deux effets:

Le repliement (suite de la fréquence finie d'échantillonnage)
La fuite spectrale (suite à la fenêtre finie du signal considéré).

Dans cette contribution, nous allons finalement faire ce que nous voulions faire dès le départ: estimer la densité spectrale d'un bruit, c'est à dire, estimer la densité spectrale d'un ensemble de signaux. Mais il fallait d'abord se rendre compte des difficultés qui sont déjà présents quand nous voulons estimer la transformée de Fourier d'un seul signal déterministe à cause des effets de repliement et de fuite spectrale. Ces difficultés ne partiront pas si nous avons à faire des estimations sur tout un ensemble.

Bien sûr, comme en réalité nous n'aurons souvent qu'une seule réalisation d'un signal tiré d'un ensemble, il nous faudra accepter certaines hypothèses, sans lesquelles il sera parfaitement impossible de déduire notre densité recherchée. Ces hypothèses sont:

La stationarité
L'ergodicité

Sans ces hypothèses, il est tout à fait impossible d'avoir des informations sur un ensemble à partir d'une seule réalisation. La stationnarité implique que les propriétés statistiques (dont la densité spectrale!) ne changent pas avec le temps. Une densité spectrale n'a même pas beaucoup de sens sans stationnarité.

Ergodicité implique que des moyennes sur l'ensemble et les moyennes temporaires sur une seule réalisation convergent. Sans cette hypothèse, nous n'aurions aucun moyen de déduire des propriétés statistiques de l'ensemble à partir de la seule réalisation que nous avons, partiellement, à notre disposition. Heureusement, les bruits fondamentaux physiques satisfont à ces hypothèses. Mais les perturbations électromagnétiques viennent souvent d'ensembles qui sont ni stationnaires, ni ergodiques. Alors leur description statistique, et leur densité spectrale, est problématique.

Sous les hypothèses de stationnarité et ergodicité, nous pouvons garder l'espoir de déduire une estimation de la densité spectrale d'un ensemble, si nous avons suffisamment d' échantillons d'une seule réalisation de cet ensemble. Mais il faut se méfier de certains pièges de naïveté.

Si nous avons enregistré un morceau de signal échantillonné, naivement on pourrait croire qu'une façon d'obtenir la densité spectrale est d'en prendre la DFT. Quand on fait cela, on est souvent surpris de trouver qu'on obtient un "spectre" très, très "bruyant". Il ne faudrait en fait pas être surpris: la DFT d'une seule réalisation d'un bruit donne une estimation d'une seule réalisation de l'ensemble des transformées de Fourier de l'ensemble de bruit, qui est un ensemble souvent aussi bruyant que le bruit original !

La densité spectrale est une moyenne (r.m.s.) des amplitudes de cet ensemble de transformées. L'ensemble des transformées de Fourier est un ensemble statistique lui-même, avec des distributions de variables aléatoires. Nous pouvons constater qu'un ensemble de transformées de Fourier de signaux qui sont eux-mêmes stationnaires et ergodiques, ont les propriétés suivantes:

les phases sont distribués uniformément entre 0 et 2 π
les amplitudes au carré sont distribués avec une moyenne donnée par la densité spectrale de puissance

Ces propriétés sont celles des transformées exactes des signaux continues et de durée infinie de l'ensemble d'origine. Nous verrons que nos estimations de ces quantités, à partir de nos jeux d'échantillons finies, ne satisfont pas toujours ces exigences.

Le périodogramme

L'idée du périodogramme est déjà contenu dans ce que nous venons d'énoncer: nous voulons calculer la moyenne des amplitudes au carré de l'ensemble des transformées de Fourier des signaux. Nous allons devoir faire plusieurs approximations pour mettre cela en pratique:

Il faudra nous limiter aux DFT pour un bout de signal représentant de l'ensemble
Nous n'aurons qu'un seul représentant et donc utiliser l'ergodicité pour estimer des moyennes ; il faudra aussi se limiter à une moyenne finie.

En d'autres termes, étant donné que nous ne possédons qu'un seul représentant du signal il faudra:

prendre M bouts finis de ce représentant
échantillonner ces M bouts, en obtenant 2 N échantillons par bout
calculer la DFT de chacune des séries de 2 N échantillons
prendre la moyenne sur les M réalisations des amplitudes au carré pour chacune des N fréquences des DFT.

La moyenne calculée dans le dernier point est notre estimation de la valeur de la densité spectrale pour les N fréquences correspondantes aux fréquences des DFT. La méthode ci-dessus est appelée la méthode du périodogramme de Bartlett et c'est la méthode standard non-paramétrique d'estimation de densité spectrale.

Comme à différentes étapes, des approximations sont faites, il y a potentiellement une introduction de plusieurs erreurs systématiques dans l'estimation obtenue ainsi et nous allons les étudier en ce qui suit. Un indicateur très sensible de ces erreurs est la relation de phase entre différentes fréquences. Comme nous avons déjà indiqué, du bruit stationnaire a, pour chaque composante de fréquences dans la transformée de Fourier, une phase qui est distribuée uniformément. Mais ces phases des différentes composantes fréquentielles sont aussi non-corrélées. La raison est que toute corrélation de phase entre différentes fréquences indique des moments dans le temps préférés, ce qui est impossible selon l’hypothèse de stationnarité. Comme un filtre linéaire et invariant dans le temps ne font que introduire des translations de phase par fréquence, les distributions continuent d'être uniforme et non-corrélés. Du bruit stationnaire filtré continue donc d'avoir des phases uniformes et non-corrélés en théorie. Nous allons voir que l'ensemble des estimations par DFT d'un tel signal filtré ne satisfait pas cette propriété fondamentale, ce qui illustre les effets des approximations dans la méthode du périodogramme.

Des échantillons générés par un générateur pseudo aléatoire simule du bruit blanc échantillonné.

Nous considérons d'abord le cas le plus simple du bruit blanc. N'importe comment on échantillonne du bruit blanc, nous allons obtenir une séquence de nombres aléatoires statistiquement indépendants, distribués selon une distribution d'amplitude caractéristique du bruit en question. Nous allons simuler du bruit qui a une distribution d'amplitude uniforme entre -0.5 et 0.5. La DFT d'une telle série devrait être aussi aléatoire que la série d'origine, car la DFT peut être vue comme une transformation unitaire.

Nous avons généré 10 000 séquences (M) de 512 (2 N) nombres aléatoires. Nous prenons la DFT de chaque séquence, ce qui nous donne essentiellement 256 points de fréquence avec une amplitude et une phase pour chacun des points. Les 10 000 séquences sont une prise de échantillon dans l'ensemble des DFT dont nous voulons calculer les moyennes et étudier en plus de détail des effets attendus et moins attendus.

La distribution des phases de la troisième et la 80-ième composante de fréquences sont, comme attendu, uniforme. Si ce n'est pas le cas, il y a un problème avec l'indépendance statistique du générateur aléatoire. Notez aussi que les phases des différentes composantes sont parfaitement non-corrélés, comme il se doit.

Nous avions du bruit avec une distribution des amplitudes uniformes ; il en suit que l'écart-type de cette distribution est égal à 1/sqrt(12). Comme une DFT prendra 512 de ces échantillons, nous nous attendons à une amplitude carré moyenne de 512/12 = (6.52)². Nous nous attendons donc à une distribution des amplitudes autour de 6.52. La distribution de l'amplitude de la 3ième et 80-ième composante est montrée.

Nous attendons aussi que les déviations des amplitudes de leur moyenne sont indépendantes entre composantes fréquentielles. C'est effectivement le cas.

Finalement, la moyenne des distributions des amplitudes, des phases, de la partie réelle et la partie imaginaire des composantes fréquentielles est montrée en fonction de la fréquence. Pour du bruit blanc, nous nous attendons à une valeur constante pour chacune de ces moyennes. C'est bien le cas.

Pour simuler du bruit avec une densité spectrale non-triviale mais toujours stationnaire, nous passons notre bruit blanc par un filtre numérique linéaire. Nous avons choisi un filtre elliptique passe-bande d'ordre 4. Bien sûr il faut d'abord envoyer du bruit dans le filtre pour éviter la phase de démarrage du filtre, ce qui ruinerait la stationnarité.

Comme indiqué plus haut, les phases doivent toujours rester uniformément distribués et non-corrélés entre composantes fréquentielles. L'observation nous montre que ce n'est pas le cas.

Il sera utile de remarquer que la composante fréquentielle pour laquelle la distribution uniforme n'est pas vérifiée est celle qui est dans la bande d'arrêt du filtre. Pour la composante dans la bande passante (numéro 80), tout est normal. Nous pouvons le vérifier en regardant les moyennes des distributions d'amplitude, de phase, de partie réelle et partie imaginaire:

Il est intéressant de regarder la déviation de la partie réelle dans la bande d'arrêt près de la fréquence 0:

La partie réelle est trop élevée, là où la partie imaginaire ne semble pas souffrir d'une anomalie. Cette erreur purement sur la partie réelle ruine bien sûr la distribution des phases (qui se concentreront autour de 0 et de π).

Ce que nous observons est due à de la fuite spectrale. Par définition, du bruit n'est pas périodique et possède donc un spectre continu. Nous avons vu que prendre une DFT d'un signal non-périodique donne lieu à de la fuite spectrale. Mais comment est-ce que cette fuite peut avoir une influence différente sur les parties réelles et imaginaires ? Le fait de distinguer les deux indiquerait que le phénomène n'est pas invariant dans le temps. La fuite spectrale n'est pas invariante dans le temps, car elle est induite par la position absolue dans le temps de la fenêtre, et les phases de la DFT sont aussi référencés par cette fenêtre.

Nous pouvons prouver cela en rendent notre bruit artificiellement périodique. Ainsi, nous détruisons bien sûr l'invariance temporelle de notre bruit. C'est d'ailleurs une technique qui ne peut pas être utilisée dans une vraie mesure, car nous avons accès à la séquence "bruit blanc pré-filtre" seulement dans le cas d'une simulation. Mais si nous répétons plusieurs fois la même séquence de bruit blanc avant d'appliquer le filtre, le signal d'entrée devient réellement périodique et donc la sortie aussi, sauf qu'en faisant cela, le signal de sortie aura bien la bande d'arrêt comme le filtre l'impose (le filtre impose la bande d'arrêt toujours, même si le signal d'entrée est périodique).

Sur ce bruit périodique, les choses deviennent normales:

Les moyennes des distributions sont comme attendues:

Notre bruit artificiellement périodique à résolu toutes les problèmes, ce qui démontre bien que la difficulté venait d'un effet de fuite spectrale. Mais nous ne pourrons pas utiliser cette technique sur un vrai bruit dont nous voulons connaître la densité spectrale, car nous n'avons bien sûr pas la main sur "le générateur avant filtrage" avec un vrai signal.

Comme nous savons maintenant que cette déviation de vrai spectre est un problème de fuite spectrale "lointaine", une bonne fonction fenêtre peut apporter une solution, ou en tout cas, améliorer la situation. Nous allons refaire l'exercice avec une fenêtre Blackman et reprendre de "vrai bruit non-périodique".

La distribution des phases devient:

Their correlations are now:

Il faut remarquer que les corrélations à grande distance des phases ont disparu, mais il y a des corrélations importantes à courte distance comme nous le voyons dans la figure ci-dessus. Ceci est l'effet de la fenêtre, qui gagne en fuite longue-distance, mais pénalise la résolution fréquentielle qui n'est rien d'autre que de dire qu'il y ait une forte corrélation entre composantes fréquentielles adjacentes.

Nous constatons cela aussi dans le comportement des amplitudes:

Comme nous voyons, la corrélation des excursions d'amplitudes des voisins est très forte. Mais il n'y a pas de corrélations à plus grande distance.

Pour les moyennes, finalement, tout semble en ordre:

... sauf pour un pic étrange autour de la composante 195.

Une fenêtre Blackman a quasiment le même effet (à longue distance) que de rendre le bruit artificiellement périodique, et appliquer une fenêtre, par contre, est tout à fait possible pour de vraies mesures.

Nous observons qu'appliquer une fenêtre nous a permis d'avoir un bien meilleur estimateur de la densité spectrale qu'en appliquant naïvement le périodogramme de Bartlett sans modification.

Conclusion

La méthode standard du périodogramme est une technique utile pour obtenir une estimation de la densité spectrale d'un signal-bruit. Cependant, il faut faire attention car il peuvent y avoir des erreurs qui peuvent donner de faux résultats dans certains cas. Une certaine expertise peut être nécessaire pour s'assurer que l'estimateur est adéquat et ne souffre pas excessivement d'un problème comme la fuite spectrale.

En dehors du périodogramme classique que nous avons étudié, il existent plusieurs autres techniques d'estimation de la densité spectrale. Ces techniques peuvent, ou ne peuvent pas, être pertinent pour un cas particulier. La plupart du temps, les autres techniques n'ont un sens que si nous avons des informations supplémentaires sur l'ensemble des signaux à étudier. Sans connaissance particulière du signal, et sans application spécifique, le périodogramme dans une ou autre variante reste une option souvent préférable pour estimer une densité spectrale.