HyperPCA : à l’interface entre la théorie des matrices aléatoires et la spectroscopie du plasma induit par laser

Date:

La spectroscopie du plasma induit par laser (« Laser-Induced Breakdown Spectroscopy », ou LIBS, en anglais) est une technique pour la cartographie multiélémentaire rapide et directe d’échantillons sous pression ambiante, sans aucune limitation quant à l’élément ciblé. Les données représentent des images hyperspectrales de la surface d’un échantillon : chaque pixel est un spectre d’émission élémentaire, où le nombre de canaux peut être très important (1k à 100k canaux). Cependant, les données de cartographie LIBS présentent deux particularités : un rapport signal/bruit intrinsèquement faible en raison des mesures uniques, et une dimensionnalité élevée en raison du grand nombre de spectres acquis pour l’imagerie. Ceci est d’autant plus vrai que la résolution latérale augmente : dans ce cas, le diamètre du spot d’ablation est réduit, de même que la masse ablatée et le signal d’émission, tandis que le nombre de spectres pour une surface donnée augmente. Par conséquent, l’extraction efficace d’informations physico-chimiques à partir d’un ensemble de données bruitées et volumineuses est un problème majeur. Des approches multivariées ont été introduites par plusieurs auteurs comme moyen de traiter de telles données, en particulier l’analyse en composantes principales (« Principal Components Analysis », ou PCA, en anglais) [1-2]. Cette technique est utile pour analyser les corrélations entre différents éléments, mais elle est limitée aux faibles rapports signal/bruit.

Ces dernières années ont vu le développement d’outils mathématiques visant à extraire des informations plus pertinentes des données, en utilisant des méthodes issues de la théorie des matrices aléatoires et du traitement avancé des signaux. Nous présentons HyperPCA [3], un outil d’analyse pour les images hyperspectrales basé sur une représentation parcimonieuse des données à l’aide des transformées en ondelettes discrètes et de la sparse kernel PCA, afin de réduire l’impact du bruit sur les données et d’extraire de manière cohérente le signal spectroscopique, en mettant particulièrement l’accent sur les données de la LIBS. Nous montrons des comparaisons dans des différents cas d’usage avec la PCA traditionnelle et les analyses de données univariées traditionnelles : la méthode présente des avantages à la fois en termes de quantité et de qualité des informations récupérées, améliorant ainsi la caractérisation physico-chimique des surfaces analysées.

  1. Pořízka, Klus, Képeš, et al., Spectrochim. Acta B, vol. 148, 65–82, 2018, DOI : 10.1016/j.sab.2018.05.030
  2. Moncayo, Duponchel, Mousavipak, et al., J. Anal. At. Spectrom., vol. 33, no. 2, 210–220, 2018, DOI : 10.1039/c7ja00398f
  3. Finotello, Tamaazousti, Sirven., Spectrochim. Acta B, 192 (2022), 106418, DOI : 10.1016/j.sab.2022.106418