banner
Hogar / Blog / Extracción de valores de dispersión de velocidad de grupo utilizando tecnología cuántica
Blog

Extracción de valores de dispersión de velocidad de grupo utilizando tecnología cuántica

Aug 10, 2023Aug 10, 2023

Scientific Reports volumen 13, número de artículo: 6596 (2023) Citar este artículo

477 Accesos

2 altmétrico

Detalles de métricas

Las imágenes de tomografía de coherencia óptica de imitación cuántica (Qm-OCT) están repletas de artefactos: picos parásitos que surgen como subproducto del algoritmo utilizado en este método. Sin embargo, la forma y el comportamiento de un artefacto están relacionados únicamente con la dispersión de velocidad de grupo (GVD) de la capa a la que corresponde este artefacto y, en consecuencia, los valores de GVD se pueden inferir analizándolos cuidadosamente. Dado que para los objetos de varias capas la cantidad de artefactos es demasiado alta para permitir un análisis específico de cada capa, empleamos una solución basada en Machine Learning. Entrenamos una red neuronal con datos Qm-OCT como entrada y perfiles de dispersión, es decir, distribución de profundidad de GVD dentro de un A-scan, como salida. Al tener en cuenta el ruido durante el entrenamiento, procesamos datos experimentales y estimamos los valores de GVD de BK7 y zafiro, además de proporcionar una distribución cualitativa del valor de GVD en una uva y un pepino. En comparación con otros métodos de recuperación de GVD, nuestra solución no requiere intervención del usuario, proporciona automáticamente valores de dispersión para todas las capas visualizadas y es escalable. Analizamos los factores que afectan la precisión de la determinación de GVD: el ruido en los datos experimentales, así como las limitaciones físicas generales de la detección de cambios inducidos por GVD, y sugerimos posibles soluciones.

La tomografía de coherencia óptica de imitación cuántica (Qm-OCT) logra una mejora de la resolución y una cancelación de la dispersión de orden uniforme al imitar el entrelazamiento cuántico que se encuentra en la OCT cuántica. Propuesto teóricamente en varias formas,1,2,3 Qm-OCT se realiza experimentalmente introduciendo modificaciones en la configuración de detección de OCT4,5,6,7 o simplemente aplicando un algoritmo informático a los espectros de OCT sin procesar8,9. En principio, un escaneo Qm-OCT A se obtiene mediante la transformación de Hilbert del espectro, su autocorrelación y luego realizando la transformación de Fourier. Una señal que es mucho más útil en términos de contenido de información se llama pila FFT y se obtiene procesando varios fragmentos del espectro.

El núcleo de este método es la autocorrelación cuya implementación, ya sea experimental o algorítmica, da como resultado la creación de artefactos. Los artefactos son picos adicionales que no representan la estructura del objeto fotografiado y provocan que la imagen se confunda con objetos de varias capas. Estos artefactos son específicos de cada capa: su comportamiento y forma en la pila FFT están relacionados con los parámetros ópticos de la capa a la que corresponden. Uno de esos parámetros ópticos es la dispersión de velocidad de grupo (GVD), que representa variaciones del índice de refracción dependientes de la longitud de onda dentro de un objeto. GVD se considera perjudicial ya que conduce a una degradación de la resolución, especialmente en capas más profundas, debido a la naturaleza acumulativa de la dispersión y la incapacidad de compensarla para cada capa individual a la vez. Sin embargo, este efecto perjudicial se puede utilizar en beneficio propio: los valores GVD se pueden extraer para caracterizar el objeto fotografiado. En general, los métodos que permiten la extracción GVD utilizan los siguientes efectos de dispersión en la señal: degradación de la resolución10,11, cambio de ubicación del pico entre escaneos A obtenidos de dos fragmentos diferentes de un espectro12 y diferencias de fase espectral13. En la publicación de Photiou y Pitris14 se puede encontrar una muy buena comparación del rendimiento de estos métodos. La GVD extraída puede correlacionarse con la salinidad de medios similares al agua15 o incluso puede correlacionarse con signos tempranos o progresión de enfermedades11. Desafortunadamente, los métodos actuales utilizados para determinar los valores de GVD son muy propensos a errores11 o funcionan sólo para objetos muy simples10,12. Aunque se demostró que en algunos casos logran errores promedio del 1%14, están lejos de ser automáticos y requieren la intervención del usuario, especialmente cuando se va a recuperar GVD para múltiples capas dentro de un escaneo A.

Se demostró que el aprendizaje automático16, cuando se combina con Qm-OCT, permite estimar cualitativamente la distribución del valor GVD, es decir, un perfil de dispersión, dentro de una exploración A. Aquí proponemos una solución mejorada que tiene en cuenta el ruido en los datos. Nuestro enfoque se prueba en dos sistemas experimentales, uno de laboratorio y uno comercial, y permite una determinación exitosa de los valores de GVD a partir de datos experimentales para zafiro y BK7 y proporciona perfiles de dispersión cualitativos de una uva y un pepino. Se discuten las limitaciones de nuestro enfoque en términos de niveles de ruido, discrepancia de parámetros ópticos y valores de GVD detectables.

Utilizamos datos íntegramente generados por ordenador: señales Qm-OCT ruidosas como entradas y perfiles de dispersión como salidas. Se crea una señal Qm-OCT de entrada (Fig. 1a) con el algoritmo de la Ref.9: primero se sintetiza un espectro de 1024 elementos de longitud (a una longitud de onda central de 840 nm y con un ancho de banda espectral total de 160 nm, un gaussiano perfil y ruido gaussiano, lo que da como resultado una resolución axial igual a 4,08 μm), luego se divide en 50 fragmentos, que luego se autocorrelacionan, se rellenan con ceros para tener 2048 elementos de longitud y se transforman de Fourier. Se toma la mitad de una transformada de Fourier, lo que significa que el tamaño de la señal resultante es de 50 por 1024 elementos. Los perfiles de dispersión de salida (Fig. 1b) son vectores de 1024 elementos de longitud cuyos elementos están en el rango [0,1] correspondiente al rango de valores GVD de (−5000, 5000) fs\(^2\)/mm. Como se presenta en la Fig. 1b, un perfil de dispersión consta de segmentos de valor constante cuya ubicación corresponde a la ubicación de una capa y cuya altura representa el GVD de la capa. Esto no significa necesariamente que la distribución de GVD dentro de una capa particular sea perfectamente constante. Dado que el GVD de una capa en las exploraciones OCT A se manifiesta ampliando el pico correspondiente a la superficie posterior de esa capa, se observa la dispersión acumulada entre las superficies frontal y posterior de la capa. Por este motivo, la altura del segmento corresponde únicamente al GVD detrás del ensanchamiento del pico en la superficie posterior.

(a) La entrada de la red neuronal es una pila FFT que se calcula a partir de un espectro experimental sin procesar. Las pilas de FFT de entrenamiento se calculan a partir de espectros generados por computadora. (b) La salida es un perfil de dispersión, es decir, la distribución del valor GVD dentro del objeto en una exploración A. GVD igual a 0 fs\(^2\)/mm corresponde a 0,5 en el perfil de dispersión, y los valores máximo y mínimo de GVD utilizados para el entrenamiento, 5000 y −5000 fs\(^2\)/mm corresponden a 1 y 0 en el perfil de dispersión. El objeto presentado tiene cuatro interfaces colocadas en las posiciones 200, 280, 320 y 600 correspondientes a la distancia desde cero óptica igual a 218 μm y los espesores de las capas del objeto de 87, 44 y 306 μm. El valor de GVD es 0 fs\(^2\)/mm para el área frente al objeto y 5000, \(-4000\) y \(-2000\) fs\(^2\)/mm para el capas de objetos.

Generamos 260.000 parámetros de objetos para entrenamiento, 20.000 para validación y 20.000 para prueba. Los parámetros del objeto generado se utilizan en el cálculo sobre la marcha de los conjuntos de datos de entrenamiento, validación y prueba: debido a las limitaciones de procesamiento de la computadora, las señales de entrada y de verdad en tierra se calculan nuevamente en cada época.

Los datos experimentales se obtuvieron con un montaje de laboratorio y un sistema comercial. El sistema OCT de laboratorio coincide mejor con los parámetros ópticos simulados en los conjuntos de datos de entrenamiento. Utiliza una fuente de luz (Superlum Broadlighter T840-HP) con una longitud de onda central de 840 nm y un ancho de banda espectral total de 160 nm, y un analizador de espectro óptico (Yokogawa AQ6370D) como espectrómetro que genera espectros de 2048 puntos de largo con la longitud espectral. resolución de 0,1 nm. La resolución axial en el aire es de 4,1 μm y la caída de 6 dB de 1,4 mm. El sistema comercial es OQ LabScope 2.0 /SX que utiliza luz con una longitud de onda central de 830 nm y un ancho de banda espectral total de 100 nm (lo que da como resultado una resolución axial en el aire de 5,5 μm y un rango de imagen de 1,2 mm) y detección basada en un espectrómetro. que produce espectros de 2048 puntos de largo con una velocidad de 40.000 A/escaneos por segundo. La uva y la cebolla utilizadas en este trabajo fueron adquiridas en los supermercados locales.

Planteamos este problema como un problema de aprendizaje automático con una pila FFT como entrada y un perfil de dispersión como salida. Nuestra red neuronal se basa en una arquitectura VGG-16 modificada17 que demostramos que es capaz de interpretar el comportamiento específico de la capa y generar un perfil de dispersión de los objetos resuelto en profundidad16. En la arquitectura modificada, se agrega normalización por lotes después de cada capa convolucional y se utilizan bloques residuales para resumir las salidas de la capa de agrupación y las capas convolucionales. La Figura 2 muestra la arquitectura final del modelo. Una descripción más detallada de los parámetros de la red se encuentra en la Sección 1 del Suplemento 1.

Arquitectura modelo. Las líneas azules son las copias de las salidas de las capas. Las líneas verdes representan la salida de la capa alfa (simbolizada por el punto verde con el carácter \(\alpha \)) con una forma expandida para que coincida con la forma de las capas convolucionales dentro del bloque. BlockN (cuadrado rosa) es un bloque con capas convolucionales, cada una de las cuales consta de N filtros. La trama fue creada con la ayuda del software PlotNeuralNet18.

Nuestra arquitectura de modelo optimizada consta de una capa de normalización por lotes19 después de cada capa convolucional y cada bloque convolucional es seguido por capas de agrupación promedio, una capa completamente conectada con 14336 unidades y una tasa de abandono20 de 0,1 seguida de una normalización de capa21. Entrenamos los modelos con un tamaño de lote 16, tasa de aprendizaje 0.0001, optimizador Adam22, función de pérdida Error absoluto medio y sigmoide como función de activación de salida.

El entrenamiento de nuestros modelos se realizó en una computadora con una tarjeta gráfica NVIDIA GeForce GTX 3060 de 12 GB. Entrenamos nuestros modelos durante al menos 100 épocas. La generación de datos sobre el vuelo tardó aproximadamente 1,5 h en finalizar cada época. El análisis del proceso de capacitación y el desempeño se presenta en las Secciones 2 a 4 del Suplemento 1.

Las redes neuronales se entrenaron utilizando conjuntos de datos compuestos por señales con diferentes niveles de ruido: 45, 35, 30 y 25 dB y se probaron con datos experimentales para evaluar qué nivel de ruido es el más óptimo. Para dar una idea de cómo se ve cada nivel de ruido en una señal de entrenamiento, se generaron espectros de ejemplo para un objeto de interfaz única y con la máxima profundidad de modulación. Se presentan en la Fig. 3e, g, i y k, y la Fig. 3c muestra un espectro sin ruido.

(a) Uno de los espectros experimentales adquiridos para un zafiro de 460 μm de espesor. (b) Una exploración B que muestra un cristal de zafiro inclinado. La línea vertical representa los picos de autocorrelación. (f, j, d, h, l) Mapas de dispersión del cristal de zafiro obtenidos con una red entrenada con señales que contienen: sin ruido, 45, 35, 30 y 25 dB de ruido. Todos los mapas de dispersión se ven afectados por la presencia de picos de autocorrelación: la red los trata como picos estructurales y les asigna niveles de GVD. I-IV marcan cuatro áreas que pueden discernirse como resultado. (c, e, g, i, k) Ejemplo de espectros de entrenamiento que muestran cómo se ven los niveles de ruido simulados. (m) El perfil de dispersión número 30 de los cinco mapas de dispersión previstos.

El conjunto de datos experimentales, obtenido utilizando el sistema OCT de laboratorio, contiene 275 pilas FFT calculadas a partir de 275 espectros experimentales que se obtuvieron mientras se escaneaba transversalmente un cristal de zafiro de 460 μm de espesor. Los espectros, uno de los cuales se muestra en la Fig. 3a, se linealizan para eliminar la no linealidad introducida por el espectrómetro, se filtran con una ventana gaussiana y luego se transforman de Fourier. Los escaneos A resultantes se apilan uno encima del otro para formar una imagen XZ llamada escaneo B que se presenta en la figura 3b. Debido a que el zafiro se colocó en ángulo con la dirección de propagación de la luz, las superficies frontal y posterior del zafiro están representadas por dos líneas inclinadas. La línea vertical ubicada cerca de la segunda superficie del zafiro corresponde a picos de autocorrelación. Los picos de autocorrelación son inherentes a la OCT y se originan por la interferencia de la luz reflejada por las estructuras internas del objeto. Debido a que el zafiro es un objeto de dos interfaces, cada escaneo A contiene un pico de autocorrelación colocado a una distancia igual al espesor óptico del zafiro.

El conjunto de datos de zafiro se procesa con una red entrenada con datos sin ruido y redes entrenadas con datos ruidosos. Cada pila de FFT del conjunto de datos es transformada por una red en un perfil de dispersión. Todos los perfiles de dispersión se apilan uno encima de otro para formar un mapa de dispersión. Dichos mapas de dispersión pronosticados se muestran en la Fig. 3d correspondiente al entrenamiento "silencioso" y en las Fig. 3f, h, j y l correspondientes al entrenamiento con niveles de ruido de 45, 35, 30 y 25 dB, respectivamente.

Dado que la red neuronal trata el pico de autocorrelación como un pico estructural (como se analiza en 23, los perfiles de dispersión contienen cuatro áreas distintas (marcadas con amarillo I – IV en la Fig. 3f), en lugar de las tres esperadas:

El área I comienza a una distancia óptica 0 y termina en la ubicación de la primera interfaz. El GVD en esta área debe ser igual al GVD del desequilibrio de dispersión en el interferómetro, \( \beta _{NL,\text {front}}^{(even)} \).

El Área II comienza en la ubicación de la primera interfaz y termina en la ubicación del pico de autocorrelación. El GVD en esta área, \( \beta _{NL, 2}^{(even)}\), depende del GVD de la primera área y del objeto GVD, \( \beta _{NL,obj}^{ (par)} \)23

donde \( L_{\textrm{front}} \) es la distancia entre la distancia óptica 0 y la primera interfaz del objeto, y \( L_{obj} \) es el espesor del objeto.

El área III, situada entre el pico de autocorrelación y la segunda interfaz, debería tener el mismo GVD que el área I.

En la cuarta área, área IV, ubicada detrás de la segunda interfaz, el GVD es igual a 0 fs\(^2\)/mm.

Todos los mapas de dispersión previstos contienen las cuatro áreas, y las áreas I y III tienen un valor de GVD similar. Se puede observar que cuanto más “ruidoso” sea el entrenamiento, mejores serán las predicciones: los valores de GVD dentro de las cuatro áreas se vuelven más uniformes y las áreas mismas más suaves, siendo el mapa más suave la salida de la red de 30 dB. Para ver esa mejora en el nivel de un único perfil de dispersión, se traza el perfil de dispersión número 30 de los cinco mapas de dispersión predichos y se muestra en la Fig. 3m. Además, en los mapas de dispersión previstos para redes de 35 dB, 30 dB y 25 dB, se detectan tres áreas, en lugar de cuatro, en la parte inferior de los mapas: una entre la distancia óptica 0 y la primera interfaz, una entre las interfaces y la tercera. detrás de la segunda interfaz. Esto se debe al hecho de que a estos niveles de ruido, la red trata el pico de autocorrelación como ruido y asigna niveles de GVD a solo dos picos (los picos de la interfaz), en lugar de tres (los picos de la interfaz y el pico de la autocorrelación).

Se eligió la red entrenada con señales con una relación señal-ruido (SNR) igual a 30 dB para su uso posterior, ya que muestra visiblemente los mejores resultados: el mapa de dispersión es el "más suave". En la Sección 3 del Suplemento 1 se presentan un análisis más detallado y centrado en parámetros y una comparación del rendimiento del modelo entrenado con conjuntos de datos correspondientes a diferentes niveles de SNR.

Se probó cómo se ven afectadas las predicciones de la red neuronal si la resolución axial de las pilas FFT de entrada utilizadas para el entrenamiento, 4,08 μm, no coincide con la resolución axial del sistema OCT.

Se generaron y procesaron pilas FFT para un objeto de tres interfaces con GVD de −1500 fs\(^2\)/mm y 1000 fs\(^2\)/mm y correspondientes a diferentes resoluciones axiales, de 2,72 a 8,16 μm. La red neuronal. Como se muestra en la Fig. 4a, el nivel de GVD previsto cambia proporcionalmente a la resolución axial: cuanto menor es el valor de resolución, menor es el GVD previsto y cuanto mayor es el valor de resolución, mayor es el GVD previsto.

Los perfiles de dispersión previstos para un objeto de tres interfaces con GVD de -1500 fs\(^2\)/mm y 1000 fs\(^2\)/mm correspondientes a (a) diferentes valores de resolución del sistema OCT muestran el potencial de la red para universalidad. utilizar si se tiene en cuenta la discrepancia en la resolución. Los perfiles de dispersión previstos en azul, con los correspondientes escaneos A en naranja, para (b) un vidrio de cuarzo de 120 μm de espesor (c) dos vidrios de cuarzo de 120 μm de espesor muestran niveles de GVD similares dentro de los objetos y frente a ellos.

Las predicciones obtenidas muestran que la red podría usarse con datos adquiridos con un sistema OCT cuya resolución axial no coincide con los utilizados para el entrenamiento. En presencia de desajuste, los resultados son cualitativos y la influencia de una resolución no coincidente podría potencialmente corregirse aplicando una constante de proporcionalidad para obtener una representación más cuantitativa.

Se tomaron imágenes de dos tipos de objetos con el sistema comercial para los cuales existe una discrepancia entre la resolución experimental (5,5 μm) y la resolución simulada (4,08 μm): un vidrio de cuarzo de 120 μm de espesor y dos vidrios de cuarzo de 120 μm de espesor del del mismo tipo (A-scans presentados en las Fig. 4b yc en naranja). Los perfiles de dispersión predichos (Fig. 4b yc en azul) muestran niveles de GVD similares para el interior de las gafas, alrededor de 25 fs\(^2\)/mm, y entre 0 distancia óptica y la ubicación de la primera interfaz del objeto. 680 pies\(^2\)/mm. Los niveles de GVD no son constantes dentro de las áreas correspondientes y muestran cambios rápidos en los límites; los errores son la limitación actual de nuestro enfoque. Sin embargo, las alturas de los niveles de GVD parecen bastante consistentes en los dos perfiles de dispersión: el nivel de GVD para el interior de los vidrios de cuarzo y alrededor de la distancia óptica 0 son similares en ambos perfiles de dispersión.

La red neuronal se probó en términos de limitaciones de predicción con señales generadas por computadora que representan objetos de tres capas para los cuales todas las capas tienen el mismo espesor y donde cada capa tiene un valor GVD diferente (Fig. 5). Los gráficos de la Fig. 5 etiquetados con 1 son mapas de dispersión reales con 138 perfiles de dispersión cada uno. Los perfiles de dispersión consecutivos en un mapa de dispersión representan un espesor creciente de las capas del objeto: 4 μm de espesor de las tres capas para el perfil de dispersión 0 y 306 μm de espesor de las tres capas para el perfil de dispersión 137. Los gráficos de la Fig. 5 etiquetados con 2 son predicciones.

La primera fila de la Fig. 5 muestra las situaciones más realistas en términos de los valores de GVD y su variabilidad de capa a capa en el objeto. Los valores de GVD difieren en 10 y 5 fs\(^2\)/mm entre las capas del objeto, lo que da como resultado: 50, 40, 45 fs\(^2\)/mm en las Fig. 5a, 110, 100 y 105 fs\(^2\)/mm en la Fig. 5b, y 1010, 1000 y 1005 fs\(^2\)/mm en la Fig. 5c. La variabilidad de los niveles de GVD es mayor en cada fila consecutiva: en la Fig. 5d, e la diferencia es 100 y 50 fs\(^2\)/mm, en la Fig. 5g–i 200 y 100 fs\(^2\) /mm, en la Fig. 5j–l 400 y 200 fs\(^2\)/mm y en la Fig. 5m–o 1000 y 500 fs\(^2\)/mm siendo los niveles mínimos de GVD en cada fila 100, 500 y 1000 fs\(^2\)/mm (correspondiente a la capa media).

(a1 – o1) Mapas de dispersión de verdad terrestre, (a2 – o2) Mapas de dispersión predichos utilizando la red neuronal de 30 dB. Los títulos de cada par de imágenes indican los valores de GVD de las capas del objeto: los valores aumentan de izquierda a derecha en cada fila y la diferencia de valores de GVD dentro del objeto aumenta de arriba a abajo. Cuanto mayor sea la variabilidad de los valores de GVD dentro del objeto, mejores serán las predicciones.

Las predicciones de mapas de dispersión de objetos con la menor variabilidad de GVD no logran reproducir los valores correctos, pero aún muestran cambios bruscos en las ubicaciones de la interfaz y, por lo tanto, permiten distinguir las capas. Cuanto mayor sea la variabilidad de GVD dentro del objeto, mejores serán las predicciones, incluso para espesores tan pequeños como un par de micrómetros. Este comportamiento no es sorprendente. Las capas más pequeñas y/o el GVD más pequeño no inducen un cambio de los artefactos en la pila FFT lo suficientemente grande como para que la red neuronal los detecte; por otro lado, las capas más gruesas y/o el GVD más grande introducen un cambio mayor en la apariencia del Pila FFT que hace que sea mucho más fácil de interpretar para la red neuronal.

En la Sección 4 del Suplemento 1 se encuentra un análisis más cuantitativo y orientado a parámetros.

La red neuronal entrenada con señales con una SNR de 30 dB se utiliza además para probar si es capaz de determinar correctamente los valores GVD a partir de los datos experimentales. Utilizando el sistema OCT de laboratorio, adquirimos 300 exploraciones A en una posición para el cristal de zafiro de 460 μm de espesor y un vidrio BK7 de 1000 μm de espesor. Estos escaneos A, cuando se apilan uno encima de otro, forman un escaneo M. El escaneo M para el zafiro se muestra en la Fig. 6a y el escaneo M para el BK7 en la Fig. 6e; en ambos casos, los picos de autocorrelación se eliminaron de cada escaneo A.

Zafiro y BK7: (a, e) un escaneo M que contiene 300 escaneos A con los picos de autocorrelación eliminados, (b, f) perfiles de dispersión correspondientes a cada escaneo A en el escaneo M, (c, g) perfiles de dispersión para el cual la desviación estándar (STD) calculada a partir de los valores de GVD en el rectángulo verde es la más pequeña, el recuadro es un primer plano del área en el gráfico marcada con el rectángulo verde, (d, h) es el perfil de dispersión obtenido tomando la media de todos los valores de dispersión, nuevamente el recuadro es un primer plano del área marcada con el rectángulo verde. La longitud dos veces mayor del eje x en los mapas de dispersión y los perfiles de dispersión es un subproducto de la generación de la pila FFT.

Las predicciones de los niveles de GVD correspondientes se muestran en las figuras 6b y f. El valor GVD para el zafiro a 840 nm es 53,2 fs\(^2\)/mm y el valor GVD para BK7 es 40,98 fs\(^2\)/mm. En consecuencia, el nivel de GVD en el área entre las interfaces del objeto tanto para el zafiro como para BK7 debería estar muy cerca de 0, lo que resulta en un color rojo claro en el mapa de dispersión. Esa área en los mapas de dispersión obtenidos es predominantemente azul claro, lo que indica que los valores de GVD son predominantemente negativos, lo que puede deberse al orden inverso de las interfaces en la exploración A. Cuando se invierte el orden de las interfaces en el A-scan, el primer pico representa la superficie posterior del objeto y el segundo pico representa la superficie frontal. En tal situación, es el primer pico cuyo ancho cambia debido a la capa GVD, lo que significa que la acumulación de dispersión ocurre en la dirección opuesta, negativa. Además, los valores de GVD en esa zona se vuelven positivos en algún momento confirmando lo establecido en la sección anterior: para valores de GVD más pequeños la red pierde precisión.

En las figuras 6c y g, vemos perfiles de dispersión para los cuales la desviación estándar calculada a partir de los valores de GVD en el rango marcado con el rectángulo verde es la más pequeña. En consecuencia, estos perfiles de dispersión muestran los niveles de GVD más "constantes" en todos los datos adquiridos. Se puede ver en el recuadro inferior que muestra el área dentro del rectángulo negro, que aún así, el nivel de GVD más "constante" varía en su altura. El valor medio de GVD en tal caso se calcula en −46 ± 26 fs\(^2\)/mm para zafiro y −29 ± 27 fs\(^2\)/mm para BK7. Como era de esperar, ambos valores son negativos y están cargados de un gran error.

Las figuras 6d y h muestran un perfil de dispersión medio calculado a partir de todos los perfiles de dispersión en los mapas correspondientes. Las áreas de color naranja claro representan la desviación estándar. El rango de valores GVD en el recuadro inferior, que muestra el área dentro del segundo rectángulo verde, es nuevamente amplio. Se calcula que la media de todos los valores de GVD de todos los perfiles de dispersión es −50,3 ± 33,6 fs\(^2\)/mm para zafiro y −20,0±39 fs\(^2\)/mm para BK7. Nuevamente, como era de esperar, ambos valores son negativos y cargan con un error mayor que en el caso anterior.

En ambos casos, el valor medio de GVD está muy cerca del valor publicado en la literatura para el zafiro. Para BK7, los valores medios están más alejados del valor publicado, pero permanecen dentro del error calculado.

Los mapas de dispersión se producen con la misma red neuronal (entrenada con señales con SNR de 30 dB) para objetos biológicos: una uva (Fig. 7a), fotografiada con el sistema OCT de laboratorio, y un pepino colocado sobre un cubreobjetos de 120 μm de espesor. fotografiado con el sistema comercial OCT.

(a) Mapa de dispersión de la uva, (b) el B-scan donde no se compensa el desequilibrio de dispersión en el interferómetro. (c) Una imagen cuya dispersión desequilibrada fue compensada. La longitud dos veces mayor del eje x en los mapas de dispersión es un subproducto de la generación de la pila FFT.

Los mapas de dispersión de un pepino obtenidos utilizando la red neuronal entrenada con señales con (a) SNR = 30 dB, (b) y SNR = 45 dB muestran los límites del objeto fotografiado, pero los niveles de GVD predichos siguen siendo aleatorios. (c) La imagen del pepino. La longitud dos veces mayor del eje x en los mapas de dispersión es un subproducto de la generación de la pila FFT.

El mapa de dispersión previsto de la uva muestra un área de GVD positiva frente al objeto, pero los niveles de GVD para el interior de la uva siguen siendo aleatorios. La figura 7b muestra un escaneo B obtenido mediante espectros de transformación de Fourier utilizados para calcular las pilas de FFT para la red neuronal: estos espectros se linealizaron para eliminar solo la no linealidad proveniente del espectrómetro. En la Fig. 7c, se muestra una exploración B para la cual los espectros estaban completamente linealizados: se eliminaron las no linealidades introducidas tanto por el espectrómetro como por la dispersión no balanceada.

La imagen del pepino (Fig. 8c) tiene una SNR visiblemente más baja que la imagen de la uva. Dado que la intensidad de ambas imágenes está normalizada, la comparación de los valores máximos en las barras de colores da una indicación de la diferencia en el nivel de ruido respecto a la señal. Para datos de entrada de baja SNR, los mapas de dispersión, ya sea obtenidos con la red entrenada con señales de baja SNR (Fig. 8a) o señales de alta SNR (Fig. 8b), solo pueden distinguir los límites del pepino y el frente al cubreobjetos sobre el que se colocó la rodaja de pepino. Para algunas exploraciones A, los elementos más brillantes dentro del pepino provocan la aparición de más niveles de dispersión en los perfiles de dispersión en esas áreas. Sin embargo, los valores obtenidos siguen siendo aleatorios.

La OCT de imitación cuántica (Qm-OCT) y el aprendizaje automático se combinan para permitir la recuperación de valores de dispersión de velocidad de grupo (GVD) de objetos fotografiados. Con una señal Qm-OCT como entrada, la red neuronal propuesta basada en VGG-16 permitió obtener perfiles de dispersión para gafas de zafiro y BK7 y, basándose en esos perfiles de dispersión, calcular los valores de GVD. Los valores calculados, 46±26 fs\(^2\)/mm para el zafiro y 29±27 fs\(^2\)/mm (se omiten los signos negativos originales delante de los valores medios) concuerdan bien con Los valores de la literatura, 53,2 fs\(^2\)/mm para el zafiro y 40,98 fs\(^2\)/mm para BK7, pero están plagados de grandes errores. Esto contrasta con los métodos actuales de recuperación de GVD, cuyos errores para estructuras de vidrio bien definidas podrían llegar al 0,3%14.

En el caso de los objetos biológicos: una uva y un pepino, las predicciones son más bien de carácter cualitativo. Los valores GVD previstos para sus capas son muy altos o muy bajos y cambian rápidamente. Esto puede deberse al pequeño tamaño de las capas y a sus pequeños valores de GVD que en la práctica deberían ser muy cercanos al del agua, 26 fs\(^2\)/mm. Se reprodujo una predicción aleatoria de GVD similar para objetos generados por computadora con capas delgadas y de bajo GVD y representa la mayor limitación del enfoque presentado.

Los objetos delgados y con GVD bajo están fuera del alcance de este enfoque, como lo demuestran las simulaciones presentadas en la Fig. 5, porque las capas más delgadas que también se caracterizan por un GVD bajo no muestran cambios en las pilas de FFT lo suficientemente grandes como para que la red los seleccione. arriba. Lo que es importante es que esta limitación no se limita a la OCT de imitación cuántica y se extiende a la OCT en general. GVD se manifiesta en un espectro OCT estándar mediante una modulación no uniforme (no lineal) que, después de la transformación de Fourier, corresponde a un pico ampliado. En tal caso, si la capa es pequeña y tiene un GVD bajo, la no linealidad de la modulación (y el correspondiente ensanchamiento de pico) también es muy pequeña y, en consecuencia, difícil de detectar, especialmente en presencia de ruido. La precisión de detectar cambios tan pequeños es actualmente mayor en otros métodos de recuperación de GVD. Sin embargo, los otros métodos requieren una gran atención por parte del usuario, especialmente si se pretende caracterizar múltiples capas. En comparación, nuestro enfoque propuesto brinda una oportunidad única para que la extracción de GVD sea completamente automática e imparcial para el usuario. Si bien la precisión de esta extracción no es totalmente satisfactoria por el momento, no existen obstáculos conceptuales que impidan mejorarla en el futuro.

Curiosamente, el amplio análisis presentado en este artículo mostró que la dificultad de la recuperación del GVD no está asociada con la simplicidad del objeto o simplemente con su grosor. Como se muestra en la Fig. 5, el éxito de la determinación precisa de GVD aumenta para valores de GVD más altos y sus diferencias entre capas adyacentes en el objeto.

Como se mencionó anteriormente, la precisión de determinar los valores de GVD con la red propuesta se ve afectada por el ruido en las señales. Esto se mitiga parcialmente mediante un entrenamiento adecuado, es decir, un entrenamiento realizado utilizando un conjunto de datos que contiene señales con un nivel de ruido adecuado. En este sentido, el trabajo futuro debería incluir medidas encaminadas a mejorar el proceso de formación. Se podría agregar una segunda entrada, por ejemplo, un A-scan tradicional, que apoyaría la detección de la interfaz durante el entrenamiento. También se podrían probar diferentes arquitecturas de redes neuronales y se podría emplear una simulación más detallada de una señal OCT, por ejemplo, una que incluya la presencia de motas.

Los datos utilizados para respaldar los hallazgos de este estudio se incluyen en el artículo. Los conjuntos de datos utilizados durante el estudio actual están disponibles a través del autor correspondiente.

Erkmen, BI & Shapiro, JH Tomografía de coherencia óptica conjugada en fase. Física. Rev. A 74, 041601 (2006).

ADS del artículo Google Scholar

Banaszek, K., Radunsky, AS y Walmsley, IA Compensación de dispersión ciega para tomografía de coherencia óptica. Optar. Comunitario. 269, 152-155 (2007).

Artículo ADS CAS Google Scholar

Shirai, T. & Friberg, AT Tomografía de coherencia óptica de dominio espectral interferométrico de intensidad con cancelación de dispersión. JOSA A 31, 258–263 (2014).

Artículo ADS PubMed Google Scholar

Resch, K., Puvanathasan, P., Lundeen, J., Mitchell, M. y Bizheva, K. Interferometría clásica de cancelación de dispersión. Optar. Expreso 15, 8797–8804 (2007).

Artículo ADS CAS PubMed Google Scholar

Ryczkowski, P., Turunen, J., Friberg, AT y Genty, G. Demostración experimental de tomografía de coherencia óptica de intensidad espectral. Ciencia. Rep. 6, 22126 (2016).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Lajunen, H. et al. Tomografía de coherencia óptica de resolución mejorada basada en interferometría de intensidad clásica. JOSA A 26, 1049–1054 (2009).

Artículo ADS PubMed Google Scholar

Le Gouët, J., Venkatraman, D., Wong, FN y Shapiro, JH Realización experimental de tomografía de coherencia óptica conjugada en fase. Optar. Letón. 35, 1001-1003 (2010).

Artículo ADS PubMed Google Scholar

Jensen, M. y col. Cancelación de dispersión total en profundidad en tomografía de coherencia óptica de dominio espectral utilizando correlaciones de intensidad numérica. Ciencia. Rep. 8, 9170 (2018).

Artículo ADS PubMed PubMed Central Google Scholar

Kolenderska, SM & Kolenderski, P. La correlación de intensidad oct es una imitación clásica del oct cuántico que proporciona una mejora de resolución de hasta el doble. Ciencia. Representante 11, 1-10 (2021).

Artículo de Google Scholar

Liu, B., Macdonald, EA, Stamper, DL y Brezinski, ME Efectos de dispersión de velocidad del grupo con agua y lípidos en un sistema de tomografía de coherencia óptica de 1,3 μm. Física. Medicina. Biol. 49, 923 (2004).

Artículo CAS PubMed Google Scholar

Photiou, C., Bousi, E., Zouvani, I. y Pitris, C. Uso de moteado para medir la dispersión del tejido en tomografía de coherencia óptica. Biomédica. Optar. Expreso 8, 2528–2535 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Kolenderska, SM, Bräuer, B. & Vanholsbeeck, F. Mapeo de dispersión como un paso simple de posprocesamiento para datos de tomografía de coherencia óptica de dominio de Fourier. Ciencia. Representante 8, 1–7 (2018).

Artículo CAS Google Scholar

Schlichting, S., Willemsen, T., Ehlers, H., Morgner, U. y Ristau, D. Medición directa de GDD in situ en el proceso de recubrimiento óptico. En Diseño de sistemas ópticos 2015: Avances en películas ópticas delgadas V 328–336 (SPIE, 2015).

Photiou, C. & Pitris, C. Comparación de técnicas de medición de la dispersión tisular basadas en tomografía de coherencia óptica. J. Biomed. Optar. 24, 046003 (2019).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Coello, Y., Xu, B., Miller, TL, Lozovoy, VV y Dantus, M. Mediciones de dispersión de velocidad grupal de agua, agua de mar y componentes oculares mediante exploración de fase de interferencia intrapulso multifotónica. Aplica. Optar. 46, 8394–8401 (2007).

Artículo ADS CAS PubMed Google Scholar

Maliszewski, KA, Kolenderski, P., Vetrova, V. y Kolenderska, SM Hacia la recuperación de perfiles de dispersión mediante tomografía de coherencia óptica de imitación cuántica y aprendizaje automático. Optar. Expreso 30, 45624–45634 (2022).

Artículo ADS CAS PubMed Google Scholar

Simonyan, K. & Zisserman, A. Redes convolucionales muy profundas para el reconocimiento de imágenes a gran escala. Preimpresión en arXiv:1409.1556 (2014).

Iqbal, H. Harisiqbal88/plotneuralnet v1.0.0, https://doi.org/10.5281/zenodo.2526396 (2018).

Ioffe, S. & Szegedy, C. Normalización de lotes: acelerar el entrenamiento profundo de la red reduciendo el cambio de covariables interno. En Conferencia internacional sobre aprendizaje automático 448–456 (PMLR, 2015).

Srivastava, N., Hinton, G., Krizhevsky, A., Sutskever, I. y Salakhutdinov, R. Abandono: una forma sencilla de evitar el sobreajuste de las redes neuronales. J. Mach. Aprender. Res. 15, 1929-1958 (2014).

MathSciNet MATEMÁTICAS Google Scholar

Ba, JL, Kiros, JR y Hinton, GE Normalización de capas. Preimpresión en arXiv:1607.06450 (2016).

Kingma, DP y Ba, J. Adam: un método de optimización estocástica. Preimpresión en arXiv:1412.6980 (2014).

Maliszewski, KA, Kolenderski, P., Vetrova, V. y Kolenderska, SM Hacia la recuperación de perfiles de dispersión mediante tomografía de coherencia óptica de imitación cuántica y aprendizaje automático. Preimpresión en arXiv:2206.02547 (2022).

Descargar referencias

PK desea agradecer el apoyo financiero de Horizonte Europa, el Programa Marco de Investigación e Innovación de la Unión Europea, el proyecto SEQUOIA, en virtud del acuerdo de subvención 101070062, y el Laboratorio Nacional de Física Atómica, Molecular y Óptica en Torun, Polonia. VV y KAM desean agradecer a Heyang (Thomas) Li y Oliver Batchelor por proporcionar recursos GPU adicionales.

Estos autores contribuyeron igualmente: Krzysztof A. Maliszewski y Sylwia M. Kolenderska.

Escuela de Matemáticas y Estadística, Universidad de Canterbury, Christchurch, Nueva Zelanda

Krzysztof A. Maliszewski y Varvara Vetrova

Laboratorio digital Massey AgriFood (MAF), Universidad de Massey, Palmerston North, Nueva Zelanda

Magdalena A. Urbanańska

Facultad de Física, Astronomía e Informática, Universidad Nicolaus Copernicus, Toruń, Polonia

Piotr Kolenderski y Sylwia M. Kolenderska

Facultad de Ciencias Físicas y Químicas, Universidad de Canterbury, Christchurch, Nueva Zelanda

Sylwia Kolenderska

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

SMK concibió la idea, diseñó el experimento y supervisó el trabajo. KAM, con el apoyo de VV, creó redes neuronales y analizó su desempeño. MU adquirió datos experimentales. SMK y KAM escribieron el manuscrito. Todos los autores revisaron el manuscrito.

Correspondencia a Sylwia M. Kolenderska.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado al autor(es) original(es) y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Maliszewski, KA, Urbańska, MA, Kolenderski, P. et al. Extracción de valores de dispersión de velocidad de grupo mediante tomografía de coherencia óptica de imitación cuántica y aprendizaje automático. Representante científico 13, 6596 (2023). https://doi.org/10.1038/s41598-023-32592-7

Descargar cita

Recibido: 07 de octubre de 2022

Aceptado: 29 de marzo de 2023

Publicado: 22 de abril de 2023

DOI: https://doi.org/10.1038/s41598-023-32592-7

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.