Métodos de regresión multivariante en biorreactores
El uso de métodos de regresión multivariante en biorreactores es particularmente útil en la estimación de AEC (Atributos Críticos de la Calidad) y PPC (Parámetros Críticos del Proceso) que no son fácilmente medibles en tiempo real.
El siguiente estudio de caso demuestra el uso de PLS en la estimación de las concentraciones de aminoácidos y de la forma de glicosilación en la producción de anticuerpos monoclonales utilizando cultivos de células híbridas.
Green y Glassey informaron que varios métodos multivariante en biorreactores de extracción de características de análisis de datos multivariados, como PARAFAC, PCA y PCA multivariado, fueron capaces de capturar las diferencias entre lotes realizados bajo diferentes condiciones de operación, destacando particularmente el impacto negativo de los altos valores de oxígeno disuelto y pH.
Estas observaciones en biorreactores de tanque de acero confirmaron las observaciones anteriores de Ivarsson et al. Posteriormente, se desarrollaron modelos de PLS utilizando datos en línea y fuera de línea para estimar parámetros importantes del proceso (como las concentraciones de aminoácidos durante los cultivos) y un AEC del anticuerpo monoclonal: sus formas de glicosilación.
Se desarrollaron varios modelos para cada variable de salida, resumiendo los modelos de estimación de aminoácidos, las variables de entrada y salida para cada uno de los modelos junto con el número de variables latentes y el rendimiento de los modelos en los conjuntos de datos de validación en términos del error cuadrático medio.
Claramente, los datos en línea fueron suficientes para estimar la concentración de algunos aminoácidos con precisión suficiente, aunque para otros aminoácidos (por ejemplo, ALA, GLU, GLY y VAL, números 1, 7, 8 y 20), la precisión es menor. Sin embargo, los beneficios en comprender el comportamiento del cultivo celular y la oportunidad de obtener estimaciones de parámetros metabólicos importantes en tiempo real son, sin duda, una ventaja significativa para comprender el estado metabólico del cultivo.
No obstante, sería aún más beneficioso poder estimar los AEC (Atributos Críticos de la Calidad), como la concentración de las glicoformas producidas por el cultivo celular. Las predicciones menos precisas se obtuvieron para las glicanos G0F y G1F. Las razones de esto están siendo investigadas actualmente.
Habíamos revisado los diversos sensores y técnicas analíticas utilizadas en la medición de procesos biológicos, tanto en procesos biotecnológicos tradicionales como en experimentos de alto rendimiento y a escala reducida. Se discutieron los desafíos introducidos por la variabilidad en la frecuencia de las mediciones y la gran cantidad de mediciones de diversas tecnologías de sensores (particularmente los métodos multianalíticos, como los métodos multivariante en biorreactores espectrales y «ómicos»). Se revisaron métodos específicos de preprocesamiento de datos, especialmente en el caso de datos espectrales.
Se proporcionó un breve resumen de PCA y PLS como ejemplos de métodos multivariante en biorreactores de extracción/clasificación de características y métodos de regresión. Se describieron variantes no lineales de ambos métodos de clasificación y regresión como alternativas a PCA y PLS.
Finalmente, se presentaron dos estudios de caso de procesos biotecnológicos. En el primer estudio de caso, se utilizó PCA para identificar las diferencias entre lotes de producción de 𝛽-galactosidasa recombinante de E. coli basados en datos del olfato electrónico monitoreados durante el cultivo.
En el segundo estudio de caso, se utilizó PLS para predecir la concentración de aminoácidos y los perfiles de glicosilación a partir de datos en línea y fuera de línea recopilados durante la producción de anticuerpos monoclonales utilizando cultivos de células hibridoma.
Estos estudios de caso resaltaron tanto los beneficios de enfoques como estos como los desafíos que se enfrentan en su aplicación, especialmente cuando los datos disponibles de los procesos son limitados y la comprensión fundamental de los procesos subyacentes es limitada.