Ecosistema de ciencia de datos para el análisis de largos supervivientes en cáncer

Autores/as

DOI:

https://doi.org/10.5281/zenodo.15046726

Palabras clave:

cáncer, ciencia de datos, larga supervivencia, MSC 92-04, MSC 62P10, MSC 62N01, MSC 62N02

Resumen

La introducción de nuevas inmunoterapias ha incrementado la esperanza de vida en pacientes con cáncer, aunque la respuesta al tratamiento varía significativamente, observándose subpoblaciones con corta y larga supervivencia. Esta heterogeneidad subraya la necesidad de herramientas que permitan identificar y analizar estas diferencias en los estudios de supervivencia. Este trabajo tiene como objetivo presentar la implementación de un ecosistema de ciencia de datos basado en R para analizar la existencia de subpoblaciones de larga supervivencia en pacientes con cáncer. Se basa en una metodología que permite la identificación de subpoblaciones mediante pruebas de multimodalidad y el ajuste de modelos paramétricos de mezcla de supervivencia. El ecosistema utiliza diversos paquetes de R, como RMarkdown, y se aplica a un conjunto de 1245 pacientes con cáncer de pulmón avanzado tratados con CIMAvaxEGF en ensayos clínicos del Centro de Inmunología Molecular. Los resultados demuestran que el ecosistema es eficaz para realizar análisis completos, desde la carga de datos hasta la visualización de resultados. Se identificaron dos subpoblaciones: una con corta supervivencia (73%, mediana de 8,7 meses) y otra con larga supervivencia (27%, mediana de 20,9 meses). Esto muestra la utilidad del enfoque para caracterizar la heterogeneidad en la respuesta al tratamiento. En conclusión, el ecosistema desarrollado es una herramienta versátil, reproducible y abierta para el análisis de supervivencia en cáncer de pulmón avanzado. Futuras investigaciones podrían extender su aplicación a otros tipos de cáncer e incorporar metodologías adicionales para mejorar la caracterización de subpoblaciones.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Allaire, J.J.: rmarkdown: Dynamic Documents for R, 2024. https://cran.r-project.org/web/packages/rmarkdown/index.html.

Bansal, A. and S. Srivastava: Tools used in data analysis: A comparative study. International Journal of Recent Research, 5(1):15–18, 2018. https://www.ijrra.net/Vol5issue1/IJRRA-05-01-04.pdf.

Benaglia, T., D. Chauveau, D.R. Hunter, and D.S. Young: mixtools: an R package for analyzing mixture models. Journal of Statistical Software, 32:1–29, 2010. https://www.jstatsoft.org/article/view/v032i06.

Farewell, V.T.: The use of mixture models for the analysis of survival data with long-term survivors. Biometrics, páginas 1041–1046, 1982. https://pubmed.ncbi.nlm.nih.gov/7168793/.

Hall, P. and M. York: On the calibration of Silverman’s test for multimodality. Statistica Sinica, pages 515–536, 2001. https://www.jstor.org/stable/24306875.

IBM: IBM SPSS Advanced Statistics, 2024. https://www.ibm.com/docs/es/spss-statistics/27.0.0?topic=edition-advanced-statistics.

IBM: IBM SPSS Statistics, 2024. https://www.ibm.com/products/www.ibm.com/products/spss-statistics.

McLachlan, G.J. and D. Peel: Finite mixture models. John Wiley & Sons, 2000. https://onlinelibrary.wiley.com/doi/book/10.1002/04717

Peikert, A. and A.M. Brandmaier: A reproducible data analysis workflow with R Markdown, Git, Make, and Docker. Quantitative and Computational Methods in Behavioral Sciences, pages 1–27, 2021. https://qcmb.psychopen.eu/index.php/qcmb/article/view/3763.

Preubner, J.: silvermantest: Investigate the Number of Modes using Kernel Density Estimates, 2024. https://rdrr.io/github/jenzopr/silvermantest/.

Sanchez, L., P. Lorenzo-Luaces, C. Fonte, and A. Lage: Mixture survival models methodology: an application to cancer immunotherapy assessment in clinical trials. arXiv preprint, 2019. https://arxiv.org/abs/1911.09765.

Sanchez, L., L. Muchene, P. Lorenzo-Luaces, C. Viada, P.C. Rodriguez, S. Alfonso, T. Crombet, E. Neninger, Z. Shkedy, and A. Lage: Differential effects of two therapeutic cancer vaccines on short- and long-term survival populations among patients with advanced lung cancer. Seminars in Oncology, 45(1):52–57, 2018, ISSN 0093-7754. https://doi.org/10.1053/j.seminoncol.2018.04.005.

Silverman, B.W.: Using kernel density estimates to investigate multimodality. Journal of the Royal Statistical Society: Series B (Methodological), 43(1):97–99, 1981. https://www.jstor.org/stable/2985156.

Sjoberg, D.D., K. Whiting, M. Curry, J.A. Lavery, and J. Larmarange: Reproducible summary tables with the gtsummary package. The R Journal, 13:570–580, 2021. https://doi.org/10.32614/RJ-2021-053.

Therneau, T.M. and P.M. Grambsch: Modeling Survival Data: Extending the Cox Model. Springer, New York, 2000, ISBN 0-387-98784-3. https://link.springer.com/book/10.1007/978-1-4757-3294-8.

Wickham, H.: ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York, 2016, ISBN 978-3-319-24277-4. https://ggplot2.tidyverse.org.

Wickham, H., M. Averick, J. Bryan, W. Chang, L.D’A. McGowan, R. François, G. Grolemund, A. Hayes, L. Henry, and J. Hester: Welcome to the Tidyverse. Journal of Open Source Software, 4(43):1686, 2019. https://joss.theoj.org/papers/10.21105/joss.01686.

Xie, Y., J.J. Allaire, and G. Grolemund: R markdown: The definitive guide. Chapman and Hall/CRC, 2018. https://bookdown.org/yihui/rmarkdown/.

Descargas

Publicado

2025-02-24 — Actualizado el 2024-06-27

Versiones

Cómo citar

[1]
Palomino Hernández, J.L. et al. 2024. Ecosistema de ciencia de datos para el análisis de largos supervivientes en cáncer. Ciencias matemáticas. 38, 1 (jun. 2024), 69–75. DOI:https://doi.org/10.5281/zenodo.15046726.

Número

Sección

Artículo Original