Ecosistema de ciencia de datos para el análisis de largos supervivientes en cáncer
DOI:
https://doi.org/10.5281/zenodo.15046726Palabras clave:
cáncer, ciencia de datos, larga supervivencia, MSC 92-04, MSC 62P10, MSC 62N01, MSC 62N02Resumen
La introducción de nuevas inmunoterapias ha incrementado la esperanza de vida en pacientes con cáncer, aunque la respuesta al tratamiento varía significativamente, observándose subpoblaciones con corta y larga supervivencia. Esta heterogeneidad subraya la necesidad de herramientas que permitan identificar y analizar estas diferencias en los estudios de supervivencia. Este trabajo tiene como objetivo presentar la implementación de un ecosistema de ciencia de datos basado en R para analizar la existencia de subpoblaciones de larga supervivencia en pacientes con cáncer. Se basa en una metodología que permite la identificación de subpoblaciones mediante pruebas de multimodalidad y el ajuste de modelos paramétricos de mezcla de supervivencia. El ecosistema utiliza diversos paquetes de R, como RMarkdown, y se aplica a un conjunto de 1245 pacientes con cáncer de pulmón avanzado tratados con CIMAvaxEGF en ensayos clínicos del Centro de Inmunología Molecular. Los resultados demuestran que el ecosistema es eficaz para realizar análisis completos, desde la carga de datos hasta la visualización de resultados. Se identificaron dos subpoblaciones: una con corta supervivencia (73%, mediana de 8,7 meses) y otra con larga supervivencia (27%, mediana de 20,9 meses). Esto muestra la utilidad del enfoque para caracterizar la heterogeneidad en la respuesta al tratamiento. En conclusión, el ecosistema desarrollado es una herramienta versátil, reproducible y abierta para el análisis de supervivencia en cáncer de pulmón avanzado. Futuras investigaciones podrían extender su aplicación a otros tipos de cáncer e incorporar metodologías adicionales para mejorar la caracterización de subpoblaciones.
Descargas
Citas
Allaire, J.J.: rmarkdown: Dynamic Documents for R, 2024. https://cran.r-project.org/web/packages/rmarkdown/index.html.
Bansal, A. and S. Srivastava: Tools used in data analysis: A comparative study. International Journal of Recent Research, 5(1):15–18, 2018. https://www.ijrra.net/Vol5issue1/IJRRA-05-01-04.pdf.
Benaglia, T., D. Chauveau, D.R. Hunter, and D.S. Young: mixtools: an R package for analyzing mixture models. Journal of Statistical Software, 32:1–29, 2010. https://www.jstatsoft.org/article/view/v032i06.
Farewell, V.T.: The use of mixture models for the analysis of survival data with long-term survivors. Biometrics, páginas 1041–1046, 1982. https://pubmed.ncbi.nlm.nih.gov/7168793/.
Hall, P. and M. York: On the calibration of Silverman’s test for multimodality. Statistica Sinica, pages 515–536, 2001. https://www.jstor.org/stable/24306875.
IBM: IBM SPSS Advanced Statistics, 2024. https://www.ibm.com/docs/es/spss-statistics/27.0.0?topic=edition-advanced-statistics.
IBM: IBM SPSS Statistics, 2024. https://www.ibm.com/products/www.ibm.com/products/spss-statistics.
McLachlan, G.J. and D. Peel: Finite mixture models. John Wiley & Sons, 2000. https://onlinelibrary.wiley.com/doi/book/10.1002/04717
Peikert, A. and A.M. Brandmaier: A reproducible data analysis workflow with R Markdown, Git, Make, and Docker. Quantitative and Computational Methods in Behavioral Sciences, pages 1–27, 2021. https://qcmb.psychopen.eu/index.php/qcmb/article/view/3763.
Preubner, J.: silvermantest: Investigate the Number of Modes using Kernel Density Estimates, 2024. https://rdrr.io/github/jenzopr/silvermantest/.
Sanchez, L., P. Lorenzo-Luaces, C. Fonte, and A. Lage: Mixture survival models methodology: an application to cancer immunotherapy assessment in clinical trials. arXiv preprint, 2019. https://arxiv.org/abs/1911.09765.
Sanchez, L., L. Muchene, P. Lorenzo-Luaces, C. Viada, P.C. Rodriguez, S. Alfonso, T. Crombet, E. Neninger, Z. Shkedy, and A. Lage: Differential effects of two therapeutic cancer vaccines on short- and long-term survival populations among patients with advanced lung cancer. Seminars in Oncology, 45(1):52–57, 2018, ISSN 0093-7754. https://doi.org/10.1053/j.seminoncol.2018.04.005.
Silverman, B.W.: Using kernel density estimates to investigate multimodality. Journal of the Royal Statistical Society: Series B (Methodological), 43(1):97–99, 1981. https://www.jstor.org/stable/2985156.
Sjoberg, D.D., K. Whiting, M. Curry, J.A. Lavery, and J. Larmarange: Reproducible summary tables with the gtsummary package. The R Journal, 13:570–580, 2021. https://doi.org/10.32614/RJ-2021-053.
Therneau, T.M. and P.M. Grambsch: Modeling Survival Data: Extending the Cox Model. Springer, New York, 2000, ISBN 0-387-98784-3. https://link.springer.com/book/10.1007/978-1-4757-3294-8.
Wickham, H.: ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York, 2016, ISBN 978-3-319-24277-4. https://ggplot2.tidyverse.org.
Wickham, H., M. Averick, J. Bryan, W. Chang, L.D’A. McGowan, R. François, G. Grolemund, A. Hayes, L. Henry, and J. Hester: Welcome to the Tidyverse. Journal of Open Source Software, 4(43):1686, 2019. https://joss.theoj.org/papers/10.21105/joss.01686.
Xie, Y., J.J. Allaire, and G. Grolemund: R markdown: The definitive guide. Chapman and Hall/CRC, 2018. https://bookdown.org/yihui/rmarkdown/.
Publicado
Versiones
- 2024-06-27 (5)
- 2025-09-12 (4)
- 2025-03-18 (3)
- 2025-02-24 (2)
- 2025-02-24 (1)
Cómo citar
Número
Sección
Licencia
Derechos de autor 2024 Jorge Luis Palomino Hernández, Patricia Lorenzo-Luaces Álvarez, Lizet Sánchez Valdés

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0.
Esta licencia permite copiar y redistribuir el material en cualquier medio o formato bajo los siguientes términos: se debe dar crédito de manera adecuada, no se puede hacer uso del material con propósitos comerciales, y si remezcla, transforma o crea a partir del material, no podrá distribuir el material modificado. Bajo la licencia mencionada, los autores mantienen los derechos de autor de su trabajo.

