Evaluación de habilidades cognitivas de diversos modelos de lenguajes a gran escala

Autores/as

DOI:

https://doi.org/10.5281/zenodo.13946404

Palabras clave:

habilidades cognitivas, procesamiento de lenguaje natural, LLM, MSC 68-11, MSC 68T30, MSC 68T37

Resumen

Se presenta un análisis exhaustivo del concepto de inteligencia humana y su relación con el desarrollo de la Inteligencia Artificial, haciendo una conexión entre la evolución de la misma y la imitación de las capacidades cognitivas humanas mediante la evaluación de los Modelos de Lenguajes a Gran Escala (LLM). La investigación se enfoca en la importancia de evaluar las habilidades cognitivas de los LLM. Se identifica la falta de conjuntos de datos, suficientemente variados, para hacer esto, y la necesidad de una base de datos, lo suficientemente exhaustiva, para hacerlo con la calidad requerida. Por tanto, se ha diseñado un conjunto de datos que permite la evaluación de las capacidades cognitivas de diversos modelos de lenguaje, utilizando solamente el lenguaje natural. Los resultados obtenidos, a partir de la evaluación de las habilidades cognitivas sobre el conjunto de datos creado, proporcionan una visión más detallada acerca de las carencias y fortalezas de los LLM en lo que respecta a las habilidades evaluadas, así como cuál es el mejor modelo para explotar cada habilidad individualmente y en general.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Alfonso, V.C., D.P. Flanagan, and S. Radwan: The impact of the Cattell-Horn-Carroll theory on test development and interpretation of cognitive and academic abilities. In Contemporary intellectual assessment: Theories, tests and issues, pages 185–202. The Guilford Press, New York, NY, US, 2005, ISBN 1-59385-125-1.

AWS, 2023. https://aws.amazon.com/es/what-s/nlp/#:~:text=tareas%20de%20NLP%3F-,%C2%BFQu%C3%A9%20es%20la%20NLP%3F,y%20comprender%20el%20lenguaje%20humano

DataScientest, 2023. https://datascientest.com/es/inteligencia-artificial-definicion.

Excentos, 2023. https://documentation.excentos.com/display/WORKBENCH/Boolean+Question.

Flanagan, D.P., V.C. Alfonso, S.O. Ortiz, and A.M. Dynda: Integrating Cognitive Assessment in School Neuropsychological Evaluations. In Best Practices in School Neuropsychology: Guidelines for Effective Practice, Assessment, and Evidence-Based Intervention, pages 101–140. John Wiley & Sons, Inc., Hoboken, NJ, US, 2012, ISBN 9780470422038.

Hitch, 2023. https://hello.gethitch.ai/blog/importancia-evaluar-habilidades-//cognitivas-candidatos/#predice-el-rendimiento.

Horn, J.L. and N. Blankson: Foundations for better understanding of cognitive abilities. In Contemporary Intellectual Assessment: Theories, Tests, and Issues, pages 41–68. The Guilford Press, New York, NY, US, 2005, ISBN 1593851251.

IBM, 2022. https://www.ibm.com/es-es/topics/chatbots.

McGrew, K.S.: The Cattell-Horn-Carroll theory of cognitive abilities: Past, present, and future. New York, NY: Guilford Press, 2nd ed., pp. 136–182, 2005.

Pérez Porto, J. y A. Gardey, 2022. https://definicion.de/trivia/.

Pérez Porto, J. y M. Merino, 2023. https://definicion.de/test-de-inteligencia/.

Roch, E., 2023. https://lovtechnology.com/que-es-llm-large-language-model-//como-funcionan//-y-para-que-sirven/.

Schneider, W.J. and K.S. McGrew: The Cattell-Horn-Carroll model of intelligence. In Contemporary intellectual assessment: Theories, tests, and issues, 3rd ed., pages 99–144. The Guilford Press, New York, NY, US, 2012, ISBN 978-1-60918-995-2.

Sternberg, R.J.: A theory of adaptive intelligence and its relation to general intelligence. Journal of Intelligence, 7(4):23, 2019. https://doi.org/10.3390/jintelligence7040023.

Wiki, 2023. https://es.wikipedia.org/wiki/Aprendizaje_autom%C3%A1tico.

Descargas

Publicado

2024-10-17 — Actualizado el 2024-11-24

Versiones

Cómo citar

[1]
Talavera Díaz, K. et al. 2024. Evaluación de habilidades cognitivas de diversos modelos de lenguajes a gran escala. Ciencias matemáticas. 37, 1 (nov. 2024), 51–56. DOI:https://doi.org/10.5281/zenodo.13946404.

Número

Sección

Artículo Original