Evaluación del algoritmo de clasificación basado en reglas JRip para datos standard y desbalanceados

Autores/as

  • Laidy De Armas Jacomino Facultad de Ciencias Informáticas, Universidad de Ciego de Ávila Máximo Gómez Baéz, Ciego de Ávila, Cuba
  • Danilo Valdes Ramirez Facultad de Ciencias Informáticas, Universidad de Ciego de Ávila Máximo Gómez Baéz, Ciego de Ávila, Cuba

Palabras clave:

Clasificación, datos desbalaceados, JRip, datos con ruido, reglas, valores perdidos

Resumen

Las t écnicas de minería de datos se usan en el aprendizaje automatizado de máquinas desde hace varios años para inferir conocimientos a partir de las informaciones almacenadas en empresas e instituciones. Algunas de estas t écnicas más usadas son la clasificación, regresión, agrupamiento, etc. La clasificación supervisada tiene el objetivo de asignar objetos a clases predefinidas a partir de un grupo de objetos previamente almacenados que ya están clasificados. Existen para tareas de clasificación diversos algoritmos, estos se agrupan usualmente en familias atendiendo a la forma de representar el conocimiento que extraen de los datos. Las reglas de decisión son una forma de representación del conocimiento muy usada cuando se quiere que los usuarios entiendan los resultados obtenidos. El presente estudio tiene como objetivo evaluar el comportamiento del algoritmo de clasificación basado en reglas JRip para problemas de clasificación standard y desbalanceados. Este algoritmo es comparado además con otros tres de su familia Ridor, DecisionTable y OneR. Para la evaluación experimental se usa la validación cruzada y para analizar los resultados obtenidos de la misma el test de Friedman y el test post-hoc Finner. Se presentan y discuten los resultados obtenidos de las evaluaciones para los diferentes tipos de problemas de clasificación de minería de datos.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Rafael Esteban Bello Perez, Zoila Zenaida Garcia Valdivia, Maria Matilde Garcia Lorenzo, and Antonio Reynoso Lobato. Aplicaciones de la Inteligencia Artificial. México, segunda edition, 2002. (document), 2

William W. Cohen. Fast Effective Rule Induction. pages 115–123, 1995. 1

Janez Demsar. Statistical comparisons of classifiers over multiple data sets. Journal of Machine Learning Research, (7):1–30, 2006. 2

Manuel Fernández-Delgado, Eva Cernadas, Senén Barro, and Dinami Amorim. Do we Need Hundreds of Classifiers to Solve RealWorld Classification Problems? Journal of Machine Learning Research, 15:3133–3181, 2014. (document)

Brian R. Gaines and Paul Compton. Induction of Ripple-Down Rules Applied to Modeling Large Databases. Journal of Inteligent Information System, 5(3):211–228, 1995. 1

Salvador García, A. Fernández, J. Luengo, and Francisco Herrera. Advanced nonparametric tests for multiple comparisons in the design of experiments in computational intelligence and data mining: Experimental analysis of power. Information Sciences, 180(10):2044–2064, 2010. 2

R. C. Holte. Very simple classification rules perform well on most commonly used datasets. Machine Learning, 11:63–91, 1993. 3

Ron Kohavi. The Power of Decision Tables. pages 174–189, 1995. 2

Carlos Márquez Vera, Cristóbal Romero Morales, and Sebastián Ventura Soto. Predicción del Fracaso Escolar mediante Técnicas de Minería de Datos. IEEE-RITA, 7(3):109–117, 2012. (document)

Dánel Sánchez Tarragó. Pronóstico de supervivencia de infarto cerebral aterotrombótico usando aprendizaje atomatizado. pages 1–11. (document)

V. Veeralakshmi and D. Ramyachitra. Ripple Down Rule learner (RIDOR) Classifier for IRIS Dataset. International Journal of Computer Science Engineering, 4(3), 2015. (document)

Ronald Velandia Ortega and Fredy Hernández Suárez. Evaluación de algoritmos de extracción de reglas de decisión para el diagnóstico de huecos de tensión. Ingeniero electricista, Universidad industrial de Santander, Bucaramanga, 2010. (document)

W. Nor Haizan W. Mohamed, Mohd Najib Mohd Salleh, and Abdul Halim Omar. A Comparative Study of Reduced Error Pruning Method in Decision Tree Algorithms. Penang, Malaysia, 2012. (document)

Ian H. Witten, Eibe Frank, and Mark A. Hall. Data Mining. Practical Machine Learning Tools and Techniques. (document)

Descargas

Publicado

2017-12-01

Cómo citar

[1]
De Armas Jacomino, L. y Valdes Ramirez, D. 2017. Evaluación del algoritmo de clasificación basado en reglas JRip para datos standard y desbalanceados. Ciencias matemáticas. 31, 2 (dic. 2017), 133–141.

Número

Sección

Artículo Original