Research article

 

Revisión de algoritmos de Redes Neuronales
en dos herramientas de Minería de Datos

 

María Itati Araujo
Facultad de Ciencias Exactas y Naturales y Agrimensura.
Departamento de Informática. Corrientes, Argentina

itafull@hotmail.com

Santiago Iván Ferrari Alve
Facultad de Ciencias Exactas y Naturales y Agrimensura.
Departamento de Informática. Corrientes, Argentina

ferrari_ivan88@hotmail.com

Sonia I. Mariño
Facultad de Ciencias Exactas y Naturales y Agrimensura.
Universidad Nacional del Nordeste.Corrientes, Argentina.

simarinio@yahoo.com

 

Resumen

El artículo aborda de la revisión de los algoritmos de ARN incorporado a dos software de minería de datos de código abierto. La obra consta de secciones. La primera sección expone conceptos fundamentales. La segunda sección menciona la metodología aplicada. la tercera sección resume los algoritmos integrados en las herramientas y los parámetros para el modelado. Finalmente, algunas consideraciones se incluyen.


Palabras Clave: Sistema Inteligente, Paradigma Conexionista, Software Libre, RapidMiner, WEKA

 

Review of Neural Network algorithms
in two Data Mining tools

Abstract

The article deals with the revision of the RNA algorithms incorporated two data mining software open source. The work consists of sections. The first section presents fundamental concepts. The second section outlines the methodology applied. The next section summarizes the algorithms built into the tools and parameters for modeling. Finally, some considerations are included.


Key-words: Intelligent System, Connectionist Paradigm, Free Software

Introducción

Las áreas de la Inteligencia Artificial (IA) intentan simular las actividades cognitivas complejas que caracterizan a los seres humanos mediante el empleo de los sistemas informáticos, para lograr mayor aplicabilidad de las computadoras en las tareas humanas. Estos sistemas son denominados inteligentes atendiendo a las tecnologías de la IA que incorporan.

Una Red Neuronal Artificial (RNA) es un modelo computacional que consta de varias neuronas o unidades sencillas que trabajan en paralelo y en donde las conexiones entre las unidades tienen pesos numéricos que representan el aprendizaje, que el algoritmo o método matemático puede modificar (Mariño, 2011). Es un dispositivo que intenta imitar las sinapsis que conectan las neuronas biológicas, mediante la asignación de umbrales de excitación a las unidades que componen la red neuronal, y de pesos a las conexiones que se establecen entre ellas y que valoran su importancia.

Las RNA constituyen un paradigma computacional alternativo denominado paradigma conexionista. La forma de resolver un problema utilizando alguno de los paradigmas convencionales, puede resumirse en modelar matemáticamente el problema en cuestión y luego formular un programa que permite resolverlo (Sierra Sosa, 2007).

Las modelos de RNA se construyen estructurando en una serie de niveles o capas (al menos tres: entrada, procesamiento u oculta y salida) compuestas por nodos o "neuronas" (López Molina. et. al. 2006), presentando la estructura ilustrada en la Fig. 1.

 

Fig. 1. Estructura de una neurona

 

Estos modelos son ampliamente empleados en una diversidad de problemas vinculados a la economía, a las finanzas. En economía difundieron el enfoque de RNA White (1992) y Kuan y White (1994). A modo de ejemplo se mencionan los trabajos de López González y Flórez López (2000), Sanchez (2003), Ayala (2008), Aristizabal (2006)

Modelos de RNA

En este punto se  describe la estructura genérica de una neurona artificial en el marco establecido por el grupo PDP (Parallel Distributed Processing Reasearch Group), donde afirman que un sistema neuronal o conexionista, está compuesto por los siguientes elementos:

  • Un conjunto de procesadores elementales o neuronas artificiales.
  • Un patrón de conectividad y arquitectura.
  • Una dinámica de activaciones.
  • Una regla o dinámica de aprendizaje.
  • Entorno donde opera.

Pueden distinguirse  dos métodos de aprendizaje importantes:

  • Aprendizaje supervisado: donde se necesita un conjunto de datos de entrada previamente clasificada o cuya respuesta objetivo se conoce. Ejemplos de este tipo de redes son las denominadas Backpropagation , Hopfiel, Bottzmann.
  • Aprendizaje no supervisado:  no requiere un conjunto previo. Ejemplos de este tipo de redes son: Art1, Art2, Self-organizing, Kohonen.

En referencia a la ley de aprendizaje de los modelos de RNA, es importante la forma en que éstos almacenan la información en su memoria distribuida. Se denomina aprendizaje al proceso que consiste en almacenar la información en los pesos de las conexiones.

Los modelos de RNA generan su propio conocimiento aprendiendo de los patrones o ejemplos proporcionados. 

El aprendizaje se logra mediante reglas que modifican o adaptan iterativamente los pesos de las conexiones de la red en respuesta a los ejemplos de entrada dados y, opcionalmente, a la salida deseada para esas entradas, de modo que las redes entrenadas puedan desarrollar ciertas tareas.

 

Finalmente también se pueden clasificar las RNA según sean capaces de procesar información de distinto tipo en:

  • Valores de entradas binarias: procesan datos de entrada de naturaleza discreta; habitualmente valores lógicos booleanos.
  • Valores de entrada continuos: procesan datos de entrada con valores continuos y, habitualmente, acotados.

Minería de datos

La Minería de Datos (MD) (Cervantes, et. al, 2010; Britos et al., 2005) es el proceso de descubrimiento de nuevas y significativa  relaciones, patrones y tendencias al examinar grandes cantidades de datos.

En Lorenzo Montero (Lorenzo Montero, 2008) se define la Minería de Datos como una nueva tecnología de manejo y análisis de información que aprovecha la capacidad existente de procesamiento, almacenamiento y transmisión de datos a gran velocidad y bajo costo. Permite encontrar el conocimiento contenido en las inmensas cantidades de información para luego tomar decisiones mejor fundamentadas para  el futuro de una organización.

El datamining (minería de datos), es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto.

Herramientas de RNA

Existe una diversidad de herramientas de software desarrollado bajo licencia GPL (Licencia Pública General), como las que se detallan a continuación: WEKA, RapidMiner, Tanagra, Pentaho, Kxen, Orange, SSPS Clementine, Statistica, entre otros.

En este trabajo, se estudiaron distintos modelos de RNA incorporados para el tratamiento inteligente de datos en las herramientas RapidMiner y Weka.

RapidMiner (antes conocido como YALE –Yet Another Learning Environment) es una herramienta de aprendizaje automático, basada en Java y modular, con soporte de procesos de Minería de Datos. Cuenta con una interfaz de usuario amigable que permite  encadenar los operadores (o módulos) para realizar las tareas de análisis de datos. Además, es una plataforma libre (open-source) y gratuita.

WEKA es una herramienta de aprendizaje automático, data mining, desarrollada en la Universidad de Waikato. Es un software programado en Java orientado a la extracción de conocimientos desde bases de datos con grandes cantidades de información.

Metodología

La metodología adoptada para el desarrollo del trabajo constó de las siguientes etapas:

Seleccionar herramientas de Minería de Datos que incorporen algoritmos para desarrollar modelos RNA como una tecnología inteligente.

Identificar los modelos de RNA presentes en las herramientas.

Determinar los parámetros facilitados por las herramientas para modelizar RNA.

Sistematizar la información localizada.

Resultados

Se evaluó la presencia de algoritmos para implementar modelos de RNA en las herramientas RapidMiner y Weka. En la Tabla 1, la “x” indica el modelo disponible en la herramienta.

 

Tabla 1. Modelos de RNA y su presencia en las herramientas.

Modelos

RapidMiner Weka

Kohonen

x
x

Backpropagation

x
x

Art 1

x

Art 2

x

Self-Organization

x

Hopfield

x

 

Uno de los elementos que determinan la elección de un modelo de RNA son los parámetros y los valores definidos por el diseñador. En la Tabla 2 se sintetizan los parámetros contemplados conceptualmente en los distintos algoritmos, indicándose con “x” en la celda correspondiente.

 

Tabla 2. Parámetros disponibles en los modelos de RNA

Algoritmos

Parámetros

Números de capas ocultas Números de Neuronas en la capa oculta Números de variable en la capa de entrada Máximo número de iteraciones Función de Vecindad

Backpropagation

x
X
x
x

Kohonen

x
X

Art1

x

Art 2

x

Self-Organization

x

Hopfield

x

 

La construcción de un modelo de RNA se basa en un enfoque experimental, en decir, la elección de la arquitectura y topología que mejor representará el problema es estudio. En las Tablas 3 a 7se presenta una síntesis de los parámetros configurables en distintos algoritmo para la simulación de modelos de RNA indicándose con “x” la disponibilidad de los mismos en las herramientas elegidas,


 

Tabla 3. Parámetros disponibles en las herramientas de MD configurable en el algoritmo Backpropagation

Algoritmo Backpropagation Weka RapidMiner

Números de capas ocultas

x
x

Número de neuronas por capa

x
x

Función de activación o transferencia en cada capa oculta

x

Función de activación o transferencia en la  capa de salida

x

Función de transferencia Escalón

x
x

Función de transferencia Sigmoidal  [-1; 1]

x
x

Error

x
x

Máximo número de iteraciones

x
x

Semilla para generar números aleatorios

x

Factor de actualización de los pesos

(momentum)

x
x

Construcción automática de un modelo

x

Razón de aprendizaje

x
x

 

Tabla 4.. Parámetros disponibles en las herramientas de MD para configurar el algoritmo Kohonen

Algoritmo Kohonen

WEKA

RapidMiner

Numero de variable en la capa de entrada

x
x

Razón de aprendizaje

x
x

N° de Iteraciones

x
x

Factor de actualización de los pesos

x
x

 

Tabla 5. Parámetros disponibles en las herramientas de MD para configurar el algoritmo ART 1

Algoritmo ART 1
WEKA
RapidMiner

Factor de actualización de los pesos

x
x

Parámetro de vigilancia

x

Numero de variable en la capa de entrada

x
x

N° de iteraciones

x
x

 

Tabla 6. Parámetros disponibles en las herramientas de MD para configurar el algoritmo ART 2

Algoritmo ART 2 WEKA RapidMiner

Factor de actualización de los pesos

x
x

Parámetro de vigilancia

x

N° de Iteraciones

x
x

N° de variable en la capa de entrada

x
x

 

Tabla 7. Parámetros disponibles en las herramientas de minería de datos para configurar el algoritmo Hopfield

Algoritmo Hopfield

WEKA
RapidMiner

Factor de actualización de los pesos

x
X

Función de transferencia Sigmoidal [0,1]

x

Función de transferencia Hiperbólica [-1,1]

x

N° de variable en la capa de entrada

x
X

Función de activación

x

Razón de aprendizaje

x
X

 

Discusión

Desde un punto de vista metodológico, los modelos de Redes Neuronales Artificiales resultan de suma utilidad en el estudio de los fenómenos de comportamiento tanto individuales como sociales, los cuales están determinados en la mayoría de casos por multitud de factores conocidos y desconocidos, pudiéndose establecer interacciones complejas entre las variables implicadas. Por otra parte, las RNA se utilizan como herramientas de predicción, de clasificación y también de explicación, pudiéndose cuantificar la contribución de cada variable de entrada sobre el valor predicho por la red neuronal. Lo expuesto indica la necesidad de conocer las herramientas de software que los incorporan, los algoritmos comprendidos en esta tecnología inteligente, los parámetros disponibles que guíen su elección.

Conclusión

Se presentó un estudio de dos herramientas GPL o Licencia Publica General desarrolladas como artefactos software de Minería de Datos que incorporan modelos de RNA.

Disponer de información preliminar que apoye la toma de decisiones y oriente la elección de una herramienta para construir modelos de RNA es fundamental, especialmente para los diseñadores noveles. Estos requieren disponer de una diversidad de parámetros mediante los cuales se puedan establecer los valores de los mismos hasta localizar aquel modelo que mejor represente el problema en estudio.

El mencionado trabajo también podría utilizarse como información básica en un curso introductorio de tecnologías conexionistas inteligentes.

Bibliografía

Andrada Romero, J; López López, J. D.. Extensión de meta-datos a partir de la información obtenida de minería de texto. Escuela Superior de Informática de Ciudad Real. Universidad de Castilla la Mancha. España. 2009

Andrés Sánchez. J. Dos aplicaciones empíricas de las redes neuronales artificiales a la clasificación y la predicción financiera en el mercado español. RAE: Revista Asturiana de Economía, ISSN 1134-8291, Nº. 28, 2003 , págs. 61-87

Aristizábal. M .C. Evaluación asimétrica de una red neuronal: aplicación al caso de la inflación en Colombia Lecturas de Economía, No. 65. 2006

Ayala, M. Un modelo de predicción para el valor TRM: Un acercamiento desde las redes neuronales artificiales. Escuela de Economía - Universidad Sergio Arboleda, 2008.

Boza Condorena, E. G.. Fecto de la Topologia de Redes Neuronales de Backpropagation en la optimización de procesos químicos via modelos matemáticos neuronales empíricos. Facultad de Ingeniería Química. Universidad Nacional del Altiplano de Puno. 2005

Britos P. V; Garcia Martinez R; Hossian A; Sierra E.. Mineria de Datos basada en Sistemas Inteligentes Editorial Nueva Librería. 2005. ISBN 9789871104307.

Cervantes Macias A, López Galindo V. Minería de datos. 2010.

Kuan, C, H. White. Artificial Neural Networks: An Econometric Perspective.  Econometric Reviews 13, 1-91. 1994.

López González, E; Flórez López. R. Aplicación de dos modelos de redes neuronales artificiales para el análisis económico-financiero empresarial. Revista europea de dirección y economía de la empresa, ISSN 1019-6838, Vol. 9, Nº 2, 2000, págs. 141-166

López Molina, J. M; Herrero García, J.. Técnicas de análisis de datos. Aplicaciones prácticas utilizando Microsoft Excel y Weka. Universidad de Madrid. 2006

Lorenzo Montero. J. M. Mineria de datos. (2008). Técnicas y procedimientos. ISBN: 978-84-9732492-2.

Sierra Sosa. M. C. Inteligencia artificial en la gestión financiera empresarial. Universidad del Norte. Barranquilla. Colombia.2007.  ISSN: 1657-6276.

White, H. Artificial Neural Networks: Approximation and Learning Theory, With A. R. Gallant, Cambridge and Oxford: Blackwell. 1992.

Recibido el: 15-10-2012; Aprobado el: 22-06-2012

Técnica Administrativa
ISSN 1666-1680

http://www.cyta.com.ar -

Vol.:11
Nro.:04
Buenos Aires, 15-10-2012

URL http://www.cyta.com.ar/ta1104/v11n4a1.htm