Research article
Revisión de algoritmos de Redes Neuronales en dos herramientas de Minería de Datos
Review of Neural Network algorithms in two Data Mining tools
Araujo , María Itati ⓘ
Facultad de Ciencias Exactas y Naturales y Agrimensura.
Departamento de Informática. Corrientes, Argentina
Ferrari Alve, Santiago Iván ⓘ
Departamento de Informática.
Facultad de Ciencias Exactas y Naturales y Agrimensura.
Universidad Nacional del Nordeste
Mariño, Sonia I. ⓘ
Departamento de Informática.
Facultad de Ciencias Exactas y Naturales y Agrimensura,
Universidad Nacional del Nordeste. Corrientes, Argentina
Resumen
El artículo aborda de la revisión de los algoritmos de ARN incorporado a dos software de minería de datos de código abierto. La obra consta de secciones. La primera sección expone conceptos fundamentales. La segunda sección menciona la metodología aplicada. la tercera sección resume los algoritmos integrados en las herramientas y los parámetros para el modelado. Finalmente, algunas consideraciones se incluyen.
Abstract
The article deals with the revision of the RNA algorithms incorporated two data mining software open source. The work consists of sections. The first section presents fundamental concepts. The second section outlines the methodology applied. The next section summarizes the algorithms built into the tools and parameters for modeling. Finally, some considerations are included.
Palabras Clave:
Sistema Inteligente, Paradigma Conexionista, Software Libre
Keyword:
Intelligent System, Connectionist Paradigm, Free Software
Introducción
Las áreas de la Inteligencia Artificial (IA) intentan simular las actividades cognitivas complejas que caracterizan a los seres humanos mediante el empleo de los sistemas informáticos, para lograr mayor aplicabilidad de las computadoras en las tareas humanas. Estos sistemas son denominados inteligentes atendiendo a las tecnologías de la IA que incorporan.
Una Red Neuronal Artificial (RNA) es un modelo computacional que consta de varias neuronas o unidades sencillas que trabajan en paralelo y en donde las conexiones entre las unidades tienen pesos numéricos que representan el aprendizaje, que el algoritmo o método matemático puede modificar (Mariño, 2011). Es un dispositivo que intenta imitar las sinapsis que conectan las neuronas biológicas, mediante la asignación de umbrales de excitación a las unidades que componen la red neuronal, y de pesos a las conexiones que se establecen entre ellas y que valoran su importancia.
Las RNA constituyen un paradigma computacional alternativo denominado paradigma conexionista. La forma de resolver un problema utilizando alguno de los paradigmas convencionales, puede resumirse en modelar matemáticamente el problema en cuestión y luego formular un programa que permite resolverlo (Sierra Sosa, 2007).
Las modelos de RNA se construyen estructurando en una serie de niveles o capas (al menos tres: entrada, procesamiento u oculta y salida) compuestas por nodos o "neuronas" (López Molina. et. al. 2006), presentando la estructura ilustrada en la Fig. 1.
Fig. 1. Estructura de una neurona |
Estos modelos son ampliamente empleados en una diversidad de problemas vinculados a la economía, a las finanzas. En economía difundieron el enfoque de RNA White (1992) y Kuan y White (1994). A modo de ejemplo se mencionan los trabajos de López González y Flórez López (2000), Sanchez (2003), Ayala (2008), Aristizabal (2006)
Modelos de RNA
En este punto se describe la estructura genérica de una neurona artificial en el marco establecido por el grupo PDP (Parallel Distributed Processing Reasearch Group), donde afirman que un sistema neuronal o conexionista, está compuesto por los siguientes elementos:
- Un conjunto de procesadores elementales o neuronas artificiales.
- Un patrón de conectividad y arquitectura.
- Una dinámica de activaciones.
- Una regla o dinámica de aprendizaje.
- Entorno donde opera.
Pueden distinguirse dos métodos de aprendizaje importantes:
- Aprendizaje supervisado: donde se necesita un conjunto de datos de entrada previamente clasificada o cuya respuesta objetivo se conoce. Ejemplos de este tipo de redes son las denominadas Backpropagation , Hopfiel, Bottzmann.
- Aprendizaje no supervisado: no requiere un conjunto previo. Ejemplos de este tipo de redes son: Art1, Art2, Self-organizing, Kohonen.
En referencia a la ley de aprendizaje de los modelos de RNA, es importante la forma en que éstos almacenan la información en su memoria distribuida. Se denomina aprendizaje al proceso que consiste en almacenar la información en los pesos de las conexiones.
Los modelos de RNA generan su propio conocimiento aprendiendo de los patrones o ejemplos proporcionados.
El aprendizaje se logra mediante reglas que modifican o adaptan iterativamente los pesos de las conexiones de la red en respuesta a los ejemplos de entrada dados y, opcionalmente, a la salida deseada para esas entradas, de modo que las redes entrenadas puedan desarrollar ciertas tareas.
Finalmente también se pueden clasificar las RNA según sean capaces de procesar información de distinto tipo en:
- Valores de entradas binarias: procesan datos de entrada de naturaleza discreta; habitualmente valores lógicos booleanos.
- Valores de entrada continuos: procesan datos de entrada con valores continuos y, habitualmente, acotados.
Minería de datos
La Minería de Datos (MD) (Cervantes, et. al, 2010; Britos et al., 2005) es el proceso de descubrimiento de nuevas y significativa relaciones, patrones y tendencias al examinar grandes cantidades de datos.
En Lorenzo Montero (Lorenzo Montero, 2008) se define la Minería de Datos como una nueva tecnología de manejo y análisis de información que aprovecha la capacidad existente de procesamiento, almacenamiento y transmisión de datos a gran velocidad y bajo costo. Permite encontrar el conocimiento contenido en las inmensas cantidades de información para luego tomar decisiones mejor fundamentadas para el futuro de una organización.
El datamining (minería de datos), es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto.
Herramientas de RNA
Existe una diversidad de herramientas de software desarrollado bajo licencia GPL (Licencia Pública General), como las que se detallan a continuación: WEKA, RapidMiner, Tanagra, Pentaho, Kxen, Orange, SSPS Clementine, Statistica, entre otros.
En este trabajo, se estudiaron distintos modelos de RNA incorporados para el tratamiento inteligente de datos en las herramientas RapidMiner y Weka.
RapidMiner (antes conocido como YALE –Yet Another Learning Environment) es una herramienta de aprendizaje automático, basada en Java y modular, con soporte de procesos de Minería de Datos. Cuenta con una interfaz de usuario amigable que permite encadenar los operadores (o módulos) para realizar las tareas de análisis de datos. Además, es una plataforma libre (open-source) y gratuita.
WEKA es una herramienta de aprendizaje automático, data mining, desarrollada en la Universidad de Waikato. Es un software programado en Java orientado a la extracción de conocimientos desde bases de datos con grandes cantidades de información.
Metodología
La metodología adoptada para el desarrollo del trabajo constó de las siguientes etapas:
Seleccionar herramientas de Minería de Datos que incorporen algoritmos para desarrollar modelos RNA como una tecnología inteligente.
Identificar los modelos de RNA presentes en las herramientas.
Determinar los parámetros facilitados por las herramientas para modelizar RNA.
Sistematizar la información localizada.
Resultados
Se evaluó la presencia de algoritmos para implementar modelos de RNA en las herramientas RapidMiner y Weka. En la Tabla 1, la “x” indica el modelo disponible en la herramienta.
Tabla 1. Modelos de RNA y su presencia en las herramientas.
Modelos |
RapidMiner | Weka |
Kohonen |
x |
x |
Backpropagation |
x |
x |
Art 1 |
x |
|
Art 2 |
x |
|
Self-Organization |
x |
|
Hopfield |
x |
Uno de los elementos que determinan la elección de un modelo de RNA son los parámetros y los valores definidos por el diseñador. En la Tabla 2 se sintetizan los parámetros contemplados conceptualmente en los distintos algoritmos, indicándose con “x” en la celda correspondiente.
Tabla 2. Parámetros disponibles en los modelos de RNA
Algoritmos |
Parámetros |
||||
Números de capas ocultas | Números de Neuronas en la capa oculta | Números de variable en la capa de entrada | Máximo número de iteraciones | Función de Vecindad | |
Backpropagation |
x |
X |
x |
x |
|
Kohonen |
x |
X |
|||
Art1 |
x |
||||
Art 2 |
x |
||||
Self-Organization |
x |
||||
Hopfield |
x |
La construcción de un modelo de RNA se basa en un enfoque experimental, en decir, la elección de la arquitectura y topología que mejor representará el problema es estudio. En las Tablas 3 a 7se presenta una síntesis de los parámetros configurables en distintos algoritmo para la simulación de modelos de RNA indicándose con “x” la disponibilidad de los mismos en las herramientas elegidas,
Tabla 3. Parámetros disponibles en las herramientas de MD configurable en el algoritmo Backpropagation
Algoritmo Backpropagation | Weka | RapidMiner |
Números de capas ocultas |
x |
x |
Número de neuronas por capa |
x |
x |
Función de activación o transferencia en cada capa oculta |
x |
|
Función de activación o transferencia en la capa de salida |
x |
|
Función de transferencia Escalón |
x |
x |
Función de transferencia Sigmoidal [-1; 1] |
x |
x |
Error |
x |
x |
Máximo número de iteraciones |
x |
x |
Semilla para generar números aleatorios |
x |
|
Factor de actualización de los pesos (momentum) |
x |
x |
Construcción automática de un modelo |
x |
|
Razón de aprendizaje |
x |
x |
Tabla 4.. Parámetros disponibles en las herramientas de MD para configurar el algoritmo Kohonen
Algoritmo Kohonen |
WEKA |
RapidMiner |
Numero de variable en la capa de entrada |
x |
x |
Razón de aprendizaje |
x |
x |
N° de Iteraciones |
x |
x |
Factor de actualización de los pesos |
x |
x |
Tabla 5. Parámetros disponibles en las herramientas de MD para configurar el algoritmo ART 1
Algoritmo ART 1 | WEKA |
RapidMiner |
Factor de actualización de los pesos |
x |
x |
Parámetro de vigilancia |
x |
|
Numero de variable en la capa de entrada |
x |
x |
N° de iteraciones |
x |
x |
Tabla 6. Parámetros disponibles en las herramientas de MD para configurar el algoritmo ART 2
Algoritmo ART 2 | WEKA | RapidMiner |
Factor de actualización de los pesos |
x |
x |
Parámetro de vigilancia |
x |
|
N° de Iteraciones |
x |
x |
N° de variable en la capa de entrada |
x |
x |
Tabla 7. Parámetros disponibles en las herramientas de minería de datos para configurar el algoritmo Hopfield
Algoritmo Hopfield |
WEKA |
RapidMiner |
Factor de actualización de los pesos |
x |
X |
Función de transferencia Sigmoidal [0,1] |
x |
|
Función de transferencia Hiperbólica [-1,1] |
x |
|
N° de variable en la capa de entrada |
x |
X |
Función de activación |
x |
|
Razón de aprendizaje |
x |
X |
Discusión
Desde un punto de vista metodológico, los modelos de Redes Neuronales Artificiales resultan de suma utilidad en el estudio de los fenómenos de comportamiento tanto individuales como sociales, los cuales están determinados en la mayoría de casos por multitud de factores conocidos y desconocidos, pudiéndose establecer interacciones complejas entre las variables implicadas. Por otra parte, las RNA se utilizan como herramientas de predicción, de clasificación y también de explicación, pudiéndose cuantificar la contribución de cada variable de entrada sobre el valor predicho por la red neuronal. Lo expuesto indica la necesidad de conocer las herramientas de software que los incorporan, los algoritmos comprendidos en esta tecnología inteligente, los parámetros disponibles que guíen su elección.
Conclusión
Se presentó un estudio de dos herramientas GPL o Licencia Publica General desarrolladas como artefactos software de Minería de Datos que incorporan modelos de RNA.
Disponer de información preliminar que apoye la toma de decisiones y oriente la elección de una herramienta para construir modelos de RNA es fundamental, especialmente para los diseñadores noveles. Estos requieren disponer de una diversidad de parámetros mediante los cuales se puedan establecer los valores de los mismos hasta localizar aquel modelo que mejor represente el problema en estudio.
El mencionado trabajo también podría utilizarse como información básica en un curso introductorio de tecnologías conexionistas inteligentes.
Bibliografía - Bibliography
Cervantes Macias A, López Galindo V. Minería de datos. 2010.
Lorenzo Montero. J. M. Mineria de datos. (2008). Técnicas y procedimientos. ISBN: 978-84-9732492-2.
Google Scholar Index
Article
Revisión de algoritmos de Redes Neuronales en dos herramientas de Minería de Datos
Publisher: