Sistemas inteligentes y sus sociedades Walter Fritz

 

english            

Investigación actual

El General Learner 3

(estado 1. Julio 2005)

 

El autor ha agregado esta página al libro electrónico, ya que puede ser de interés y ayuda a otros que trabajan en la misma dirección.

Actualmente el esta construyendo el "General Learner 3" (GL 3). Este programa es un cerebro artificial, que no solamente determina sus acciones externas por reglas, sino también usa reglas internas para procesar la información entrante y la selección de la acción a hacer. El GL 3 mismo puede cambiar y posiblemente mejorar estas reglas mientras corre.

Reglas externas se usan para reaccionear externamente ante una situación del entorno. El GL3 usa reglas internas para lograr las funciones del cerebro.
Esta auto modificación es muy importante, ya que permite que el cerebro continua mejorándose, posiblemente llegando a niveles de inteligencia que no podríamos programar.
Pero por eso es también de la mayor importancia que mantengamos el control sobre el programa. Vea: La válvula de seguridad (Para leer de corrido, no entre aquí ahora).

 

Para leer de corrido, como un libro - continua aquí

Pensamientos teóricos sobre inteligencia
El "General Learner" anterior
¿Que hay de nuevo en el GL 3 ?
¿Como hace el GL 3 para aprender nuevas reglas de procesamiento interno?
Comparación con redes neuronales
Observaciones finales

 

Pensamientos teóricos sobre inteligencia
Hablando muy en general, podemos decir que la actividad del cerebro, biológico o artificial, es descubrir, almacenar y usar patrones.

Aprender, en el cerebro artificial, básicamente es encontrar patrones dentro de la información que entra por los sentidos y también dentro de las salidas (la actuación). Dichos patrones son conceptos recién creados.
Además, aprender es encontrar patrones entre entrada y salida. Estas son reglas de actuación recién creadas. Las reglas de actuación son similares a las "producciones" usadas en sistemas expertos. También tienen una entrada y muestran la salida correspondiente. La diferencia de las reglas de actuación con las producciones es que las reglas de actuación no tienen la entrada y la salida expresadas con palabras sino con conceptos, que pueden ser aprendidos por el programa mismo.
Finalmente el cerebro usa patrones cuando decide que conviene hacer en una situación dada.

 

El "General Learner" anterior
El "General Learner" anterior tomaba las sensaciones y después buscaba reglas de actuación, correspondientes a las sensaciones. Este proceso lo hizo el programa, las funciones de lenguaje C. Como vamos a ver, en el "General Learner 3" esta actividad la hacen las reglas de actuación.

El General Learner tenia sentidos (la entrada), un "cerebro central" (la principal arquitectura cognitiva) y actuadores (la salida). Los sentidos traen informaciones del entorno y los envían al "cerebro central" como sensaciones elementales. Las actuadores reciben acciones elementales del "cerebro central" y las hacen.

El "cerebro central" no tiene manera de saber qué es lo que significan los bytes de entrada y salida para las personas. Su objetivo principal es agradar a la persona que maneja la computadora. La persona expresa su aprobación o desaprobación con las teclas de flecha hacia arriba o hacia abajo.
El cerebro central observa continuamente su entorno y recuerda las acciones hechas por el y las hechas por la persona. Busca patrones entre partes del entorno y estas acciones y los recuerda como reglas de actuación. También puede aprender conceptos abstractos como "vertical", si le dibujamos en la pantalla de la computadorea ejemplos de lineas horizontales, inclinados y verticales.
Ver detalles en General Learner (Para leer de corrido, no entre aquí ahora).

 

¿Que hay de nuevo en el General Learner 3 ? (GL 3 )
Antes eran aprendidas solamente las acciones que eran convenientes en cierta situación. Ahora, adicionalmente, el GL 3 aprende a pensar (aprende mejores procesos para el "cerebro central"). Aquí "mejor" quiere decir que el proceso resulta más veces en acciones adecuadas.
Previamente la función del "cerebro central" fue hecha por funciones de lenguaje C. Ahora, estas funciones las hacen reglas de actuación, y los detalles de estas reglas los puede modificar el GL 3 mismo.

En el GL 3 una regla de actuación tiene varias partes. Una parte es la situación actual (sit1) a la cual la regla es aplicable. Otra es la situación futura (FS) que resulta de la aplicación de la regla. Es la situación objetivo.
La parte que antes se llamaba acción de la regla, ahora se llama "intSit ". Allí se indica la situacion intermedia a la cual hay que llegar con reglas de menor nivel, para lograr la FS. Todas estas partes se expresan con conceptos.

No hay una estructura de reglas fijas, ni en el momento de arrancar el programa. GL 3 crea la situación actual interna. También tiene la situación objetivo, ambas expresadas con conceptos. El GL 3 busca reglas que satisfacen tanto la situación presente como la situación futura y las ejecuta.

Reglas y conceptos contienen una variable de valor. Esta aumenta cuando la regla y sus conceptos forman parte de una cadena de reglas que tuvo éxito.

Sensaciones elementales y acciones elementales ahora se llaman reglas elementales, no conceptos elementales (porque ambas realmente son actividades).

Antes de arrancar el programa, el programador provee una cantidad de reglas de actuación elementales. Cada regla elemental interna contiene la parte "intSit " vacia. Asi que las reglas elementales contienen la sit1 a la cual son aplicables, una IntSit vacia y la FS (la situacion futura resultante).

Aprobación y desaprobación
La actividad de manejar la aprobación y desaprobación dada por la persona, sigue siendo una función de lenguaje C y no puede ser modificada por el cerebro del GL 3. Esto es muy importante, porque de otra manera se pierde el control sobre el objetivo principal y con eso sobre las acciones del programa. Una función del programa en lenguaje C recibe la evaluación de la persona y la ajusta acorde a todas las reglas recientemente usadas, tanto internas como externas.

Posibles Aplicaciones
Conversación en ingles (o español) con alguna persona, y jugar juegos de tablero en la pantalla. Futuras aplicaciones podrían incluir traducciones del inglés al castellano, servir como mente de un robot, o escribir programas en lenguaje C, una vez dada las entradas y salidas requeridas.

Para más detalles ver El "General Learner 3" (Entre para leer de corrido, como un libro).

 

¿Como hace el GL 3 para aprender
nuevas reglas de procesamiento interno?

Las reglas externas son reglas que responden a una situación externa e indican lo que conviene hacer en el entorno. Estas reglas ya fueron aprendidas por experiencia por el GL anterior. También el GL anterior hizo abstracciones de ellas y las generalizó, para así obtener reglas aplicables a más casos.

Por el otro lado, las reglas internas son las que hacen el procesamiento interno del cerebro. Estas responden a una situación interna y tratan de llegar a una situación interna futura.

El GL anterior pudo aprender reglas externas pero no tenía reglas internas. El procesamiento de las reglas internas lo hacía parte del programa en lenguaje C.

La diferenciación entre las reglas de actuación externas e internas es algo arbitrtario, ya que ambos tienen la misma forma y se usan de la misa manera, pero no para un mismo fin.

Parece que el aprendizaje de reglas internas debería ser como el de reglas externas. Ahora el programa debería observar la situación interna, la situación objetiva y la acción a hacer. De estos elementos debería construir las reglas de actuación internas.

También el GL 3 usa su juego inicial de reglas internas. El GL 3 observa estos y busca casos donde el FS de una es igual al sit1 de otra. De estas dos arma una regla combinada, dejando las situacion comun en el lugar intSit.

Aprende del efecto de estas regla. Adeas, como en el GL previo, el GL3 puede abstraer y generalizar, y asi crear nuevas reglas internas. Lo importante es que el GL 3 crea reglas nuevas a base de reglas de más bajo nivel e inicialmente a base de reglas elementales.

Para más detalle sobre el aprendizaje de reglas vea GL 3 Aprendiendo Reglas (Entre para leer de corrido, como un libro).

 

Comparación con redes neuronales
Como cada regla cumple la función de una red neuronal, el GL3 contiene el equivalente de 20 00 redes neuronales. Cada regla recibe entradas y da salidas de otras reglas. Esto es equivalente de 20 00 redes neuronales interconectadas recibiendo entradas y dando salidas entre si.
El GL3 crea reglas cuando es necesario. Esto es equivalente a crear nuevas redes neuronales en esta gran red que conecta redes neuronales.

 

Observaciones finales
Lo arriba expuesto es un plan del GL 3, que está en construcción. Normalmente, cuando se ejecuta un plan, habrá que hacer cambios. Este probablemente también va a ser el caso con el plan para el GL 3.
Se verá, si el GL 3, al producir nuevas reglas, puede realmente mejorar el funcionamiento del sistema. Me parece que esto es probable, pero solamente se puede comprobarlo construyendo el sistema, experimentando con el y modificándolo.

Actualmete el GL 3 anda bien en estado "despierto" (de actividad exterior). El estado "dormido", (la revision interior de la memoria y la construccción de reglas nuevas) esta hecho aproximadamente en un 20%. El programa construye bien las reglas combinadas a partir de reglas elementales y los usa para lograr actividades exteriorers. Pero las reglas elementales todavia son demasiado "macro", y tienen que ser desmenuzado mas (dividido en reglas mas chicas).

Es muy importante e inusual que un programa pueda aprender nuevos métodos para "pensar"; nuevos métodos para procesar la información entrante y elegir una acción conveniente.

Si te gustó esta página, hazme un favor: cuéntaselo a tus amigos.
El autor apreciaría recibir tus comentarios y sugerencias.

 

Para leer de corrido, como un libro - continua aquí
Saltar al inicio de este documento /Programas de inteligencia artificial que son sistemas inteligentes completos /Robby, el robot casero /contenido del libro electrónico.


Ultimo cambio: 7 Mar. 06 / Walter Fritz
Copyright © New Horizons Press