Practica 4 Agentes deliberativos

Decripción del estado interno del agente.


La base de conocimiento. Almacena todos los hechos que conoce el agente. El campo 'predicados' es un mapa con clave igual al nombre del predicado y valor igual al conjunto de hechos que contiene la base de conocimiento sobre ese predicado. El campo 'reglas' es un vector de reglas que se aplican sobre la base de conocimiento actual, incorporando nuevos hechos.

Percepciones (restringidas a la casilla que ocupa):
* El agente percibe si en su casilla se encuentra el wumpus
* Si los cuadros adyacentes al wumpus, percibe su olor, regresas
* En los cuadros adyacentes a un pozo, percibe la brisa
* Donde está el oro, percibe su brillo
La percepción es representable por 4 sımbolos (peste,brisa,brillo,pozo)
El agente muere si entra en un pozo, u ocupa una casilla en la que está wumpus vivo
¿Cómo llena wall-e esta Base de Conocimiento?
la idea básica es que al estar en cada casilla lo primero que se haga sea notar las percepciones que se tienen, ¿qué hay en esa casilla? y se incorpore a la base de conocimientos. Por ejemplo, al llegar a una casilla, wall-e debe ser capaz de percibir si hay olor, brisa, brillo o nada en esa casilla.
A partir de las percepciones que wall-e tenga de cada casilla es capaz de determinar en cuales casillas en probable que haya algo y en cuales es seguro que haya o no haya otra cosa. Todo esto se debe de ir asentando en la base de conocimientos, a manera de ir llenando por completo el mundo y que wall-e pueda determinar que tan conveniente le es ir a cada casilla que lo rodea.
Algunas reglas importantes a considerar:
Lo primero que se debe hacer al llegar a una casilla es marcar las probabilidades de las casillas aledañas y visitar las casillas menos probables a toparse con un Wumpus o pozos. Una vez que se visita una casilla y se conoce su estado, es importante bloquearla a futuras marcas de probabilidad que puedan añadirle casillas vecinas. Porque su estado ya se conoce y es definitivo.

El código fuente del agente debidamente documentado.








































































































Relación entre la base de conocimientos del agente y el hardware de Lego.
La validación de tendencias y patrones (reglas) es la base de conocimiento de un agente. Hay (dentro del paradigma actual) 2 tipos de "reglas" de redes; explícita y tácito:

* Las bases del conocimiento explícito es un conjunto de "reglas" que están identificadas, comunicadas y usualmente codificadas para que otros agentes usen.
* La base de conocimiento tácito son no identificadas y no escritas y se comunican por la forma no verbal.
Si el agente (en este caso wall-e) es un agente basado en conocimiento, su comportamiento estará determinado por la base de conocimiento de que dispone.
La base de conocimiento contendrá un conocimiento inicial, pero su contenido irá variando con el funcionamiento del agente.

agente = programa agente + arquitectura

El programa agente sera una función que implementara la transformación (mapping) de secuencias de percepciones en acciones la arquitectura sera un ordenador que se ocupar´a de que las percepciones lleguen al programa y las acciones lleguen a los efectores.
La IA se ocupa del diseño del programa agente Antes de diseñar un programa agente tenemos que conocer los distintos elementos que caracterizan al agente:
* Percepciones posibles
* Acciones posibles
* Medida de desempeño u objetivos que debe lograr tipo de entorno en el que va a operar
La idea ya específicamente con el wall-e y éste algoritmo era lograr que wall-e fuera conociendo su mundo por medio del reconocimiento de colores y así ir integrando a su base de conocimiento lo que aprendía de su mundo conforme si iba desplazando. Esto con el objetivo de tener un mapa de las cosas que iba reconocimiento y poder llegar así a encontrar el oro sin toparse con Wumpus o caer en un pozo.
Los diferentes colores representarían lo que hay en cada casilla, olor, brillo, wumpus, pozos, brisa, etc de esta forma, wall-e podría construir su mundo.
Es una lástima que no se haya podido construir la solución a este problema tanto en algoritmo como en un Lego, pero esto se debió principalmente a dos cosas:
--Wall-e no camina derecho; esto nos iba a causar problemas si en lugar de a la derecha o izquierda, el robot se iba en diagonal, dando errores en la lectura de las casillas y por lo tanto en el mapa mental de wall-e o su base de conocimientos.
--El más importante de los problemas, wall-e es incapaz de reconocer colores; así es ya que estos variaban mucho, en un rango muy diferente entre un color y otro. Esto no hubiera sido tan grave problema si se asignaban rangos a cada color y ya, el problema radica en que varios de eso rangos se entrecruzaban y era imposible determinar un rango para cada color en específico.
La solución a esta situación fue construir una solución al mundo de Wumpus únicamente simulada por medio de software y sobre la base de conocimientos y el mundo físico se tomaron las siguientes determinaciones.
Se construyeron dos mundos paralelos, uno era el mundo "real" en el que se tenía una mapa de la ubicación en las casillas de distintas entidades como Wumpus, el oro y pozos y de sus casillas aledañas con peste o brisa, etc.
El segundo mundo es un mundo "en blanco" y es la base de conocimientos o mapa mental de wall-e que va llenando conforme avanza en el juego y va recabando información de las casillas que visita. Los mapas son exactamente iguales en dimensión y forma, excepto que como lo mencionamos, el mundo de wall-e no está competo.

0 comentarios: