ALGORITMOS DE ENTRENAMIENTO


Auto-entrenamiento (self-training)

Se refiere a un método de aprendizaje supervisado y cuyo funcionamiento es el siguiente: sobre un conjunto de información dado, se separa en dos subconjuntos: los elementos etiquetados o que tienen una categoría, como por ejemplo: "Real Madrid", "Nadal", "Federer", "Phelps", etc. están dentro de la categoría Deportes; y los elementos no etiquetados, que normalmente son de mayor tamaño.

 

La idea es que en sucesivas iteraciones exista un flujo de información del conjunto de datos no etiquetados a los etiquetados hasta que no existan elementos en el segundo tipo y tener un cierto nivel de eficiencia y seguridad en el clasificador. Como se puede deducir el gran problema de este método es la visión singular que tiene el clasificador del mundo: sólo ha aprendido con un conjunto reducido de patrones. 

 

A continuación se muestra un diagrama que representa gráficamente el funcionamiento del algoritmo de auto-entrenamiento:

 

Diagrama gráfico que describe el funcionamiento del algoritmo de auto-entrenamiento 

 

 

Auto-entrenamiento paralelo (co-training)

Se basa en extender el modelo de auto-entrenamiento a dos o más clasificadores con propiedades de clasificación disjuntas, con el objetivo de no limitar a la clasificación a un único punto de vista, añadiendo la variedad y diversidad que le faltaba al método de auto-entrenamiento.

 

A continuación se muestra un diagrama que representa gráficamente el funcionamiento del algoritmo auto-entrenamiento en paralelo:

 

Diagrama gráfico que describe el funcionamiento del algoritmo de auto-entrenamiento en paralelo

 

ALGORITMOS DE APRENDIZAJE


       Aprendizaje competitivo (active-learning)

Es un tipo de aprendizaje no supervisado y enfoca el entrenamiento del sistema de forma muy diferente a los anteriores métodos.

 

El objetivo es categorizar los datos de entrada, consiguiendo que datos parecidos sean clasificados como pertenecientes a la misma categoría, que está representada por un prototipo cuyas características son un resumen de las características de las datos pertenecientes a dicha categoría. Es decir, este sistema debe agrupar los datos de entrada en categorías, por razones de similitud, y asignar a cada categoría un prototipo, que más tarde será utilizado para clasificar datos nuevos y desconocidos.