viernes, febrero 15, 2008

Herramientas para information retrieval

.
Buscando nuevas aplicaciones para clasificar textos he encontrado los siguientes desarrollos, los cuales me parecieron interesantes para ser compartidos.

a) DocTagger

Aplicación que permite clasificar documentos utilizando los servicios de la base de datos WordNet. Los pasos que realiza para determinar a que clase pertenece un textoson los siguientes:
  • 1. POS-tagging the document.
  • 2. Stopword removal.
  • 3. Construct Synset map.
  • 4. Analyze Hypernymy relations.
  • 5. Output Synsets with highest score(s).

b) AutoBiB

Proyecto que dio por resultado un framework que permite construir aplicaciones que extraigan automaticamente la bibliografía de documentos científicos. AutoBiB utiliza Hidden Markov Models a los efectos de construir los patrones de referencias.

No hay comentarios.: