miércoles, agosto 09, 2006

Nuevos datasets para investigar en IR

Los laboratorios de AOL Research han puesto a disposición de investigadores de recuperación de información y otras disciplinas datos de comportamiento de usuarios en su servicio de búqueda.

  • 20,000 consultas etiquetadas y clasificadas por expertos.
  • 3,5 millones de consultas web tipo QA (pregunta/respuesta)
  • Trazas de consultas para 500,000 usuarios tomadas durante 3 meses, +- 20 millones de consultas. (Esto trajo lío y aparentemente lo han sacado)
  • Datos de llegada de consultas para análisis por teoría de colas
  • Cerca de 2 millones de consultas realizadas a dominios del gobierno americano.

Por lo que comenté en otro artículo de este blog, tal información puede servir para entener más las motiviaciones de consulta de los usuarios, resolver automaticamente la ambiguedad, y brindar listas de salida con mayor presición.

Para los que deseen chusmear sobre web mining le recomiendo este paper para largar "A Picture of Search" G. Pass, A. Chawdry y C. Torgeson.

Los saludo

No hay comentarios.: