T2 "Recuperación, Filtrado y Clasificación de Documentos de Texto y sus Aplicaciones en Internet "
Horario : 14 a 17 hs.
Lic. Fabrizio Sebastiani se graduó Summa cum laude en Ciencias de la Computación, en la Universidad de Pisa, Italia, en 1986. Ha sido Profesor del Departamento de Lingü ística de dicha Universidad. Fué Profesor visitante en las universidades de Toronto y Glasgow, entre otras, y miembro del Comité de Programa de las ediciones 1995, 96 y 97 del ACM-SIGIR. Su principal interés actualmente es la aplicación de probabilidades y lógica al campo de la recuperación de información multimedia, área en la que cuenta con numerosas publicaciones. Está involucrado actualmente en el proyecto EUROSEARCH.
Objetivo:
El objetivo del curso es el de brindar una descripción, tanto teórica como práctica, de los conceptos, modelos, técnicas y aplicaciones, de la recuperación de información (Information Retrieval) . El curso consta de cuatro secciones : (1) conceptos fundamentales; (2) modelos formales; (3) técnicas y (4) aplicaciones de los modelos y técnicas descriptos en las secciones (3) y (4), incluyendo categorización y filtrado de documentos. Se describirán también los motores de búsqueda en WWW, como ALTA VISTA, LYCOS y YAHOO.
Programa :
1. Qué es, y qué NO ES Information Retrieval (IR). Matching exacto y parcial. Eficiencia, efectividad y precisión. Relevancia. Evaluación y experimentación.
2. Modelos de IR. Los modelos: booleano, de lógica difusa, del espacio vectorial (y su generalización), probabilístico, booleano extendido.
3. Técnicas independientes del modelo para recuperación de texto. Funciones de peso y leyes de la estadística lingü ística. Resolución de homónimos y sinónimos.
4. Aspectos avanzados y aplicaciones . IR e interactividad: direcciones actuales. Motores WWW : LYCOS, ALTA VISTA, YAHOO. Filtrado y clasificación automática de documentos.
Prerrequisitos:
Estudiantes con al menos 3er año completo. Graduados. Científicos , Ingenieros y Profesionales.
ESTE CURSO SERÁ DICTADO EN INGLES