Día y hora: Viernes 5 de junio, 10:30 horas.
Título: Generalización de CART mediante divergencias de Bregman.
Expositor: Mathias Bourel (FCEA, Universidad de la República)
Resumen: Los árboles de decisión constituyen una de las herramientas fundamentales del aprendizaje estadístico debido a su interpretabilidad, flexibilidad y capacidad de adaptación a estructuras no lineales. Entre ellos, el algoritmo CART (Classification and Regression Trees), introducido por Breiman, Friedman, Olshen y Stone en 1984 es uno de los métodos más utilizados hoy en día en problemas de clasificación y regresión.
Por otro lado, las divergencias de Bregman, introducidas por Lev Bregman en 1967 en el contexto de optimización convexa, proporcionan una amplia familia de funciones de pérdida, como por ejemplo, además de la cuadrática, la divergencia de Kullback–Leibler, divergencia de Poisson, divergencia de Ikatura-Saito y otras asociadas a variables aleatorias que provienen de la familia exponencial. Poseen además una rica estructura geométrica y varias conexiones con la geometría de la información.
En este trabajo proponemos una generalización de CART basada en divergencias de Bregman, obteniendo así una familia más amplia de árboles adaptados a diferentes modelos estadísticos. Aunque CART o rpart incorporan distintos criterios de impureza, éstos suelen introducirse de manera ad hoc. El enfoque mediante divergencias de Bregman proporciona un marco unificado que permite derivar e interpretar estos criterios desde principios geométricos y convexos comunes. Además de la construcción algorítmica, también investigamos aspectos teóricos, más precisamente cómo las propiedades de la función convexa asociada a la divergencia de Bregman influyen en la pérdida de impureza entre nodos padres e hijos del árbol y sobre la consistencia del estimador.
Estos resultados forman parte de un trabajo en preparación que trata de proveer un marco unificado conectando los árboles de decisión, el análisis convexo, la geometría de la información y el aprendizaje estadístico.
Lugar: Facultad de Ciencias Económicas y de Administración, Salón 1 del EIP (entrada por Lauro Müller).
Datos para la reunión virtual: 870 3301 1104, pass: probable** donde ** es el cuadrado de la unidad imaginaria (dos caracteres).