Resúmenes

Minicursos

Topology and Geometry of Random Cubical Complexes
Erika Roldán, Teschniche Universitat Munchen
Abstract: We will explore the topology and local geometry of different random cubical complex models. In the first part of the mini-course, we explore two models of random subcomplexes of the regular cubical grid: percolation clusters (joint work with David Aristoff), and the Eden Cell Growth model (joint work with Fedor Manin and Benjamin Schweinhart). In the second part, we will study the fundamental group of random 2-dimensional subcomplexes of an n-dimensional cube; this model is analogous to the Linial-Meshulam model for simplicial complexes (joint work with Matt Kahle and Elliot Paquette).

Una introducción a la privacidad
Mario Díaz Torres, IIMAS, UNAM
Resumen: Una de las características definitorias de la era digital moderna es la disponibilidad a volúmenes masivos de información, e.g., Facebook generó 4 millones de gigabytes de información al día en 2020. Si bien está disponibilidad de información permite proporcionar una experiencia más placentera a los usuarios de servicios digitales, también trae consigo riesgos a la privacidad que pueden tener consecuencias graves. En este mini-curso presentaremos ejemplos concretos donde una perspectiva de privacidad es necesaria para evitar un uso incorrecto de la información. Además, motivados por estos ejemplos, presentaremos algunas nociones estadísticas de privacidad así como mecanismos que las garantizan. Finalmente, daremos una perspectiva general a diferentes problemas de interés contemporáneo en el tema.

Matrices aleatorias en teoría de portafolios: un enfoque desde la ciencia de datos
Andrés García Medina, CIMAT
Resumen: Se dará una breve introducción a la teoría de matrices aleatorias desde sus orígenes en la física estadística hasta su formulación más moderna utilizando elementos de probabilidad libre. Desde esta perspectiva, se describirá la familia de estimadores rotacionalmente invariantes, y se discutirán aplicaciones dentro de la teoría de portafolios de Markowitz. En todo momento se hará uso de herramientas de la ciencia de datos y de simulaciones en Python para desarrollar intuición de la teoría.

 

Pláticas

Estructura genealógica de un proceso de ramificación en ambiente variable
Sandra Palau, IIMAS, UNAM
Resumen: En biología evolutiva se han utilizado, desde hace ya varios años, modelos estocásticos que generan dos tipos de árboles genealógicos: Galton Watson y coalescencia. Los primeros se generan de datos fósiles y buscan estudiar características macroscópicas de una población tales como su origen y extinción. Los segundos se usan en genética de poblaciones para describir la genealogía de una población para la cual se tienen datos moleculares de individuos en el presente.
En esta plática definimos un modelo probabilista que incluye ambas perspectivas, suponiendo además que hay un ambiente aleatorio en la población. Para ser precisos, vamos a caracterizar las transiciones de una cadena de Markov a valores en vectores, que utilizando la información necesaria mínima permite reconstruir la genealogía de una muestra (tomada en un tiempo presente) de la una población que evoluciona de acuerdo a un proceso de Galton-Watson en ambiente variable. Finalmente presentamos como ejemplo el caso lineal fraccional.

Procesos Trawl y teoremas límite
Orimar Sauri, Aalborg University
Resumen: En esta plática estudiaremos una familia de procesos estacionarios a tiempo continuo con valores en los enteros conocidos como procesos Trawl. Esta clase de procesos estocásticos ha cobrado relevancia en finanzas y econometría pues permiten modelar de una manera simple datos cuyos valores están restringidos a un conjunto finito. Algunos ejemplos de dichos datos son los precios tick-by-tick y el bid-ask spread. El objetivo de esta charla es presentar algunas propiedades básicas de los procesos trawl así como también discutir varios teoremas límites y sus aplicaciones en pronósticos e inferencia.

Estimando el número de infectados totales de COVID-19 mediante procesos de Markov
Ulises Márquez Urbina, CIMAT
Resumen: Una importante proporción de los infectados por COVID-19 no desarrolla síntomas de la enfermedad y, por tanto, no siempre se detectan. Estos individuos asintomáticos tienen el potencial de transmitir el virus durante su período infeccioso. Así, el contar con un estimado del total de los casos asintomáticos, puede apoyar de manera fundamental la correcta toma de decisiones de política de salud. En esta plática, presentaremos una metodología basada en procesos de Markov para poder aproximar el número de casos no observados de coronavirus a partir de conteos diarios de casos detectados. Mostramos los resultados de aplicar la metodología al caso del estado de Nuevo León. Trabajo en conjunto con Evangelina Garza Elizondo.

Modelos gráficos: Un vistazo a las estructuras de datos espacio-temporales
Rogelio Ramos, CIMAT

Inference in the presence of missing values
Emilien Joly, CIMAT
Resumen: In modern times, it became fairly common to face data sets that present missing values. For example, the result of opinion queries on a subject is often incomplete or the transmission of the information itself can erase some of the values. It is then logically that those themes became hot topics in machine learning. In this talk, we will introduce the notion of missing value along with the notions of imputation of variables. Secondly, we will propose a solution to perform functional regression through random forest algorithms when a significant proportion of the values are missing. If time permits, we will expose the generalizations of this technique to classification problems.