Informe final del proyecto: Datos funcionales y en alta dimensión

Cholaquidis Noblía, Alejandro - Fraiman, Ricardo - Febrero Bande, Manuel - Cuevas, Antonio - Gamboa, Fabrice - Pateiro Lopez, Beatriz - Ghattas, Badih

Resumen:

La estadística de datos en el alta dimensión así como la de datos funcionales requiere de nuevas técnicas ya que los métodos tradicionales en estadística clásica resultan inadecuados para abordarlos. Esto se debe a que en alta dimensión a menudo el tamaño de la muestra es menor a la dimensión de los datos. En el caso de datos funcionales requiere del manejo de procesos estocásticos. En este proyecto abordamos el estudio de tres problemas estadísticos importantes cuando los datos se encuentran en espacios no necesariamente euclideanos utilizando su estructura métrica. Consideramos los siguientes problemas, 1) el modelo lineal funcional de respuesta escalar, mediante el uso de RKHS (Reproducing Kernel Hilbert spaces) 2) test de hipótesis para datos binarios en alta dimensión 3) estimación de conjuntos bi-convexos Analizamos las propiedades asintóticas de los procedimientos, generamos nuevos algoritmos para resolverlos, estudiamos su comportamiento para tamaños de muestra moderada por simulaciones y presentamos ejemplos de aplicación en datos reales: en biología, en particular en genética, text mining, datos nutricionales, datos electorales, target marketing, reconocimiento de patrones y de imágenes.


Detalles Bibliográficos
2023
Agencia Nacional de Investigación e Innovación
Datos Funcionales
Estadística en espacios métricos
Datos binarios en alta dimensión
Ciencias Naturales y Exactas
Matemáticas
Estadística y Probabilidad
Español
Agencia Nacional de Investigación e Innovación
REDI
https://hdl.handle.net/20.500.12381/3565
Acceso abierto
Reconocimiento 4.0 Internacional. (CC BY)
Resumen:
Sumario:La estadística de datos en el alta dimensión así como la de datos funcionales requiere de nuevas técnicas ya que los métodos tradicionales en estadística clásica resultan inadecuados para abordarlos. Esto se debe a que en alta dimensión a menudo el tamaño de la muestra es menor a la dimensión de los datos. En el caso de datos funcionales requiere del manejo de procesos estocásticos. En este proyecto abordamos el estudio de tres problemas estadísticos importantes cuando los datos se encuentran en espacios no necesariamente euclideanos utilizando su estructura métrica. Consideramos los siguientes problemas, 1) el modelo lineal funcional de respuesta escalar, mediante el uso de RKHS (Reproducing Kernel Hilbert spaces) 2) test de hipótesis para datos binarios en alta dimensión 3) estimación de conjuntos bi-convexos Analizamos las propiedades asintóticas de los procedimientos, generamos nuevos algoritmos para resolverlos, estudiamos su comportamiento para tamaños de muestra moderada por simulaciones y presentamos ejemplos de aplicación en datos reales: en biología, en particular en genética, text mining, datos nutricionales, datos electorales, target marketing, reconocimiento de patrones y de imágenes.