Las matemáticas tienen sus famosos Problemas del Milenio (e, históricamente, los 23 de Hilbert ), preguntas que ayudaron a dar forma a la dirección del campo.
Sin embargo, tengo poca idea de cuáles serían las hipótesis de Riemann y las estadísticas de P vs. NP.
Entonces, ¿cuáles son las preguntas abiertas generales en las estadísticas?
Editado para agregar: Como un ejemplo del espíritu general (si no del todo específico) de la respuesta que estoy buscando, encontré una conferencia inspirada en "Hilbert's 23" de David Donoho en la conferencia "Desafíos matemáticos del siglo XXI": Análisis de datos de alta dimensión: las maldiciones y bendiciones de la dimensionalidad
Por lo tanto, una respuesta potencial podría hablar sobre big data y por qué es importante, los tipos de desafíos estadísticos que plantean los datos de alta dimensión y los métodos que deben desarrollarse o las preguntas que deben responderse para ayudar a resolver el problema.
Respuestas:
Una gran pregunta debería involucrar cuestiones clave de la metodología estadística o, debido a que las estadísticas se refieren exclusivamente a las aplicaciones, debería referirse a cómo se utiliza la estadística con problemas importantes para la sociedad.
Esta caracterización sugiere que se debe incluir lo siguiente en cualquier consideración de grandes problemas:
La mejor manera de llevar a cabo ensayos de drogas . Actualmente, la prueba de hipótesis clásica requiere muchas fases formales de estudio. En fases posteriores (confirmatorias), los problemas económicos y éticos cobran gran importancia. ¿Podemos hacerlo mejor? ¿Tenemos que poner a cientos o miles de personas enfermas en grupos de control y mantenerlos allí hasta el final de un estudio, por ejemplo, o podemos encontrar mejores maneras de identificar los tratamientos que realmente funcionan y entregarlos a los miembros del ensayo (y otros) antes?
Lidiando con el sesgo de publicación científica . Los resultados negativos se publican mucho menos simplemente porque simplemente no alcanzan un valor p mágico. Todas las ramas de la ciencia necesitan encontrar mejores formas de sacar a la luz resultados científicamente importantes, no solo estadísticamente significativos . (El problema de las comparaciones múltiples y el manejo de datos de alta dimensión son subcategorías de este problema).
Investigando los límites de los métodos estadísticos y sus interfaces con el aprendizaje automático y la cognición automática . Los avances inevitables en la tecnología informática harán que la verdadera IA sea accesible en nuestras vidas. ¿Cómo vamos a programar cerebros artificiales? ¿Qué papel podrían tener el pensamiento estadístico y el aprendizaje estadístico en la creación de estos avances? ¿Cómo pueden ayudar los estadísticos a pensar sobre la cognición artificial, el aprendizaje artificial, explorar sus limitaciones y hacer avances?
Desarrollar mejores formas de analizar datos geoespaciales . A menudo se afirma que la mayoría, o la gran mayoría, de las bases de datos contienen referencias de ubicación. Pronto, muchas personas y dispositivos se ubicarán en tiempo real con tecnologías GPS y de telefonía celular. Los métodos estadísticos para analizar y explotar datos espaciales están realmente en su infancia (y parecen relegarse a SIG y software espacial que generalmente usan los no estadísticos).
fuente
Michael Jordan tiene un breve artículo llamado ¿Cuáles son los problemas abiertos en las estadísticas bayesianas? , en el que encuestó a un grupo de estadísticos por sus puntos de vista sobre los problemas abiertos en las estadísticas. Resumiré (también conocido como copiar y pegar) un poco aquí, pero probablemente sea mejor simplemente leer el original.
No paramétricos y semiparamétricos
Priors
Relaciones bayesianas / frecuentistas
Computación y estadística
Selección de modelo y prueba de hipótesis
fuente
No estoy seguro de qué tan grandes son, pero hay una página de Wikipedia para problemas no resueltos en las estadísticas. Su lista incluye:
fuente
Como un ejemplo del espíritu general (si no del todo específico) de la respuesta que estoy buscando, encontré una conferencia inspirada en "Hilbert's 23" de David Donoho en una conferencia de "Retos matemáticos del siglo XXI":
Análisis de datos de alta dimensión: las maldiciones y bendiciones de la dimensionalidad
fuente
Mathoverflow tiene una pregunta similar sobre grandes problemas en la teoría de probabilidad .
Parecería de esa página que las preguntas más importantes tienen que ver con auto evitando caminatas aleatorias y percolaciones.
fuente
Puede consultar el coloquio de Harvard "Problemas difíciles en las ciencias sociales" celebrado a principios de este año. Varias de estas charlas ofrecen problemas en el uso de estadísticas y modelos en las ciencias sociales.
fuente
Mi respuesta sería la lucha entre las estadísticas frecuentistas y bayesianas. Cuando la gente te pregunta en qué "crees", ¡esto no es bueno! Especialmente para una disciplina científica.
fuente