Estoy revisando un documento que usa la desigualdad del oráculo para probar algo, pero no puedo entender lo que está tratando de hacer. Cuando busqué en línea sobre 'Oracle Inequality', algunas fuentes me dirigieron al artículo "Candes, Emmanuel J. 'Estimación estadística moderna a través de las desigualdades del oráculo'. "que se puede encontrar aquí https://statweb.stanford.edu/~candes/papers/NonlinearEstimation.pdf . Pero este libro me parece demasiado pesado y creo que me faltan algunos requisitos previos.
Mi pregunta es: ¿Cómo explicarías qué es una desigualdad de oráculo para un estudiante que no es matemático (incluye ingenieros)? En segundo lugar, ¿cómo los recomendaría para abordar los requisitos previos / temas antes de intentar aprender algo como el libro mencionado anteriormente.
Recomiendo encarecidamente que alguien que tenga una comprensión concreta y una buena cantidad de experiencia en estadísticas de alta dimensión responda esto.
Respuestas:
Trataré de explicarlo en caso lineal. Considere el modelo lineal Cuando (número de variables independientes menor o igual que el número de observación) y la matriz de diseño tiene rango completo, el estimador de menos cuadrado es y el error de predicción es de donde podemos deducir Significa que cada parámetro se estima con precisión cuadradaEntonces su precisión al cuadrado general es
Ahora, ¿qué pasa si el número de observaciones es menor que el número de variables independientes ? "Creemos" que no todas nuestras variables independientes juegan un papel en la explicación de , por lo que solo unas pocas, digamos , son distintas de cero. Si supiéramos qué variables son distintas de cero, podríamos descuidar todas las demás variables y, según el argumento anterior, la precisión cuadrática general sería(p>n) Y k (σ2/n)k.
Debido a que se desconoce el conjunto de variables distintas de cero, necesitamos alguna penalización de regularización (por ejemplo, ) con el parámetro de regularización (que controla el número de variables). Ahora desea obtener resultados similares a los discutidos anteriormente, desea estimar la precisión al cuadrado. El problema es que su estimador óptimo ahora depende de . Pero el gran hecho es que con la elección adecuada de puede obtener un límite superior de error de predicción con alta probabilidad, esa es la "desigualdad del oráculo" Tenga en cuenta un factor adicionall1 λ β^ λ λ
fuente