Prueba de permutación aleatoria para la selección de características

9

Estoy confundido sobre el análisis de permutación para la selección de características en un contexto de regresión logística.
¿Podría proporcionar una explicación clara de la prueba de permutación aleatoria y cómo se aplica a la selección de características? Posiblemente con algoritmo exacto y ejemplos.

Finalmente, ¿cómo se compara con otros métodos de contracción como Lasso o LAR?

Ugo
fuente
55
¿Quiere decir algo como, por ejemplo, donde las entradas de una sola columna de la matriz de diseño están permutadas, manteniendo fija la respuesta y otras covariables? Si tiene una referencia particular que está utilizando, puede ser útil enumerarla.
cardenal
Creo que este enlace citeseerx.ist.psu.edu/viewdoc/… se refiere a la técnica correcta. Actualmente estoy tratando de conseguir de nuevo en contacto con el profesor que me habló de este método ...
Ugo
No pude volver a ponerme en contacto con él (Donald Geman)
Ugo
2
Hay puntos poco claros en su pregunta que es posible que desee aclarar. En el documento vinculado hay una descripción bastante clara del algoritmo. ¿Quieres preguntar algo específico sobre este algoritmo? ¿Es la idea de hacer una selección de características calculando valores marginales de los que desea una explicación? Además, debe cuestionar la Definición 2 en el documento. Es una afirmación no respaldada, que puede ser una suposición funcional, pero los pequeños valores p marginales en general no implican relevancia. LAR, por cierto, está haciendo regresión lineal y no es realmente para respuestas binarias. pagpag
NRH

Respuestas:

10

(No tengo mucho tiempo ahora, así que responderé brevemente y luego ampliaré más adelante)

metronorteθmetronorteθpagpagmetronorte

θpagθ

Este proceso se repite en todas las características, y luego el subconjunto de características utilizadas para la clasificación se puede seleccionar de dos maneras:

  • norte
  • <ϵ
benhamner
fuente