Dados puntos de datos, cada uno con d características, n / 2 están etiquetados como 0 , los otros n / 2 están etiquetados como 1 . Cada característica toma un valor de [0,1] al azar (distribución uniforme). ¿Cuál es la probabilidad de que exista un hiperplano que pueda dividir las dos clases?0 n / 2 1 [ 0 , 1 ]
Consideremos primero el caso más fácil, es decir, .
Respuestas:
Suponiendo que no existan duplicados en los datos.
Sin ≤ d+ 1 , la probabilidad es Pr = 1 .
Para otras combinaciones de( n , d) , vea la siguiente gráfica:
Genere este gráfico simulando datos de entrada y salida como se especifica en el OP. La separabilidad lineal se definió como el fracaso de la convergencia en un modelo de regresión logística, debido al efecto Hauck-Donner .
Podemos ver que la probabilidad disminuye al aumentar . De hecho, podríamos ajustar un modelo que relacione con , y este fue el resultado:norte n , d pags
Código para la trama (en Julia):
Código para el modelo que relaciona con (en Julia):( n , d) pags
fuente