Dimensión Vapnik-Chervonenkis: ¿por qué los rectángulos no pueden romper cuatro puntos de una línea?

Así que estoy leyendo "Introducción al aprendizaje automático" 2ª edición, por Bishop, et. todas. En la página 27 discuten la Dimensión Vapnik-Chervonenkis que es,

"El número máximo de puntos que puede ser destruido por H [la clase de hipótesis] se llama Dimensión Vapnik-Chervonenkis (VC) de H, se denota VC (H) y mide la capacidad de H."

Mientras que "rompe" indica una hipótesis $h \in H$ para un conjunto de N puntos de datos de manera que separe los ejemplos positivos de los negativos. En tal ejemplo se dice que "H rompe N puntos".

Hasta ahora creo que entiendo esto. Sin embargo, los autores me pierden con lo siguiente:

"Por ejemplo, cuatro rectángulos no pueden romper cuatro puntos en una línea".

Debe haber algún concepto aquí que no entiendo completamente, porque no puedo entender por qué este es el caso. ¿Puede alguien explicarme esto?

machine-learning vc-dimension HermanoJack
fuente

Llama a los cuatro puntos

p, q, r, s

$p,q,r,s$ en orden a lo largo de la línea. No hay rectángulo que contenga

p

$p$ y

r

$r$ pero excluye

q

$q$ y

s

$s$ .

JeffE

Sí, pero hay rectángulos que pueden contener

p

$p$ y

q

$q$ , Excluyendo

r

$r$ y

s

$s$ ; o contener

q

$q$ y

r

$r$ y excluir

p

$p$ y

s

$s$ . ¿Estás diciendo que cada combinación debe ser posible para que los puntos se rompan, y si es así, POR QUÉ ESTO NO ES UNA RESPUESTA: P?

BrotherJack

Respuestas:

La definición de "un conjunto $P$ puede ser destrozado por rectángulos "es eso por cada subconjunto de $P$ , hay un rectángulo que contiene precisamente ese subconjunto y excluye el resto de $P$ . De manera equivalente, cada etiquetado de los puntos como positivo y negativo es consistente con al menos una hipótesis en $H$ .

Ahora considere cuatro puntos $p,q,r,s$ a lo largo de una línea en el avión. Como no hay un rectángulo que contenga $p$ y $r$ pero excluye $q$ y $s$ , estos cuatro puntos no pueden romperse con rectángulos.

JeffE
fuente

Aquí vamos. Mucho mejor tener esto como respuesta, ¿no?

BrotherJack