¿Aprendizaje supervisado con datos inciertos?

11

¿Existe una metodología existente para aplicar un modelo de aprendizaje supervisado a un conjunto de datos incierto? Por ejemplo, supongamos que tenemos un conjunto de datos con clases A y B:

+----------+----------+-------+-----------+
| FeatureA | FeatureB | Label | Certainty |
+----------+----------+-------+-----------+
|        2 |        3 | A     | 50%       |
|        3 |        1 | B     | 80%       |
|        1 |        1 | A     | 100%      |
+----------+----------+-------+-----------+

¿Cómo podríamos entrenar un modelo de aprendizaje automático en esto? Gracias.

hiperdo
fuente

Respuestas:

11

Como una calidad numérica que atribuye a sus datos, creo que esta "certeza" seguramente podría usarse como un peso. Los puntajes más altos de "certeza" aumentan el peso que tiene un dato en la función de decisión, lo cual tiene sentido.

Muchos algoritmos de aprendizaje supervisado admiten pesos, por lo que solo tiene que encontrar una versión ponderada de la que desea utilizar.

Firebug
fuente
2
(+1) Y dado que esencialmente los pesos tenderán a actuar como "réplicas" de puntos, probablemente cualquier algoritmo podría incluirse en una versión ponderada de esa manera, por ejemplo, en el ejemplo OP, pasar [5,8,10] copias los 3 puntos, lo que refleja sus certezas del [50,80,100]%. (Esto nunca debería ser realmente necesario, ya que si se pudiera hacer en principio, debería haber una versión ponderada correspondiente del algoritmo.)
GeoMatt22
5

En lugar de tener etiquetas A o B, puede reemplazarlas con valores continuos de certeza; por ejemplo, corresponde a algo que está seguro es , corresponde a algo que está seguro es y corresponde a algo que 're 40% seguro que es . Luego, tenga un modelo que, en lugar de predecir la clase o obtenga un puntaje entre y función de cuánto cree que es uno u otro (y limite este puntaje en función de si es> o <1/2). Esto convierte su problema de clasificación en un problema de regresión (que usted umbral para volver a un clasificador).A 0 B 0.6 A A B 0 11A0B0.6AAB01

Por ejemplo, podría ajustar un modelo lineal a como (donde es la certeza anterior). Luego, cuando desee probar algunos datos, conéctelos al modelo y etiqueta si y contrario. β0+β T 1 xp(A|x)Aβ0+β T 1 x>0Blogp(A|x)p(B|x)=logp(A|x)1P(A|x)β0+β1Txp(A|x)Aβ0+β1Tx>0B

hombre murciélago
fuente
Entonces, si tuviera un problema de clasificación de varias clases, ¿podría establecer sus objetivos como vectores con una longitud igual al número de clases?
hyperdo
Número de clases -1, suponiendo que las certezas sumen 100%; El ejemplo es similar a la regresión logística. Muchos clasificadores producen puntajes (por ejemplo, estimaciones de p (clase | datos) según algún modelo). Todo lo que propone esta respuesta es que, en lugar de predecir las clases directamente, ver las certidumbres como puntajes y, en cambio, predecirlas. Luego, haz algo con los puntajes.
Batman el