¿Qué algoritmos de aprendizaje automático (además de SVM) utilizan el principio de minimización de riesgos estructurales
¿Qué algoritmos de aprendizaje automático (además de SVM) utilizan el principio de minimización de riesgos estructurales
Tengo una consulta compleja QQQ utilizada para buscar un conjunto de datos SSS para encontrar Hexact={s∈S∣where Q(s) is True}Hexact={s∈S∣where Q(s) is True}H_\text{exact} = \{s \in S \mid \text{where $Q(s)$ is True}\} . Cada consulta toma un tiempo promedio por lo que el tiempo total en la búsqueda...
Suponga que extiende el cálculo de construcciones con "agujeros", es decir, piezas de código incompletas que aún no completó. Me pregunto si hay un algoritmo para llenar esos roles automáticamente. Por ejemplo (usando la sintaxis de Morte ): Caso A: λ (pred : ?) -> λ (Nat : *) -> λ (Succ...
He estado aprendiendo sobre redes neuronales y SVM. Los tutoriales que he leído han enfatizado la importancia de la kernelización para SVM. Sin una función de kernel, los SVM son solo un clasificador lineal. Con la kernelización, los SVM también pueden incorporar características no lineales, lo que...
Descargo de responsabilidad: soy biólogo, siento mucho (tal vez) la pregunta básica formulada en términos tan crudos. No estoy seguro de si debería hacer esta pregunta aquí o en DS / SC, pero CS es el más grande de los tres, así que aquí va. (Después de publicar, se me ocurrió que...
He implementado una red neuronal (usando CUDA) con 2 capas. (2 neuronas por capa). Estoy tratando de hacer que aprenda 2 funciones polinómicas cuadráticas simples usando la propagación hacia atrás . Pero en lugar de converger, es divergente (la salida se está convirtiendo en infinito) Aquí hay...
En la página de Wikipedia aquí , describe bastante bien el algoritmo CDCL (y parece que las imágenes fueron tomadas de diapositivas creadas por Sharad Malik en Princeton). Sin embargo, al describir cómo dar marcha atrás, todo lo que dice es "al punto apropiado". MiniSAT también usa una variante del...
¿Por qué los pesos iniciales de las redes neuronales se inicializan como números aleatorios? Había leído en alguna parte que esto se hace para "romper la simetría" y esto hace que la red neuronal aprenda más rápido. ¿Cómo la ruptura de la simetría hace que aprenda más rápido? ¿No sería una mejor...
Al actualizar los pesos de una red neuronal utilizando el algoritmo de retropropagación con un término de impulso, ¿debería aplicarse también la tasa de aprendizaje al término de impulso? La mayor parte de la información que pude encontrar sobre el uso del momento tiene las ecuaciones que se...
Recientemente hablé con un amigo sobre un sitio web que propuso desafíos de expresiones regulares, principalmente haciendo coincidir un grupo de palabras con una propiedad especial. Estaba buscando una expresión regular que coincida con cadenas como ||||||||donde el número |es primo. Inmediatamente...
Muchas funciones de activación en redes neuronales (sigmoide, tanh, softmax) son monótonas, continuas y diferenciables (excepto que puede haber un par de puntos, donde la derivada no existe). Entiendo la razón de la continuidad y la diferenciabilidad, pero realmente no puedo entender una razón...
En algunas ocasiones he entrenado redes neuronales (redes de propagación hacia atrás) con algunos conjuntos de datos bastante complicados (posiciones de backgammon y OCR). Al hacer esto, parece que gran parte del trabajo implica probar diferentes configuraciones de las redes, para encontrar la...
El modelo de aprendizaje probablemente aproximadamente correcto (PAC) se define como: Se dice que una clase de concepto puede aprenderse con PAC si existe un algoritmo y una función polinómica tal que para cualquier ε> 0 y δ> 0 , para todas las distribuciones D en X y para cualquier concepto...
Soy muy nuevo en las redes neuronales y he estado tratando de resolver algunas cosas. Entonces, supongamos que se encuentra con una red neuronal que tiene 100 entradas, una capa oculta con 200 nodos y 32 salidas. Digamos también que usted, el "descubridor" de esta instancia particular de una red...
Recientemente aprendí sobre Q-learning, una técnica de aprendizaje de refuerzo que estima directamente el valor esperado de tomar una acción en un estado. Me pregunto si existen técnicas para hacer "aprendizaje dinámico", para estimar la dinámica de un sistema. Un agente de "aprendizaje dinámico"...
Varios algoritmos populares de aprendizaje automático, como la regresión logística o las redes neuronales, requieren que sus entradas sean numéricas. Lo que me interesa es cómo hacer que estos algoritmos funcionen en entradas no numéricas (como cadenas cortas). Como ejemplo, supongamos que...
Así que estoy leyendo "Introducción al aprendizaje automático" 2ª edición, por Bishop, et. todas. En la página 27 discuten la Dimensión Vapnik-Chervonenkis que es, "El número máximo de puntos que puede ser destruido por H [la clase de hipótesis] se llama Dimensión Vapnik-Chervonenkis (VC) de H,...