¿Alguien puede sugerir cuál es la etapa correcta para eliminar las variables correlacionadas antes de la ingeniería de características o después de la ingeniería de
¿Alguien puede sugerir cuál es la etapa correcta para eliminar las variables correlacionadas antes de la ingeniería de características o después de la ingeniería de
Me gustaría ejecutar algún modelo de aprendizaje automático como bosque aleatorio, aumento de gradiente o SVM en mi conjunto de datos. Hay más de 200 variables predictoras en mi conjunto de datos y mis clases objetivo son una variable binaria. ¿Necesito ejecutar la selección de características...
Cuando intento hacer, por ejemplo, una clasificación, mi enfoque actualmente es pruebe varios algoritmos primero y compárelos realizar una selección de características en el mejor algoritmo del 1 anterior ajustar los parámetros usando las características y el algoritmo seleccionados Sin...
A menudo estoy construyendo un modelo (clasificación o regresión) donde tengo algunas variables predictoras que son secuencias y he estado tratando de encontrar recomendaciones técnicas para resumirlas de la mejor manera posible para su inclusión como predictores en el modelo. Como ejemplo...
Estoy buscando un sitio web o libro donde se dan varios ejemplos prácticos paso a paso, explicando cómo eligen las características relevantes, el procedimiento de selección del modelo,
La siguiente gráfica muestra los coeficientes obtenidos con regresión lineal (con mpgla variable objetivo y todos los demás como predictores). Para el conjunto de datos mtcars ( aquí y aquí ) con y sin escalar los datos: ¿Cómo interpreto estos resultados? Las variables hpy dispson...
Una de las metodologías para seleccionar un subconjunto de sus funciones disponibles para su clasificador es clasificarlas de acuerdo con un criterio (como la ganancia de información) y luego calcular la precisión utilizando su clasificador y un subconjunto de las características clasificadas. Por...
Tengo dos tensor a:[batch_size, dim] b:[batch_size, dim]. Quiero hacer un producto interno para cada par en el lote, generando c:[batch_size, 1], dónde c[i,0]=a[i,:].T*b[i,:].
Existen varios enfoques de selección de características / selección de variables (ver, por ejemplo, Guyon y Elisseeff, 2003 ; Liu et al., 2010 ): métodos de filtro (por ejemplo, basado en correlación, basado en entropía, basado en importancia aleatoria del bosque), métodos de envoltura (p. ej.,...
Digamos que estamos prediciendo las ventas de una tienda y mis datos de entrenamiento tienen dos conjuntos de características: Uno sobre las ventas de la tienda con las fechas (el campo "Tienda" no es único) Uno sobre los tipos de tienda (el campo "Tienda" es único aquí) Entonces la matriz se...
He leído la explicación de la convolución y la entiendo hasta cierto punto. ¿Alguien puede ayudarme a entender cómo esta operación se relaciona con la convolución en redes neuronales convolucionales? ¿Es el filtro como una función gque aplica
Tengo conjuntos de datos que contienen, entre muchas características, coordenadas GPS (latitud y longitud). Me gustaría utilizar estos conjuntos de datos para explorar problemas como: (1) calcular ETA para conducir entre los puntos de inicio y finalización; y (2) estimar la cantidad de delito para...
Cerrada . Esta pregunta necesita estar más centrada . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que se centre en un problema solo editando esta publicación . Cerrado hace 5 años . Parece que la...
Tengo una gran cantidad de muestras que representan flujos de bits codificados Manchester como señales de audio. La frecuencia a la que están codificados es el componente de frecuencia principal cuando es alta, y hay una cantidad constante de ruido blanco en el fondo. He decodificado manualmente...
Mi pregunta es triple En el contexto de máquinas de vectores de soporte "Kernelized" Es deseable la selección de variables / características, especialmente porque regularizamos el parámetro C para evitar el sobreajuste y el motivo principal detrás de la introducción de núcleos en una SVM es...
¿Hay algún recurso con una lista de técnicas de ingeniería de características? Un mapeo de tipo de datos, modelo y técnica de ingeniería de características sería una mina de
Aplicamos Lasso para clasificar las características y obtuve los siguientes resultados: rank feature prob. ================================== 1 a 0.1825477951589229 2 b 0.07858498115577893 3 c 0.07041793111843796 Tenga en cuenta que el conjunto de datos tiene 3 etiquetas. La clasificación de las...
Estoy desarrollando un sistema que pretende capturar el "contexto" de la actividad del usuario dentro de una aplicación; Es un marco que las aplicaciones web pueden usar para etiquetar la actividad del usuario en función de las solicitudes realizadas al sistema. Se espera que estos datos puedan...
Tengo un proyecto de clasificación de documentos donde obtengo contenido del sitio y luego asigno una de las numerosas etiquetas al sitio web de acuerdo con el contenido. Descubrí que tf-idf podría ser muy útil para esto. Sin embargo, no estaba seguro de cuándo exactamente usarlo. Asumiendo que...