Estadísticas y Big Data

13
¿La desviación estándar es totalmente incorrecta? ¿Cómo se puede calcular el estándar para alturas, recuentos, etc. (números positivos)?

Digamos que estoy calculando alturas (en cm) y los números deben ser superiores a cero. Aquí está la lista de muestra: 0.77132064 0.02075195 0.63364823 0.74880388 0.49850701 0.22479665 0.19806286 0.76053071 0.16911084 0.08833981 Mean: 0.41138725956196015 Std: 0.2860541519582141 En este...

13
En Random Forest, ¿por qué se elige un subconjunto aleatorio de características a nivel de nodo en lugar de a nivel de árbol?

Mi pregunta: ¿Por qué el bosque aleatorio considera subconjuntos aleatorios de características para dividir a nivel de nodo dentro de cada árbol en lugar de a nivel de árbol ? Antecedentes: esta es una cuestión de historia. Estaño Kam Ho publicó este trabajo en la construcción de "bosques de...

13
Cómo tratar las respuestas de encuestas ilógicas

He enviado una encuesta a una muestra de artistas. Una de las preguntas era indicar el porcentaje de ingresos derivados de: actividad artística, apoyo gubernamental, pensión privada, actividades no relacionadas con las artes. Alrededor del 65% de los individuos respondieron de manera tal que la...