Estadísticas y Big Data

31
Acomodar vistas arraigadas de valores p

A veces, en los informes, incluyo un descargo de responsabilidad sobre los valores p y otras estadísticas inferenciales que he proporcionado. Digo que, dado que la muestra no fue aleatoria, esas estadísticas no se aplicarían estrictamente. Mi redacción específica generalmente se da en una nota al...

31
Visualizando un millón, edición PCA

¿Es posible visualizar el resultado del análisis de componentes principales de manera que proporcione más información que solo tablas de resumen? ¿Es posible hacerlo cuando el número de observaciones es grande, digamos ~ 1e4? ¿Y es posible hacerlo en R [otros entornos

31
¿Por qué es necesaria la selección de variables?

Los procedimientos comunes de selección de variables basadas en datos (por ejemplo, hacia adelante, hacia atrás, paso a paso, todos los subconjuntos) tienden a generar modelos con propiedades indeseables, que incluyen: Coeficientes sesgados lejos de cero. Errores estándar que son demasiado...

31
formato de datos libsvm [cerrado]

Estoy usando la herramienta libsvm ( http://www.csie.ntu.edu.tw/~cjlin/libsvm/ ) para la clasificación de vectores de soporte. Sin embargo, estoy confundido sobre el formato de los datos de entrada. Desde el archivo Léame: El formato del archivo de datos de entrenamiento y prueba...