Preguntas etiquetadas con dataset

13
Las mejores formas de agregar y analizar datos

Recientemente comencé a enseñarme a mí mismo el Aprendizaje automático y el Análisis de datos. Me encuentro con un obstáculo en la necesidad de crear y consultar grandes conjuntos de datos. Me gustaría tomar datos que he estado agregando en mi vida profesional y personal y analizarlos, pero no...

13
Separar dos poblaciones de la muestra.

Estoy tratando de separar dos grupos de valores de un solo conjunto de datos. Puedo suponer que una de las poblaciones está normalmente distribuida y tiene al menos la mitad del tamaño de la muestra. Los valores del segundo son más bajos o más altos que los valores del primero (se desconoce la...

12
Mejores prácticas para crear 'Tidy Data'

Hadley Wickham escribió un artículo estelar llamado "Tidy Data" ( enlace ) en JSS el año pasado sobre la manipulación de datos y la obtención de los datos en una condición "óptima" para realizar el análisis. Sin embargo, me preguntaba cuáles eran las mejores prácticas en términos de presentar datos...

12
La idea de hacer que los datos tengan una media cero

A menudo veo personas que hacen que una dimensión / característica de un conjunto de datos sea de media cero al eliminar la media de todos los elementos. ¿Pero nunca entendí por qué hacerlo? ¿Cuál es el efecto de hacer eso como un paso de preprocesamiento? ¿Mejora el rendimiento de la...

12
Diferencias entre PROC Mixed y lme / lmer en R - grados de libertad

Nota: esta pregunta es una nueva publicación, ya que mi pregunta anterior tuvo que ser eliminada por razones legales. Al comparar PROC MIXED de SAS con la función lmedel nlmepaquete en R, me topé con algunas diferencias bastante confusas. Más específicamente, los grados de libertad en las...

12
¿Por qué algunas personas prueban los supuestos del modelo similar a la regresión en sus datos sin procesar y otras personas los prueban en el residual?

Soy un estudiante de doctorado en psicología experimental y me esfuerzo por mejorar mis habilidades y conocimientos sobre cómo analizar mis datos. Hasta mi quinto año en psicología, pensé que los modelos de regresión (por ejemplo, ANOVA) suponen lo siguiente: normalidad de los datos homogeneidad...

11
Práctico tutorial de PCA con datos

Buscar en Internet el tutorial de PCA ofrece miles de resultados (incluso videos). Muchos de los tutoriales son muy buenos. Pero no puedo encontrar ningún ejemplo práctico en el que se explique PCA utilizando algunos conjuntos de datos que puedo usar para la demostración. Necesito un tutorial que...

11
¿Cuánta información puedes extraer de un nombre?

Un nombre: primero, posiblemente un segundo nombre y apellido. Tengo curiosidad acerca de cuánta información puede extraer de un nombre, utilizando conjuntos de datos disponibles públicamente. Sé que puede obtener lo siguiente en cualquier lugar entre una probabilidad baja-alta (dependiendo de la...

10
Buenos ejemplos de PCA para enseñar

Estoy enseñando álgebra lineal a una clase de ingenieros, científicos sociales y programadores de computadoras. Acabamos de hacer una descomposición de valores singulares y tenemos un día extra, así que pensé en hablar sobre la relación entre la descomposición de valores singulares y el análisis de...