Quiero calcular un resumen de una variable en un data.frame para cada combinación única de factores en el data.frame. ¿Debo usar plyr para hacer esto? Estoy de acuerdo con el uso de bucles en lugar de aplicar (); así que solo descubrir cada combinación única sería suficiente.
r
categorical-data
aggregation
plyr
russellpierce
fuente
fuente
Respuestas:
Si bien creo que
aggregate
es probablemente la solución que está buscando, si desea crear una lista explícita de todas las combinaciones posibles de factores,expand.grid
lo hará por usted. p.ejLuego, puede recorrer cada fila en el marco de datos resultante para extraer registros de sus datos originales.
fuente
Ver
aggregate
yby
. Por ejemplo, del archivo de ayuda paraaggregate
:fuente
Aquí está la solución plyr, que tiene la ventaja de devolver múltiples estadísticas de resumen y producir una barra de progreso para cálculos largos:
fuente
Además de otras sugerencias, puede encontrar útil la
describe.by()
función en elpsych
paquete. Se puede usar para mostrar estadísticas de resumen sobre variables numéricas en los niveles de una variable de factor.fuente
Personalmente me gusta
cast()
, desde el paquete de remodelación debido a su simplicidad:fuente
En
library(doBy)
allí también está lasummaryBy()
función, por ejemplofuente