¿Alguien sabe de una R equivalente a SAS PROC FREQ
?
Estoy tratando de generar estadísticas descriptivas resumidas para múltiples variables a la vez.
r
descriptive-statistics
sas
z0lo
fuente
fuente
Respuestas:
Yo uso
table
yprop.table
, peroCrossTable
en elgmodels
paquete podría darle resultados aún más cercanos a SAS. Ver este enlace .Además, para generar "estadísticas descriptivas para múltiples variables a la vez", usaría la
summary
función; por ejemplo,summary(mydata)
.fuente
Resumir datos en la base R es solo un dolor de cabeza. Esta es una de las áreas donde SAS funciona bastante bien. Para R, recomiendo el
plyr
paquete.En SAS:
con
plyr
:fuente
Yo no uso SAS; así que no puedo comentar si los siguientes se replican
SAS PROC FREQ
, pero estas son dos estrategias rápidas para describir variables en un marco de datos que a menudo uso:describe
enHmisc
proporciona un resumen útil de variables que incluyen datos numéricos y no numéricosdescribe
enpsych
proporciona estadísticas descriptivas para datos numéricosR Ejemplo
El siguiente es el resultado de
Hmisc
describe
:A continuación, se muestra la salida de
psych
describe
las variables numéricas:fuente
Utilizo la función de libro de códigos de {EPICALC} que proporciona estadísticas de resumen para una variable numérica y una tabla de frecuencias con etiquetas de nivel y códigos para factores. http://cran.r-project.org/doc/contrib/Epicalc_Book.pdf (ver p.50) Además, esto es muy útil porque proporciona SD para variables cuantitativas.
¡A disfrutar!
fuente
codebook()
expone esto. 1 problema es quena
se eliminan los correos electrónicos, que es posible que desee incluir en su salida. Una forma de lidiar con esto (al menos con factores) es usar ? Recode.is.na 1st (por ejemplo, "falta"); para variables numéricas, puede crear una nueva variable inmediatamente a la izquierda de la columna con un valor lógico basado enis.na()
, y luego ejecutarcodebook()
. Sin embargo, es un poco complicado.Puede consultar mi paquete summarytools ( enlace CRAN ) que incluye una función similar a un libro de códigos, con opciones de formato de descuento y html.
Resumen de trama de datos
CO2
EDITAR
En las versiones más recientes de summarytools , la
freq()
función (que produce tablas de frecuencia directas, más concretamente con respecto a la pregunta original) acepta marcos de datos, así como variables individuales. Para tabulaciones cruzadas (que también hace proc freq ), vea lactable()
función.Frecuencias
CO2 $ PlantTipo : Factor ordenado
CO2 $ TipoTipo : Factor
Tratamiento de CO2 $Tipo : Factor
fuente
Gracias por todas las sugerencias a todos. Terminé usando la tabla o la función numSummary de Rcmdr más aplicar:
Esto funciona bastante bien y no es demasiado inconveniente. Sin embargo, definitivamente probaré algunas de estas otras soluciones.
fuente