Necesito analizar con R los datos de una encuesta médica (con más de 100 columnas codificadas) que viene en un CSV. Voy a utilizar sonajero para algunos análisis inicial pero detrás de las escenas es todavía R.
Si leo el archivo .csv () , las columnas con códigos numéricos se tratan como datos numéricos. Soy consciente de que podría crear columnas categóricas a partir de ellas con factor (), pero hacerlo por más de 100 columnas es una molestia.
Espero que haya una mejor manera de decirle a R que importe las columnas directamente como factores. O al menos para convertirlos en su lugar después.
¡Gracias!
r
categorical-data
data-transformation
wishihadabettername
fuente
fuente
Respuestas:
Puede usar el
colClasses
argumento para especificar las clases de sus columnas de datos. Por ejemplo:asignará numérico a la primera columna, factorizará a la segunda y tercera. Como tiene tantas columnas, un atajo podría ser:
o alguna de esas variaciones (es decir, asignar números a la primera columna, factorizar a las siguientes 37 columnas, luego caracteres a la última).
fuente
o simplemente hazlo después de leer los datos
aunque este tipo de Q probablemente sea más adecuado para Stack Overflow.editar : ver abajo.
fuente
'T'
y'F'
(se convierte en lógico).