Acabo de descubrir la comment
función en R. Ejemplo:
x <- matrix(1:12, 3,4)
comment(x) <- c("This is my very important data from experiment #0234",
"Jun 5, 1998")
x
comment(x)
Esta es la primera vez que llegué a esta función y me preguntaba cuáles son sus usos comunes / útiles. Dado que es bastante difícil buscar "comentarios R" en Google y encontrar resultados relevantes, esperaba que alguien aquí pudiera compartir su experiencia.
Respuestas:
Para segundo @Gavin, Frank Harrell ha desarrollado formas eficientes de manejar data.frame anotado en R en su paquete Hmisc . Por ejemplo, las funciones
label()
yunits()
permiten agregar atributos dedicados a los objetos R. Los encuentro muy útiles cuando produzco un resumen de data.frame (por ejemplo, condescribe()
).Otra forma útil de utilizar dicho atributo adicional es aplicar una marca de tiempo en un conjunto de datos. También agrego un atributo para cosas como semilla aleatoria, número de pliegue (cuando uso k-kold o LOO validación cruzada).
fuente
Una cosa que a menudo me encuentro haciendo en mis scripts R para una tarea particular de análisis de datos es incluir comentarios en el script sobre las unidades de variables en mis marcos de datos. Trabajo con datos ambientales y los químicos y ecologistas parecen disfrutar usando una amplia gama de unidades diferentes para las mismas cosas (mg L - 1 vs mu eq L - 1 , etc.). Mis colegas generalmente almacenan esta información en la fila inmediatamente debajo de los nombres de las columnas en las hojas de Excel.- 1 - 1
Vería
comment()
como una buena manera de adjuntar esta información a un marco de datos para referencia futura.fuente
comment()
no hay comentarios en el código. Adjunta un atributo específico al objeto que puede ser un vector, un elemento por columna del marco de datos que contiene la información de las unidades. Es fácil extraer esta información, así que no veo por qué implementar algo sería difícil o imposible.R
definitivamente no es el lugar adecuado para mantener bases de datos y realizar procesos de este tipo, aunque sea capaz de hacerlo. Se complementa mejor con un buen sistema de gestión de bases de datos para dicho trabajo.comment()
et al son útiles para notas e información ad hoc, pero se requiere un sistema adecuado para el manejo de datos a mayor escala. Curiosamente, tenemos que abordar esto ahora dentro del grupo de investigación y consultoría para el que trabajo con respecto a nuestros datos químicos y necesitamos ingresarlos en una base de datos adecuada.Existen instalaciones similares en otros paquetes, como el comando -notes- en Stata . Usamos esto para documentar los detalles completos de una variable, por ejemplo, detalles del ensayo para una medición bioquímica, o la redacción exacta de la pregunta solicitada para los datos del cuestionario. Esto suele ser demasiada información para el nombre o la etiqueta de la variable, uno o ambos se muestran en el resultado de cada análisis que involucra la variable y, por lo tanto, es mejor mantenerlos razonablemente cortos.
fuente
Una de las cosas que me encuentro haciendo mucho es rastrear los comandos utilizados para generar datos y objetos, y he encontrado que el comentario es una herramienta útil para esto.
El 'matched.call.data' y 'generate.command.string' hacen el truco. No es perfecto, pero útil y un uso para 'comment ()'. :)
fuente
Permítanme sugerir mi solución general para la gestión de objetos en R: el
repo
paquete. Al usarlo, puede asignar a cada variable un nombre largo, una descripción, un conjunto de etiquetas, una URL remota, relaciones de dependencia y también adjuntar figuras o archivos externos genéricos. Por ejemplo, el código fuente puede almacenarse como un elemento de repositorio y adjuntarse a los recursos producidos por él. Encuentre la última versión estable en CRAN (install.packages("repo")
) o el último desarrollo en github . Una descripción rápida aquí . Espero eso ayude.fuente