Ni siquiera estoy seguro de que la pregunta tenga mucho sentido, pero creo que vi un par de títulos en los que proponían bosque aleatorio con efectos aleatorios. ¿Es esto posible en R?
r
random-forest
random-effects-model
mguzmann
fuente
fuente
Respuestas:
No se usan comúnmente juntos, y se debe tener cuidado antes de combinarlos.
Los bosques aleatorios generalmente se usan como clasificadores. La razón por la que usaría un bosque aleatorio en lugar de otro método (p. Ej., Agrupación K-significa) es que puede tener una gran cantidad de dimensiones por las que desea clasificar. El problema con tener la gran cantidad de dimensiones es que si quisiera probar todas las combinaciones de órdenes de dimensión, tendría una gran cantidad de opciones (crece más rápido que la cantidad factorial de dimensiones).
Los efectos aleatorios se usan típicamente en regresión con medidas repetidas de la misma cosa. Se usan comúnmente en modelos de efectos mixtos donde el término mezclado se refiere tanto a efectos fijos como aleatorios. Se cree que los efectos fijos representan los parámetros que volverá a ver (por ejemplo, un medicamento o la edad de una persona). Se cree que los efectos aleatorios representan una instancia de variabilidad alrededor de un parámetro que no volverá a ver (por ejemplo, una persona específica).
Hay ejemplos que los usan juntos cuando hay datos agrupados http://dx.doi.org/10.1080/00949655.2012.741599 y http://www2.ims.nus.edu.sg/Programs/014swclass/files/denis.pdf .
No conozco ningún paquete R que pueda hacer este análisis.
fuente
Sí, es posible Deberías revisar " Árboles RE-EM: un enfoque de minería de datos para datos longitudinales y agrupados " y el paquete R asociado REEMtree .
Ha pasado un tiempo desde que miré el periódico. Recuerdo que los autores aún no habían intentado formar conjuntos de estos árboles, pero que nada sugería que no funcionaría.
fuente
Los bosques de efectos aleatorios mixtos (MERF) son una cosa. Como dice la respuesta anterior, hay una gran investigación sobre ellos por parte del grupo del Dr. Larocque en HEC Montreal. El documento está aquí: http://www.tandfonline.com/doi/abs/10.1080/00949655.2012.741599 .
Esencialmente, es una forma teóricamente sólida de combinar el modelado no lineal de bosques aleatorios con efectos lineales aleatorios.
Acabamos de lanzar un paquete de código abierto en Python implementando MERF usando el algoritmo anterior en el documento.
Escribimos una publicación de blog detallada sobre el paquete y cómo usarlo para conjuntos de datos agrupados.
fuente