¿Pueden los efectos aleatorios aplicarse solo a variables categóricas?

9

Estas preguntas pueden sonar estúpidas, pero ... ¿ es correcto que los efectos aleatorios solo puedan aplicarse a variables categóricas (como identificación individual, identificación de población, ...), por ejemplo, digamos que es una variable categórica:xi

yi ~βxi

βxi ~Norm(μ,δ2)

pero desde el principio el efecto aleatorio no puede aplicarse a la variable continua (como altura, masa ...), diga :zi

yi ~α+βzi

porque entonces solo hay un coeficiente que no se puede restringir? Suena lógico, pero me pregunto por qué nunca se menciona en la literatura estadística. ¡Gracias!β

EDITAR: ¿Pero qué si restrinjo como ~ ? ¿Es entonces un efecto aleatorio? Pero esto es diferente de la restricción que puse en : aquí restrinjo la variable, mientras que en el ejemplo anterior restringí el coeficiente . Comienza a parecer un gran desastre para mí ... De todos modos, no tiene mucho sentido poner esta restricción, porque son valores conocidos, por lo que tal vez esta idea sea completamente extraña :-)ziziNorm(μ,δ2)βxizi

Curioso
fuente
1
Pregunta relacionada interesante: stats.stackexchange.com/q/61531/5509
Curioso

Respuestas:

5

Esta es una buena y una pregunta muy básica.

La interpretación de los efectos aleatorios es muy específica del dominio y depende de la elección del modelo (el modelo estadístico o ser bayesiano o frecuentista). Para una muy buena discusión, vea la página 245, Gelman y Hill (2007) . Para un Bayesiano, todo es aleatorio (aunque los parámetros pueden tener un verdadero valor fijo, se modelan como aleatorios), y un frecuentista también puede elegir un valor de parámetro para que sea un efecto fijo que de otro modo se hubiera modelado como aleatorio (ver Casella, 2008 , discusión sobre bloques a ser fijos o aleatorios en el ejemplo 3.2).

Editar (después del comentario)

Los datos se arreglan después de que los observe. Si son continuos, deben modelarse como continuos. Puede modelar variables categóricas como categóricas y, a veces, como continuas (como en una configuración de variable ordinal). Los parámetros son desconocidos y pueden modelarse como fijos o aleatorios. Los parámetros esencialmente relacionan la respuesta a los predictores. Si desea que la pendiente del predictor individual (o su coeficiente en un modelo lineal) varíe para cada respuesta, modele como aleatorio, de lo contrario, modele como fijo. Del mismo modo, si desea que la intersección varíe con respecto a los grupos, entonces deben modelarse como aleatorios; de lo contrario deberían ser reparados.

suncoolsu
fuente
1
Gracias por su respuesta, pero hmmm ... He formulado una pregunta simple y esperaba una respuesta simple o general :) En su segundo párrafo, declara que en Bayesiano todo es aleatorio. Por favor, no lo compliques demasiado :) Pregunté intencionalmente a nivel de modelo, por favor, olvídate de los frecuentistas o bayesianos, estoy interesado en el principio, ¿ para qué tipo de variables se usan típicamente los efectos aleatorios?
Curioso
En el tercer párrafo, pones una aplicación especial con series de tiempo, no estoy seguro de entenderlo, pero las series de tiempo AFAIK suelen ser discretas (no continuas) si hablas de correlación en serie ... De todos modos, si tienes algo más general respuesta, por favor comparte. De nuevo, gracias por la respuesta!
Curioso
La aleatoriedad está en cosas desconocidas. Cuando tienes observaciones son conocidas! Lo único que sabes son tus datos. Las incógnitas son los parámetros y se pueden modelar como aleatorias o fijas. (perdón por la confusión; estoy de acuerdo, innecesariamente hice las cosas complicadas.)
suncoolsu
Gracias por simplificar tu respuesta. Así que llegar a la raíz de mi pregunta - lo que quiere decir esto que la respuesta es , es decir, los efectos aleatorios se aplican sólo a las variables categóricas, debido a que los efectos aleatorios se aplican sólo a los parámetros (no de datos), y los únicos parámetros que se puede modelar ¿Qué tan aleatorios son aquellos con múltiples niveles, es decir, aquellos de una variable categórica? ¿Y los parámetros de las variables continuas no se pueden modelar como aleatorios, porque solo hay un valor de parámetro para la variable continua? ¡Gracias!
Curioso
En su entorno específico, la respuesta es . Pero, en general, la respuesta, diría, es NO porque las variables continuas pueden variar según los grupos. Por ejemplo, el ingreso de los residentes en la ciudad debe ser más alto que en el pueblo (según usted, esto podría ser dos variables categóricas separadas para la ubicación).
suncoolsu
3

Es posible que su pregunta ya haya sido resuelta, pero en realidad está escrita en un libro de texto;

Los efectos aleatorios son variables categóricas cuyos niveles se ven como una muestra de una población más grande, en oposición a los efectos fijos, cuyos niveles son de interés por derecho propio.

en la página 232 de: Alan Grafen y Rosie Hails (2002) "Estadísticas modernas para las ciencias de la vida", Oxford University Press.

sapporo
fuente
2
Todo esto es cierto, pero no creo que esto responda la pregunta.
Patrick Coulombe
1
No estoy de acuerdo con el comentario anterior de @PatrickCoulombe, creo que esto responde precisamente la pregunta. +1.
ameba
1

Creo que el problema es que hay dos cosas involucradas aquí. Un ejemplo típico de efectos aleatorios podría ser predecir el promedio de calificaciones (GPA) de un estudiante universitario en función de una serie de factores, incluido su puntaje promedio en una serie de pruebas durante la escuela secundaria.

El puntaje promedio es continuo . Por lo general, tendría una intersección variable, o intersección y pendiente, para el puntaje promedio de cada individuo. El individuo es obviamente categórico .

Entonces, cuando dices "solo se aplica a variables categóricas", es un poco vago. Digamos que solo considera una intercepción aleatoria para el puntaje promedio. En este caso, su intercepción aleatoria para una cantidad continua y, de hecho, probablemente se modela como algo así como una variable gaussiana con una media y una desviación estándar que determinará el procedimiento. Pero esta intercepción aleatoria se determina en una población de estudiantes donde cada estudiante se identifica por una variable categórica.

Puede usar una variable "continua" en lugar de la identificación del estudiante. Tal vez podrías elegir la altura de un estudiante. Pero esencialmente tendría que ser tratado como si fuera categórico. Si sus medidas de altura fueran muy precisas, volvería a tener una altura única para cada estudiante, por lo que no habría logrado nada diferente. Si sus medidas de altura no fueran muy precisas, terminaría agrupando a varios estudiantes en cada altura. (Mezclando sus puntajes de una manera posiblemente mal definida).

Esto es más o menos lo contrario de las interacciones. En una interacción, estás multiplicando dos variables y esencialmente estás tratando a ambas como continuas. Una variable categórica se dividiría en un conjunto de variables ficticias 0/1 y el 0 o 1 se multiplicaría por la otra variable en la interacción.

La conclusión es que un "efecto aleatorio" es en cierto sentido solo un coeficiente que tiene una distribución (se modela) en lugar de un valor fijo.

Wayne
fuente
Inicie sesión con su cuenta principal para poder editar.
ameba