Estoy realizando una investigación sobre la relación entre el orden de nacimiento de una persona y el riesgo posterior de obesidad utilizando datos de varias cohortes de nacimiento de 1 año (por ejemplo, http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2908417/ ).
Un desafío clave es que el orden de nacimiento está relacionado con otras características como la edad materna, el número de hermanos menores y / o mayores y el espaciamiento de los nacimientos, que también pueden influir en el resultado a través de diferentes mecanismos. Además, cualquier influencia que estas cosas tengan sobre el riesgo posterior de obesidad podría modificarse por la composición de género de los hermanos, incluido el "niño índice" (el participante en la cohorte de nacimiento).
Para cada niño índice, se podría dibujar una línea de tiempo que mostrara todos los nacimientos en la familia, con la edad materna en la variable de tiempo.
Estoy tratando de identificar métodos para analizar este tipo de datos, donde el orden, el momento y la naturaleza de los eventos pueden ser importantes. Estoy haciendo esta pregunta aquí debido a la diversidad de aplicaciones con las que trabajan los miembros. Espero que alguien tenga algunas sugerencias inmediatas que me llevarán mucho más tiempo identificarme solo. Cualquier empujón en la dirección correcta (s) sería muy apreciado.
Pregunta (s) relacionada (s): ¿Cómo debo analizar los datos sobre los intervalos de nacimiento de las mujeres?
Respuestas:
Puede considerar el uso de modelos multinivel (regresión mixta) para estimar los efectos entre y dentro de la familia. Una estrategia posible es utilizar un enfoque de construcción de modelo jerárquico planificado. Por ejemplo, pruebe cada predictor potencial en un modelo univariante. Si los efectos entre familias eliminan el efecto del orden de nacimiento, sugeriría encarecidamente que el orden de nacimiento no es importante, pero que otras influencias sí lo son. Un ejemplo de cita para esto para los efectos del orden de nacimiento en el coeficiente intelectual:
Espero que esto sea útil.
fuente
Me estoy acercando a esto como una pregunta estadística y no tengo un conocimiento especial de los problemas médicos.
Al mirar el artículo al que se refiere, veo que una cohorte contenía 970 individuos. Si tiene datos sobre varias cohortes de aproximadamente ese tamaño, entonces el tamaño general de su conjunto de datos ofrece la oportunidad de seleccionar subconjuntos razonablemente grandes en los que la línea de tiempo de cada individuo cumple con condiciones específicas. Por ejemplo, un subconjunto podría incluir, por ejemplo, todos los hombres con edad materna de 25 a 29 años. Una regresión, para tal subconjunto, de una medida adecuada de obesidad posterior contra el orden de nacimiento eliminaría cualquier posible efecto sobre la obesidad posterior de las diferencias de género del niño índice y eliminaría en gran medida cualquier posible efecto de la edad materna.
No es sencillo extender este enfoque al género de los hermanos, ya que si una condición para un subconjunto fuera, por ejemplo, que el niño índice tiene un hermano femenino mayor, eso implica que el niño índice no es en sí mismo el mayor, lo que reduce el rango de la variable independiente en la regresión. Sin embargo, una forma de evitar esto podría ser definir condiciones usando "si hay alguno". Por ejemplo, un subconjunto podría definirse para incluir a todos los hombres con edad materna de 25 a 29 años y con hermanos mayores, si los hay, todas mujeres. Tal subconjunto aún incluiría individuos con cualquier orden de nacimiento.
Si un subconjunto se definiera por un conjunto de condiciones demasiado complejo, entonces el número de individuos que contenía podría ser tan pequeño que las estimaciones resultantes de los coeficientes serían demasiado imprecisas para ser útiles. Si se adoptara este enfoque, probablemente sería necesario un compromiso decisivo, al definir subconjuntos, entre eliminar tantos efectos posibles como sea posible e incluir suficientes individuos para obtener un resultado útil.
fuente
Sugeriría un análisis de datos funcionales, pero sospecho que podría tener muchas familias con muy pocos hijos para obtener estimaciones razonables. Sin embargo, siga leyendo, ya que aborda sus necesidades. Quizás alguien ya lo haya usado con datos similares.
Si no desea hacer algo tan masivamente no paramétrico como eso, debe usar su experiencia clínica para reducir la dimensionalidad de los datos. Por ejemplo, una variable en su modelo podría ser la cantidad de hijos, otra podría ser la cantidad promedio de años entre niños, y así sucesivamente. Si hay algún efecto en estas variables, puede aparecer incluso si no ha especificado correctamente la forma funcional de inmediato. La construcción adicional de modelos basados en el conocimiento puede permitirle construir un modelo altamente predictivo, ¡solo asegúrese de mantener un conjunto de validación!
fuente