Acabo de llevar a cabo un análisis de mis datos mediante regresión logística, sin embargo, también tengo que tener una parte de Estadística descriptiva en mi informe. Sinceramente, no veo el punto en esto y esperaba que alguien pudiera explicar por qué es necesario.
Por ejemplo, si trazo un histograma de una de mis variables continuas independientes y muestra normalidad o asimetría, ¿cómo agregará esto algún valor al informe?
Mis datos consisten en una variable dependiente verdadera o falsa de conseguir un trabajo y la variable independiente es calificaciones a mitad de período, calificaciones en exámenes finales y hombres o mujeres.
descriptive-statistics
reporting
usuario3223190
fuente
fuente
Respuestas:
En mi campo, la parte descriptiva del informe es extremadamente importante porque establece el contexto para la generalización de los resultados. Por ejemplo, un investigador desea identificar los predictores de lesión cerebral traumática después de accidentes de motocicleta en una muestra de un hospital. Su variable dependiente es binaria y tenía una serie de variables independientes. La regresión logística multivariable le permitió producir los siguientes hallazgos:
Para ser claros, no hubo problemas con el modelado. Nos centramos en el valor que pueden agregar las estadísticas descriptivas.
Sin las estadísticas descriptivas, un lector no puede poner estos hallazgos en perspectiva. ¿Por qué? Déjame mostrarte las estadísticas descriptivas:
Puedes ver por lo anterior que su muestra consistía en hombres mayores e intoxicados. Con esta información, el lector puede decir qué, si es que hay alguno, estos resultados pueden decir sobre lesiones en varones jóvenes o lesiones en jinetes no intoxicados o en jinetes femeninos.
Por favor, no ignore las estadísticas descriptivas.
fuente
El punto de proporcionar estadísticas descriptivas es caracterizar su muestra para que las personas en otros centros o países puedan evaluar si sus resultados se generalizan a su situación. Entonces, en su caso, tabular el sexo, las calificaciones, etc., sería una adición beneficiosa a la regresión logística. No es para permitir que las personas verifiquen sus supuestos, aunque pueden intentar hacerlo también.
============== Editar para dar enlaces a algunas pautas utilizadas en salud
En el campo con el que estoy familiarizado, salud, existen pautas específicas para informar. Estos se han recopilado en la red EQUATOR, que se debe consultar para obtener detalles actualizados.
Como ejemplo, podemos tomar ensayos clínicos donde la directriz relevante es CONSORT. En el documento que describe la guía disponible aquí y en otros lugares , leemos en la Tabla 1, recomendación 15 "Una tabla que muestra las características clínicas y demográficas de referencia para cada grupo".
Hay recomendaciones similares para otros tipos de estudio.
fuente
Otra cosa es mostrar qué tan bien se comportan sus variables. Si, por ejemplo, una de sus variables es el salario, y ha entrevistado exactamente a un multimillonario, cuando ingresa su salario en la regresión logística va a dominar todo lo demás, por lo que probablemente aprenderá a ignorar el salario, independientemente de cuánta información real puede contener.
Algunos métodos son más sensibles que otros a la asimetría y los valores extremos, y la regresión logística es bastante sensible. Por supuesto, la prueba final está en el budín, y puede comparar los resultados obtenidos con los datos sin procesar, o con cada característica transformada hacia la normalidad.
fuente
Una parte descriptiva ayuda a entender al lector su conjunto de datos. En la economía aplicada, generalmente es muy recomendable, ya que puede mostrar las primeras fallas potenciales en su análisis.
Puede usar datos de diferentes fuentes para hacer explotar sus descriptivos.
1 mesa debería ser suficiente. El que adjuntaste no es muy intuitivo.
fuente