El instrumento AUDIT es esencialmente una escala Likert. Un conjunto de preguntas (ítems Likert), con respuestas a menudo en una escala de cinco puntos, está diseñado para llegar a algún fenómeno subyacente. La suma de las respuestas al conjunto de preguntas, la escala Likert, se utiliza como medida del fenómeno subyacente. Aunque los elementos de Likert son a menudo en una escala de "muy en desacuerdo" a "totalmente de acuerdo", la aplicación para medir la tendencia a " Un LCOHOL T SE D RASTORNOS" en este " I DENTIFICACIÓN T est" es sencillo.
Como se señaló en la página Wikipedia de la escala Likert , "Si los elementos Likert individuales pueden considerarse como datos a nivel de intervalo, o si deben tratarse como datos categóricos ordenados es objeto de un considerable desacuerdo en la literatura, con fuertes convicciones sobre lo que son los métodos más aplicables ". Esta disputa probablemente se remonta a la mayoría de los más de 80 años desde que Likert propuso por primera vez la escala: ¿cada paso en la escala es equivalente, tanto dentro como entre los elementos que componen la escala? El problema se ha abordado en Cross Validated, como en las respuestas a esta pregunta , una de las primeras preguntas formuladas en este sitio.
Si acepta la idea de que la escala tiene pasos que son uniformes (o lo suficientemente cercanos como para la aplicación en cuestión, tal vez promediada agregando 10 elementos diferentes, como en AUDIT), entonces son posibles varios enfoques para el análisis. Una es considerar la respuesta en la escala como una serie de pasos elegidos o no elegidos para subir la escala, con la misma probabilidad de subir cada uno de los pasos.
Esto permite pensar en " datos de escala Likert de n puntos como n ensayos de un proceso binomial ", como en una pregunta de 2010 de @MikeLawrence. Aunque las respuestas a esa pregunta no respaldaron terriblemente esa idea, no fue difícil encontrar rápidamente hoy un estudio de 2014 que utilizó y amplió este enfoque con éxito para distinguir subpoblaciones con diferentes probabilidades binomiales. Aunque a menudo se usa un proceso binomial para modelar datos de recuento, se puede usar para modelar el número, el recuento, de los pasos que un individuo tomó a lo largo de la escala de "Trastornos por consumo de alcohol".
Como señaló @Scortchi en una respuesta a la pregunta vinculada en el segundo párrafo, una limitación del modelo binomial es que impone una relación particular entre la media y la varianza de la respuesta. El binomio negativo elimina esa restricción, con la pérdida de la fácil interpretación proporcionada por el modelo binomial simple. En el análisis, el parámetro adicional que debe ajustarse usa solo un grado adicional de libertad. En contraste, tratar de especificar diferentes probabilidades para cada uno de los 40 pasos del elemento Likert y su suma en la escala Likert sería desalentador.
Como señaló @MatthewGraves en su respuesta a esta pregunta, si el modelo binomial negativo es apropiado se responde mejor examinando los residuos. En el estudio original que desarrolló AUDIT, un valor de 8 o más en la escala de 40 puntos tenía una especificidad y sensibilidad bastante razonables para distinguir a los diagnosticados por "consumo de alcohol peligroso o nocivo" en 6 países diferentes. Entonces, quizás sería mejor un modelo binomial de dos poblaciones basado en poblaciones de alto y bajo riesgo, similar al estudio de 2014 vinculado anteriormente.
Los interesados en AUDIT específicamente deben examinar ese estudio original. Por ejemplo, aunque la necesidad de una bebida matutina puede parecer medir algo completamente diferente de la frecuencia de la bebida, como supuso @SeanEaster, la bebida matutina tiene una correlación media ponderada de 0,73 con una escala de medidas de consumo de alcohol. (Ese resultado no es sorprendente para alguien que ha tenido amigos con trastornos por consumo de alcohol). AUDIT parece ser un buen ejemplo de las compensaciones necesarias para desarrollar un instrumento que pueda usarse de manera confiable en múltiples culturas.
Como comentario general, los diferentes sabores de regresión tienen antecedentes diferentes para los parámetros (es decir, regularización) y diferentes modelos de ruido. La regresión estándar de mínimos cuadrados tiene un modelo de ruido gaussiano, la regresión binomial negativa tiene un modelo de ruido binomial negativo, y así sucesivamente. La verdadera prueba de si un modelo de regresión es apropiado o no es si el ruido residual tiene o no la distribución esperada.
Por lo tanto, puede aplicar una regresión binomial negativa a sus datos, calcular los residuos y luego trazarlos en una gráfica de probabilidad binomial negativa, y tener una idea de si el modelo es apropiado o no. Si el ruido está estructurado de alguna otra manera, entonces debemos buscar un modelo de ruido que se ajuste más a esa estructura.
El razonamiento desde el modelo generativo hasta la estructura de ruido es útil: si sabemos que los datos son multiplicativos en lugar de aditivos, por ejemplo, buscamos lo lognormal en lugar de lo normal, pero si el modelo generativo esperado y la estructura de ruido no están de acuerdo, ir con los datos, no la expectativa.
fuente