La prueba t de Welch para variaciones desiguales (también conocida como Welch – Satterthwaite o Welch-Aspin) generalmente tiene grados de libertad no enteros . ¿Cómo deben citarse estos grados de libertad al informar los resultados de la prueba?
"Es convencional redondear al número entero más cercano antes de consultar tablas t estándar" de acuerdo con varias fuentes *, lo que tiene sentido ya que esta dirección de redondeo es conservadora. ** Algunos programas estadísticos más antiguos también harían esto (por ejemplo, Graphpad Prism antes de la versión 6 ) y algunas calculadoras en línea todavía lo hacen. Si se hubiera utilizado este procedimiento, sería apropiado informar los grados de libertad redondeados . (¡Aunque usar un software mejor podría ser aún más apropiado!)
Pero la gran mayoría de los paquetes modernos hacen uso de la parte fraccionaria, por lo que en este caso parece que la parte fraccionaria debería citarse. No puedo ver que sea apropiado citar más de dos decimales, ya que una milésima de grado de libertad solo tendría un impacto insignificante en el valor p .
Al mirar alrededor de Google Scholar, puedo ver documentos que citan el df como un número entero, con un decimal o con dos decimales. ¿Hay alguna guía sobre cuánta precisión usar? Además, si el software utiliza la parte fraccionaria completo, si el citado df ser redondeado hacia abajo al número deseado de figuras (por ejemplo, a 1 DD o como un número entero) como sea apropiado con el cálculo conservador , o como me parece más sensato, redondeado convencionalmente ( al más cercano ) de modo que a 1 dp u al entero más cercano.
Editar: además de conocer la forma más teóricamente sólida de informar df no entero, también sería bueno saber qué hacen las personas en la práctica . Presumiblemente, las revistas y las guías de estilo tienen sus propios requisitos. Me gustaría saber qué guías de estilo influyentes como la APA requieren. Por lo que puedo discernir (su manual no está disponible gratuitamente en línea), la APA tiene una preferencia general de que casi todo debería aparecer con dos decimales, excepto los valores p (que pueden ser dos o tres dp) y porcentajes (redondeados al porcentaje más cercano) - que cubre pendientes de regresión, estadísticas t , estadísticas F , estadísticas, etc. Esto es bastante ilógico, teniendo en cuenta que el segundo lugar decimal ocupa una cifra significativa muy diferente, y sugiere una precisión bastante diferente, en 2.47 que en 982.47, pero podría explicar el número de Welch df con dos lugares decimales que vi en mi muestra no científica .
ej. Ruxton, GD La prueba t de varianza desigual es una alternativa subutilizada a la prueba t de Student y la prueba U de Mann – Whitney , Ecología conductual (julio / agosto 2006) 17 (4): 688-690 doi: 10.1093 / beheco / ark016
Aunque la aproximación de Welch-Satterthwaite en sí misma puede o no ser conservadora, y en un caso en el que no lo es, redondear los grados de libertad no es garantía de una compensación general.
fuente
Respuestas:
No he estudiado la práctica real, por lo que esta respuesta no puede abordar ese aspecto de la pregunta. Como principio general, esperaría que el tratamiento de dígitos significativos al informar los grados de libertad (df) se base en el juicio relacionado con cifras significativas.
El principio es ser consistente : use la precisión en una cantidad que sea apropiada para la precisión usada en otra que esté relacionada con ella. Específicamente, cuando se informan los valores e y = f ( x ) cuando x se da al múltiplo más cercano de un valor pequeño h (como h = 1x y=f(x) x h para seis lugares después del punto decimal), la precisión relativa enh=12×10−6 mediada por la función f esy f
La aproximación se aplica cuando es continuamente diferenciable en el intervalo [ x -f .[x−h,x+h]
En la presente solicitud, es el valor p ,y p es el grado de libertad ν , yx ν
donde es la estadística Welch-Satterthwaite y F ν es el CDF de la distribución t de Student con ν grados de libertad.t Fν t ν
Para relativamente alta df , a menudo un cambio en la primera posición decimal no cambiaría el valor de p en absoluto (al nivel de precisión reportado), de modo de redondeo a un entero está muy bien ( h = 1 / 2 , pero h | dν h=1/2 es muy pequeño). Para valores muy bajos de df y extremos del estadísticot, la magnitud de la derivada| ∂h|ddxf(x)| t puede exceder0.01, sugiriendo en tales casos queνdebe reportarse a solo un decimal menos quepmismo.|∂∂νFν(t)| 0.01 ν p
Compruébelo usted mismo con este diagrama de contorno etiquetado de la magnitud de la derivada para el df más bajo (razonable) y rangos de eso sería de interés (porque pueden conducir a valores p bajos).|t|
Las etiquetas muestran el logaritmo en base 10 de la derivada. Por lo tanto, en puntos entre y - ( k + 1 ) en esta parcela, cambiando el df reportado en la j ésimo lugar después del punto decimal es probable que cambie El informaron p-valor sólo en la ( j + k ) ésimo y más tarde lugares. Por ejemplo, suponga que está redondeando el valor p a 10 - 6 (seis lugares decimales). Considere las estadísticas ν = 2.5 y t = 8 . Estos se encuentran cerca del - 3−k −(k+1) jth (j+k)th 10−6 ν=2.5 t=8 −3 Contorno de registro. Por lo tanto, debe informarse a 6 + ( - 3 ) = 3 decimales.ν 6+(−3)=3
Las áreas celestes, para los más grandes , son las que preocupan, porque muestran dónde pequeños cambios en ν tienen los mayores efectos sobre el valor p.k ν
Compare esto con la situación de mayor df (de muestran 4 a 30 ):4 30
La influencia de en la precisión de pν p disminuye rápidamente a medida que aumenta .ν
fuente
La razón por la que fue una convención es porque las tablas no tienen df no enteros. No hay razón para hacerlo de otra manera.
Bueno, la estadística en realidad no tiene una distribución t, porque el denominador al cuadrado en realidad no tiene una distribución de chi-cuadrado a escala. Es una aproximación que puede o no ser conservadora en algún caso en particular: redondear df hacia abajo puede no ser seguro para ser conservador cuando consideramos la distribución exacta de la estadística en un caso en particular.
Los valores p de las distribuciones t (aplicando el cdf a un estadístico t) se pueden calcular mediante una variedad de aproximaciones bastante precisas, por lo que se calculan efectivamente en lugar de interpolarse.
Estoy de acuerdo.
Una posibilidad podría ser investigar qué tan precisa es la aproximación de Welch-Satterthwaite para el valor p en esa región general de relaciones de varianza y no citar una precisión sustancialmente mayor de la que sugeriría que estaba en el df (teniendo en cuenta que el df en el chi-cuadrado en el cuadrado del denominador solo está dando una aproximación a algo que no es chi-cuadrado de todos modos).
fuente