¿Por qué no usamos dígitos significativos?

18

¿Alguna idea de por qué no usamos dígitos significativos en las estadísticas? Algo en la línea de que estamos usando estimaciones para que no se apliquen las reglas sobre precisión;)?

timothy.s.lau
fuente
1
Los lectores también pueden encontrar este hilo: número de cifras significativas para poner en una tabla de interés.
gung - Restablece a Monica
Encontré este informativo: davegiles.blogspot.com/2011/12/…
John
Un ejemplo de dónde es importante prestar atención a los dígitos significativos aparece en stats.stackexchange.com/questions/113314 , donde el OP obtuvo resultados de regresión notablemente diferentes que se pueden rastrear hasta las diferencias en la precisión con la que se ingresaron los datos a los procedimientos de regresión.
whuber

Respuestas:

19

Se usan dígitos significativos en algunos campos (aprendí sobre ellos en Química) para indicar el grado de precisión significativa que existe en un número. Este es un tema importante en las estadísticas también, por lo que, de hecho, lo informamos constantemente, solo lo informamos de una forma diferente. Específicamente, informamos los intervalos de confianza , que indican el nivel de precisión de una estimación (como una media).

Una vez que haya incluido el IC del 95% para una estimación, como , puede enumerar tantos dígitos para su media como desee, como 0.50129519823975923 , y no hay problema. De hecho, el estadístico Andrew Gelman ha recomendado que enumere al menos cuatro (2009, p. 4) . (0.12,1.12)0.50129519823975923

gung - Restablece a Monica
fuente
(La última parte es la lengua en la mejilla, perdón por mi irreverencia ;-).
gung - Restablece a Monica
2
+1. Un gran número de dígitos parece generar respuestas irreverentes: vea las últimas líneas de mi respuesta a una pregunta similar en otro sitio de SE.
Whuber
@gung ¿Cómo decide representar los puntos finales del IC con dos decimales?
user765195
@ user765195, hice esos números. En realidad no se refieren a nada.
gung - Restablece a Monica
@gung Lo que quería preguntar era que ¿cuál es la precisión de los puntos finales de un CI? ¿Cuántos dígitos son válidos, por ejemplo, cuando calcula un CI de Wilson para una proporción binomial?
user765195
12

Una razón para restringir el número de dígitos reportados en muchas estimaciones, valores p, etc. se basa en la percepción. Informar algo como p = 0.04872429 implica un nivel de precisión en los resultados que hace que se perciban como más precisos .

Esencialmente, el uso de un alto número de dígitos para informar resultados estadísticos prueba demasiado el hecho de intentar ocultar sus hallazgos en un aire de autoridad inmerecido.

Fomite
fuente
1

Creo que realmente depende del nivel de confianza requerido, menos dígitos para la significación son apropiados para el 95%, en comparación con el 99.999% o más, por ejemplo, como el utilizado por el CERN para muchos de sus resultados.

Robert Jones
fuente
Para una mayor aclaración, el artículo de Wikipedia sobre precisión y precisión sería una buena lectura para el póster original.
Robert Jones
ese es un buen punto, pero incluso cuando 𝛂 = .05 redondeo en ciertos cálculos puede tener un gran efecto en el resultado.
timothy.s.lau
1

¿Estás hablando de redondear tus datos a un número de dígitos significativos o redondear tu respuesta final? Si redondea sus datos, puede entrar en situaciones en las que ha arrojado el ruido que los cálculos estadísticos deben usar.

Emil Friedman
fuente
Me refiero a que las respuestas finales y los cálculos intermedios suelen redondearse incluso en los libros de texto.
timothy.s.lau