Número de dígitos significativos para informar

12

¿Existe una forma más científica de determinar el número de dígitos significativos para informar sobre un intervalo medio o de confianza en una situación que es bastante estándar, por ejemplo, la clase de primer año en la universidad?

He visto Número de cifras significativas para poner en una tabla , ¿Por qué no usamos dígitos significativos y Número de figuras significativas en un ajuste de chi cuadrado , pero estos no parecen señalar el problema?

En mis clases trato de explicarles a mis alumnos que es un desperdicio de tinta informar 15 dígitos significativos cuando tienen un error estándar tan amplio en sus resultados; mi intuición era que debería redondearse a algún lugar del orden de . Esto no es muy diferente de lo que dice ASTM: Resultados de la prueba de informes que se refieren a E29 donde dicen que debería estar entre y .0.25σ0.05σ0.5σ

EDITAR:

Cuando tengo un conjunto de números como el xsiguiente, ¿cuántos dígitos debo usar para imprimir la media y la desviación estándar?

set.seed(123)
x <- rnorm(30) # default mean=0, sd=1
# R defaults to 7 digits of precision options(digits=7)
mean(x) # -0.04710376 - not far off theoretical 0
sd(x) # 0.9810307 - not far from theoretical 1
sd(x)/sqrt(length(x)) # standard error of mean 0.1791109

PREGUNTA: Explique en detalle cuál es la precisión (cuando hay un vector de números de doble precisión) para la desviación media y estándar en esto y escriba una función pedagógica R simple que imprima la desviación media y estándar al número significativo de dígitos que se refleja en el vector x.

Sean
fuente
No entiendo por qué "Número de cifras significativas para poner en una tabla" no responde completamente a su pregunta: ¿qué punto pierde esa pregunta?
whuber
Me gusta su respuesta a esa pregunta @whuber, pero me gustaría un poco más de detalle.
Sean
1
¿Pero detalles sobre qué? En cualquier caso, parece que su pregunta es realmente un duplicado exacto de esa y lo que le gustaría es ver mejoras en sus respuestas. ¿Estoy en lo correcto? Por cierto, si está buscando orientación pedagógica, me gustaría señalarle un ejemplo (especializado) que publiqué en gis.stackexchange.com/questions/8650 sobre informes de coordenadas geográficas: la idea es asociar los números de dígitos con objetos cuyos tamaños la mayoría de los lectores captarán fácil e intuitivamente. Un enfoque similar podría funcionar bien en otras aplicaciones.
whuber
1
@whuber sí, tienes razón, y me gusta ese ejemplo. Supongo que estoy buscando más detalles sobre cómo se relaciona la precisión con la desviación estándar. Por ejemplo, en R, x <- rnorm (30); media (x); sd (x) # aquí claramente el sd es aproximadamente 1 pero en R la media se imprime por defecto con 7 dígitos de precisión. sd (x) / 30 es aproximadamente 0,18. Gracias
Sean
En R(así como en casi todo el software) la impresión está controlada por un valor global (ver options(digits=...)), no por ninguna consideración de precisión.
whuber

Respuestas:

9

La Guía para la incertidumbre en la medición (GUM) recomienda que la incertidumbre se informe con no más de 2 dígitos y que el resultado se informe con el número de dígitos significativos necesarios para que sea coherente con la incertidumbre. Consulte la Sección 7.2.2 a continuación.

http://www.bipm.org/utils/common/documents/jcgm/JCGM_100_2008_E.pdf

El siguiente código fue mi intento de implementar esta recomendación en R. Noe de que R puede no cooperar con los intentos de retener los ceros finales en la salida, incluso si son significativos.

gumr <- function(x.n,x.u) {
  z2 <- trunc(log10(x.u))+1
  z1 <- round(x.u/(10^z2),2)
  y1 <- round(x.n*10^(-z2),2)
  list(value=y1*10^z2,uncert=z1*10^z2)
}

x.val <- 8165.666
x.unc <- 338.9741
gumr(x.val,x.unc)
Tom
fuente
Para completar: > gumr(x.val,x.unc) $value [1] 8170 $uncert [1] 340
rombodecaedro
@rhombidodecahedron ¿no debería la incertidumbre tener solo una cifra significativa aquí? 82 ± 3 (× 10²)
jfs
@jfs la recomendación dice que use dos cifras significativas en la incertidumbre, ¿no es así?
rombodecaedro
@rhombidodecahedron la respuesta dice "no más de 2" Los criterios en GUM no están claros para mí. La tabla 3 de arxiv.org/pdf/1301.1034.pdf sugiere 1 dígito significativo para reportar para menos de 7 mediciones.
jfs
El código de ejemplo no sigue la regla GUM sugerida. Si val = 8165.666y unc = 338.9741, la medición debe informarse como val = 8.17(34)*10^3(no val = 8170con unc = 340lo dado), para dejar en claro que solo dos dígitos de la incertidumbre son significativos.
Divenex
6

Si muestra el intervalo de confianza, así como el valor de la estadística, no hay problema en dar tantas cifras significativas como desee, ya que en ese caso una gran cantidad de cifras significativas no implica precisión espuria como el intervalo de confianza da Una indicación de la probable precisión real (un intervalo creíble sería mejor). En esencia, se trata de hacer que la mesa sea ordenada, concisa y legible, por lo que, esencialmente, es poco probable que haya una regla simple que se adapte a todas las ocasiones.

La replicabilidad es importante en los estudios científicos, por lo que idealmente debería ser posible reproducir los resultados en cualquier cantidad de cifras siginificantes (ya sea que tengan importancia práctica o no). Redondear a un pequeño número de cifras significativas podría reducir la confianza en una réplica de un estudio, ya que los errores podrían quedar enmascarados por el redondeo de los resultados, por lo que existe un posible inconveniente en algunas circunstancias.

Otra razón para no redondear demasiado es que puede hacer que sea imposible para otros extender su estudio sin repetirlo. Por ejemplo, podría publicar un documento que compara varios algoritmos de aprendizaje automático utilizando la prueba de Friedman, que depende de la clasificación de los diferentes algoritmos en un conjunto de conjuntos de datos de referencia. Si las estadísticas para clasificadores individuales en cada conjunto de datos se dan a una cantidad de cifras significativas dependiendo de sus errores estándar, esto indudablemente creará muchos lazos aparentes en las clasificaciones. Esto significa que (i) un lector / revisor del documento no podrá replicar la prueba de Friedman a partir de los resultados proporcionados en el documento y (ii) otra persona no podrá evaluar su algoritmo en los conjuntos de datos de referencia y utilizar el Friedman prueba para ponerlo en el contexto de los resultados de mi estudio.

Dikran Marsupial
fuente
4

Seguramente cualquier decisión, tomada objetiva o subjetivamente, dependerá en gran medida de lo que esté midiendo y de cuán preciso sea su instrumento de medición. Esta última es solo una parte de la variación observada, y no siempre es fácil de discernir o encontrar evidencia existente. Por lo tanto, sospecho firmemente que no existe una decisión objetiva, universalmente aplicable. Solo tienes que usar tu cerebro y hacer el mejor juicio en cada situación.

DL Dahly
fuente