¿Qué podemos decir sobre la media de la población a partir de un tamaño de muestra de 1?

45

Me pregunto qué podemos decir, en todo caso, sobre la media de la población, cuando todo lo que tengo es una medida, y 1 (tamaño de muestra de 1). Obviamente, nos encantaría tener más medidas, pero no podemos obtenerlas.μy1

Me parece que dado que la media de la muestra, , es trivialmente igual a y 1 , entonces E [ ˉ y ] = E [ y 1 ] = μ . Sin embargo, con un tamaño de muestra de 1, la varianza muestral no está definida y, por lo tanto, nuestra confianza en el uso de ˉ y como estimador de μ también está indefinida, ¿correcto? ¿Habría alguna forma de restringir nuestra estimación de μ ?y¯y1E[y¯]=E[y1]=μy¯μμ

thedu
fuente
Sí, se puede construir un intervalo de confianza en bajo ciertos supuestos. Si nadie lo publica, lo rastrearé. μ
soakley
55
Consulte stats.stackexchange.com/questions/1807 para obtener otra versión de la misma pregunta (el promedio de una muestra está disponible, pero no su tamaño de muestra, por lo que efectivamente el promedio es una sola observación de la distribución de muestreo desconocida) y stats.stackexchange .com / preguntas / 20300 para una discusión relacionada.
whuber
Un artículo reciente sobre la optimización de estos estimadores en el caso normal: tandfonline.com/doi/full/10.1080/00031305.2017.1360796
user795305

Respuestas:

9

Aquí hay un nuevo artículo sobre esta pregunta para el caso de Poisson, que adopta un buen enfoque pedagógico:

Andersson Per Gösta (2015). Un enfoque de clase para la construcción de un intervalo de confianza aproximado de una media de Poisson usando una observación. The American Statistician , 69 (3), 160-164, DOI: 10.1080 / 00031305.2015.1056830 .

S. Kolassa - Restablece a Monica
fuente
... desafortunadamente detrás de un muro de pago.
Tim
@Tim: eso es así. Por otra parte, una membresía de ASA no es terriblemente costosa, y obtienes acceso a The American Statistician , JASA y a muchas otras revistas a un precio muy razonable, que personalmente pago con mucho gusto de mi bolsillo. Realmente creo que obtienes el valor de tu dinero aquí. YMMV, por supuesto.
S. Kolassa - Restablece a Monica el
44
+1 pero el caso de Poisson es radicalmente diferente del caso normal porque la varianza tiene que ser igual a la media. El resultado de Poisson es bastante sencillo, mientras que el El resultado para el caso normal es contra-intuitivo y misterioso. x±9.68|x|
ameba dice Reinstate Monica
@amoeba: bastante correcto, pero el OP no especificó ninguna restricción en la distribución.
S. Kolassa - Restablece a Monica
Esto es tan breve que mejor serviría como comentario. Pero dado que es la respuesta aceptada, probablemente no desee convertirla en un comentario. ¿Podrías entonces resumir los puntos principales del artículo?
Richard Hardy
42

x

x±9.68|x|

Esto se discute en el artículo "Un intervalo de confianza efectivo para la media con muestras de tamaño uno y dos", de Wall, Boen y Tweedie, The American Statistician , mayo de 2001, vol. 55, n . ° 2 . ( pdf )

Soakley
fuente
55
Odio sonar estúpido pero ... seguramente no. Esto depende de las unidades y no se comporta correctamente en absoluto (me refiero a la multiplicación escalar ....)
Alec Teal
8
@Alec El hecho de que un procedimiento dependa de las unidades de medida (es decir, no es invariable) no significa que sea automáticamente inválido o incluso malo. Este es válido: lee el artículo y haz los cálculos. Sin embargo, muchos admitirán que es un poco inquietante . Aún más sorprendente, ni siquiera tiene que asumir que la distribución subyacente es Normal: un resultado similar es válido para cualquier distribución unimodal (pero 9.68 debe incrementarse a aproximadamente 19 más o menos): vea los enlaces que proporcioné en un comentario sobre esto pregunta.
whuber
44
|μ|σ
55
Solo para ahorrarles un poco de trabajo: las cartas al editor y las notas de @soakley de respuesta aparecieron en The American Statistician , vol. 56, no. 1 (2002) .
S. Kolassa - Restablece a Monica el
3
95%σ|μ|>0μ=0100%0
28

μ

S. Kolassa - Restablece a Monica
fuente
18
(+1) Una observación se verá abrumada por la anterior, por lo que parece que lo que obtienes de la parte posterior no será mucho más de lo que pones en la anterior.
whuber
x±9.68|x|
x±9.68|x|x
@StephanKolassa No, este intervalo (y la distribución asociada) forma la probabilidad. Nuestro prior es separado.
Simon Kuang
@ SimonKuang: sí, tienes razón, mi error. Desafortunadamente, no tengo tiempo para pasar por esto en este momento, pero si haces esto, ¡publica lo que encuentres!
S. Kolassa - Restablece a Monica el
14

Un pequeño ejercicio de simulación para ilustrar si la respuesta de @soakley funciona:

# Set the number of trials, M
M=10^6
# Set the true mean for each trial
mu=rep(0,M)
# Set the true standard deviation for each trial
sd=rep(1,M)
# Set counter to zero
count=0
for(i in 1:M){
 # Control the random number generation so that the experiment is replicable 
 set.seed(i)
 # Generate one draw of a normal random variable with a given mean and standard deviation
 x=rnorm(n=1,mean=mu[i],sd=sd[i])
 # Estimate the lower confidence bound for the population mean
 lower=x-9.68*abs(x)
 # Estimate the upper confidence bound for the population mean
 upper=x+9.68*abs(x)
 # If the true mean is within the confidence interval, count it in
 if( (lower<mu[i]) && (mu[i]<upper) ) count=count+1
}
# Obtain the percentage of cases when the true mean is within the confidence interval
count_pct=count/M
# Print the result
print(count_pct)
[1] 1

De un millón de ensayos aleatorios, el intervalo de confianza incluye la media real un millón de veces, es decir, siempre . Eso no debería suceder en caso de que el intervalo de confianza fuera un intervalo de confianza del 95% .

Entonces, la fórmula no parece funcionar ... ¿O he cometido un error de codificación?

(μ,σ)=(1000,1)
0.9500970.95(μ,σ)=(1000,1000)

Richard Hardy
fuente
2
μμ=0
2
α1αsim <- function(rho, n.iter=1e5, sigma=1, psi=9.68) { mu <- runif(n.iter, 0, sigma) * rho; x <- rnorm(n.iter, mu, sigma); mean(p <- abs(x - mu) <= psi * abs(x)) }; sim(1.75)
2
μμμsim(0.1)μ
2
P(Xζ|X|μX+ζ|X|)1αμ
2
μμ=0
0

Ver Edelman, D (1990) "Un intervalo de confianza para el centro de una distribución unimodal desconocida basada en un tamaño de muestra uno" The American Statistician, Vol 44, no 4. El artículo cubre los casos normales y no paramétricos.

David Edelman
fuente
3
Bienvenido a Stats.SE. ¿Puede editar su respuesta para expandirla, a fin de incluir los puntos principales del libro que cita? Será más útil tanto para el póster original como para otras personas que buscan en este sitio. Por cierto, aproveche la oportunidad de hacer el Tour , si aún no lo ha hecho. Consulte también algunos consejos sobre Cómo responder , sobre cómo formatear ayuda y sobre cómo escribir ecuaciones usando LaTeX / MathJax .
Ertxiem - reinstalar a Monica el
Bienvenido a nuestro sitio, David. Su contribución, como autor de ese artículo (que creo que se ha citado en varios hilos aquí), es muy apreciada, por lo que cualquier perspectiva o comentario que pueda proporcionar en esta respuesta sería muy bienvenida.
whuber