66

Esta no es una pregunta de trabajo a domicilio sino un problema real que enfrenta nuestra empresa.

Hace muy poco (hace 2 días) pedimos la fabricación de 10000 etiquetas de productos a un distribuidor. El distribuidor es una persona independiente. Obtiene las etiquetas fabricadas desde el exterior y la empresa realiza el pago al distribuidor. Cada etiqueta cuesta exactamente $ 1 para la empresa.

Ayer, el distribuidor vino con etiquetas, pero las etiquetas se agruparon en un paquete de 100 etiquetas cada una. De esta manera, había un total de 100 paquetes y cada paquete contenía 100 etiquetas, por lo que un total de 10000 etiquetas. Antes de realizar el pago al distribuidor de $ 10000, decidimos contar algunos paquetes para asegurarnos de que cada paquete contenga exactamente 100 etiquetas. Cuando contamos las etiquetas, encontramos paquetes con menos de 100 etiquetas (encontramos 97 etiquetas). Para garantizar que esto no sea casual, sino que lo ha hecho intencionalmente, contamos 5 paquetes más y encontramos el siguiente número de etiquetas en cada paquete (incluido el primer paquete):

Packet Number    Number of labels
1                97 
2                98  
3                96
4                100
5                95 
6                97

No fue posible contar todos y cada uno de los paquetes, por lo que decidimos realizar el pago en promedio. Entonces, el número promedio de etiquetas en seis paquetes es 97.166, por lo que el pago total decidido fue de $ 9716.

Solo quiero saber cómo el estadístico debe lidiar con ese tipo de problema .
Además, quiero saber cuánto debemos pagar para obtener una garantía del 95% de que no hemos pagado más que el número real de etiquetas completas.

Información Adicional:

P (cualquier paquete contenía más de 100 etiquetas) = 0
P (cualquier paquete contenía una etiqueta menor que 90) = 0 {las etiquetas menores que 90 se detectarían fácilmente al contar los paquetes porque el paquete sería de menor peso}

EDITAR: Distribuidor simplemente negó de tal mala práctica. Descubrimos que estos distribuidores trabajan con una comisión específica que obtienen del fabricante por lo que paga la compañía. Cuando nos comunicamos directamente con el fabricante, descubrimos que no es culpa del fabricante ni del distribuidor. El fabricante dijo: "Las etiquetas se acortan porque las hojas no están estandarizadas en tamaño , y cualquier número que se corte de la hoja individual las junta en un paquete".

Además, validamos nuestra primera afirmación dada en información adicional, porque el fabricante admitió que por un aumento marginal en el tamaño de la hoja, no es posible cortar etiquetas adicionales, tampoco por una reducción marginal en el tamaño de la hoja no es posible cortar 100 etiquetas de exactamente el mismo tamaño.

probability bayesian model decision-theory Neeraj
fuente

77

+1 (1) ¿Cómo puede justificar la primera afirmación en la sección "información adicional"? (2) ¿Con qué precisión puede pesar los paquetes?

whuber

15

Inglaterra e Isaac Newton enfrentaron el mismo problema hace 300 años. (Las apuestas eran algo mayores, porque las "etiquetas" en cuestión eran monedas acuñadas). Por lo tanto, puede disfrutar leyendo el relato de Stephen Stigler sobre Trial of the Pyx en stat.wisc.edu/sites/default/files/TR442_0.pdf .

whuber

77

@Neeraj Si los pesos de todos los artículos son consistentes, ¿por qué no solo pesar la entrega completa?

Restablece a Mónica el

9

Ofrezca pagar $ 9000 y espere a que digan "Pero solo le pusimos en corto 600, no 1000"

Dean MacGregor

55

Además de la gran pregunta de estadísticas, +1, quería compartir un consejo más directo de años en el negocio de la impresión: todas las impresoras profesionales y adecuadas tienen una política de desbordamiento / desaprobación como esta porque la mayoría de las impresoras no ofrecen conteos exactos cualquier cosa que no use "numeración" (números de serie individuales). Pero deben tener un excelente recuento de lo que te dieron, y si te dan un descuento en corto si es más que menor (5%, por ejemplo). Cobrar el precio total de las bajas conocidas NO es una política estándar.

BrianH

20

Me interesaría recibir comentarios sobre el párrafo que comienza "Tras reflexionar ...", ya que una parte particular del modelo me ha mantenido despierto por la noche.

El modelo bayesiano

La pregunta revisada me hace pensar que podemos desarrollar el modelo explícitamente, sin utilizar la simulación. La simulación introdujo una variabilidad adicional debido a la aleatoriedad inherente del muestreo. Sin embargo, la respuesta de los sofólogos es excelente.

Suposiciones : el número más pequeño de etiquetas por sobre es 90 y el más grande es 100.

Por lo tanto, el número más pequeño posible de etiquetas es 9000 + 7 + 8 + 6 + 10 + 5 + 7 = 9043 (según los datos de OP), 9000 debido a nuestro límite inferior y las etiquetas adicionales que provienen de los datos observados.

Denotemos el número de etiquetas en un sobre . Denote el número de etiquetas sobre 90, es decir, , entonces . La distribución binomial modela el número total de éxitos (aquí un éxito es la presencia de una etiqueta en un sobre) en ensayos cuando los ensayos son independientes con una probabilidad de éxito constante por lo que toma los valoresTomamos , lo que da 11 posibles resultados diferentes. Supongo que debido a que los tamaños de las hojas son irregulares, algunas hojas solo tienen espacio para $Y_i$ $i$ $X_i$ $X=Y-90$ $X\in\{0,1,2,...,10\}$ $n$ $p$ $X$ $0, 1, 2, 3, ..., n.$ $n=10$ $X$ etiquetas adicionales en exceso de 90, y que este "espacio adicional" para cada etiqueta en exceso de 90 ocurre independientemente con probabilidad . Entonces $p$ $X_i\sim\text{Binomial}(10,p).$

(Tras la reflexión, el supuesto de independencia / modelo binomial es probablemente una suposición extraña, ya que fija de manera efectiva la composición de las hojas de la impresora para que sea unimodal, y los datos solo pueden cambiar la ubicación del modo, pero el modelo nunca admitirá una distribución multimodal. Por ejemplo, bajo un modelo alternativo, es posible que la impresora solotiene hojas de tamaños 97, 98, 96, 100 y 95: esto satisface todas las restricciones establecidas y los datos no excluyen esta posibilidad. Puede ser más apropiado considerar cada tamaño de hoja como su propia categoría y luego ajustar un modelo de Dirichlet-multinomial a los datos. No hago esto aquí porque los datos son muy escasos, por lo que las probabilidades posteriores en cada una de las 11 categorías estarán muy influenciadas por las anteriores. Por otro lado, al ajustar el modelo más simple, también estamos restringiendo los tipos de inferencias que podemos hacer).

Cada sobre es una realización iid de . La suma de los ensayos binomiales con la misma probabilidad de éxito también es binomial, por lo que(Este es un teorema: para verificar, use el teorema de singularidad de MGF). $i$ $X$ $p$ $\sum_i X_i\sim\text{Binomial}(60,p).$

Prefiero pensar en estos problemas en modo bayesiano, porque puedes hacer declaraciones de probabilidad directa sobre cantidades posteriores de interés. Un previo típico para ensayos binomiales con desconocido es la distribución beta , que es muy flexible (varía entre 0 y 1, puede ser simétrica o asimétrica en cualquier dirección, uniforme o una de las dos masas de Dirac, tener un antimodo o un modo. ¡Es una herramienta increíble! En ausencia de datos, parece razonable asumir una probabilidad uniforme sobre . Es decir, uno podría esperar ver una hoja que acomode 90 etiquetas con una frecuencia de 91, una frecuencia de 92, ..., una frecuencia de 100. Por lo tanto, nuestro anterior es $p$ $p$ $p\sim\text{Beta}(1,1).$ Si no crees que este beta anterior sea razonable, el prior uniforme puede ser reemplazado por otro beta anterior, ¡y las matemáticas ni siquiera aumentarán en dificultad!

La distribución posterior en es por las propiedades de conjugación de este modelo. Sin embargo, este es solo un paso intermedio, porque no nos importa tanto como nos importa el número total de etiquetas. Afortunadamente, las propiedades de conjugación también significan que la distribución predictiva posterior de las láminas es beta-binomial , con parámetros de la beta posterior. Hay "ensayos" restantes, es decir, etiquetas para las cuales su presencia en la entrega es incierta, por lo que nuestro modelo posterior en las etiquetas restantes es $p$ $p\sim\text{Beta}(1+43,1+17)$ $p$ $940$ $Z$ $Z\sim\text{BB}(44,18,940).$

Como tenemos una distribución en y un modelo de valor por etiqueta (el vendedor acordó un dólar por etiqueta), también podemos inferir una distribución de probabilidad sobre el valor del lote. Denote el valor total en dólares del lote. Sabemos que , porque solo modela las etiquetas de las que no estamos seguros. Por lo que la distribución sobre el valor viene dado por . $Z$ $D$ $D=9043+Z$ $Z$ $D$

¿Cuál es la forma apropiada de considerar el precio del lote?

Podemos encontrar que los cuantiles en 0.025 y 0.975 (un intervalo de 95%) son 553 y 769, respectivamente. Entonces, el intervalo del 95% en D es . Su pago cae en ese intervalo. (La distribución en no es exactamente simétrica, por lo que este no es el intervalo central del 95%; sin embargo, la asimetría es insignificante. De todos modos, como detallo a continuación, no estoy seguro de que un intervalo central del 95% sea incluso el correcto ¡uno a tener en cuenta!) $[9596, 9812]$ $D$

No conozco una función cuantil para la distribución beta binomial en R, así que escribí la mía usando la búsqueda de raíz de R.

qbetabinom.ab <- function(p, size, shape1, shape2){
    tmpFn <- function(x) pbetabinom.ab(x, size=size, shape1=shape1, shape2=shape2)-p
    q <- uniroot(f=tmpFn, interval=c(0,size))
    return(q$root)
}

Otra forma de pensarlo es pensar en las expectativas. Si repitió este proceso muchas veces, ¿cuál es el costo promedio que pagaría? Podemos calcular la expectativa de directamente. El modelo binomial beta tiene expectativa , entonces casi exactamente lo que pagó. ¡Su pérdida esperada en el trato fue de solo 6 dólares! En total, ¡bien hecho! $D$ $\mathbb{E}(D)=\mathbb{E}(9043+Z)=\mathbb{E}(Z)+9043.$ $\mathbb{E}(Z)=\frac{n\alpha}{\alpha+\beta}=667.0968$ $\mathbb{E}(D)=9710.097,$

Pero no estoy seguro de que ninguna de estas cifras sea la más relevante. ¡Después de todo, este vendedor está tratando de engañarte! Si estuviera haciendo este trato, dejaría de preocuparme por alcanzar el punto de equilibrio o el precio justo del lote y comenzaría a calcular la probabilidad de que esté pagando de más. El vendedor claramente está tratando de defraudarme, así que estoy perfectamente en mi derecho de minimizar mis pérdidas y no preocuparme por el punto de equilibrio. En este contexto, el precio más alto que ofrecería es de 9615 dólares, ya que este es el cuantil del 5% de la parte posterior en , es decir, hay un 95% de probabilidad de que esté pagando de menos $D$ . El vendedor no puede demostrarme que todas las etiquetas están ahí, así que voy a cubrir mis apuestas.

(Por supuesto, el hecho de que el vendedor haya aceptado el trato nos dice que tiene una pérdida real no negativa ... No he descubierto una forma de usar esa información para ayudarnos a determinar con mayor precisión cuánto fue engañado, excepto para notar que porque él aceptó la oferta, en el mejor de los casos estabas a punto de alcanzar el equilibrio

Comparación con el bootstrap

Solo tenemos 6 observaciones para trabajar. La justificación para el bootstrap es asintótica, así que consideremos cómo se ven los resultados en nuestra pequeña muestra. Este gráfico muestra la densidad de la simulación boostrap.

El patrón "irregular" es un artefacto del pequeño tamaño de muestra. Incluir o excluir cualquier punto tendrá un efecto dramático en la media, creando esta apariencia "agrupada". El enfoque bayesiano suaviza estos grupos y, en mi opinión, es un retrato más creíble de lo que está sucediendo. Las líneas verticales son los cuantiles del 5%.

Reinstalar a Mónica
fuente

Es una gran respuesta. Usted proporcionó una nueva perspectiva al penalizar el riesgo. Gracias

Neeraj

1

Me alegró descubrir que su pérdida esperada fue de solo $ 6. :-) Gracias de nuevo por una gran pregunta.

Reinstale a Mónica el

1

La distribución binomial modela el número de éxitos en ensayos cuando los ensayos son independientes con una probabilidad de éxito constante por lo que toma los valoresTomamos , lo que da 11 posibles resultados diferentes. Supongo que debido a que los tamaños de las hojas son irregulares, algunas hojas solo tienen espacio para etiquetas adicionales en exceso de 90, y que este "espacio adicional" para cada etiqueta ocurre con probabilidad .

n

$n$

p

$p$

0, 1, 2, 3, . . . ., n .

$0, 1, 2, 3, ...., n.$

n = 10

$n=10$

X

$X$

p

$p$

Vuelva a instalar a Mónica el

1

0, 1, 2, 3, . . .

$0,1,2,3,...$

101, 102, 103, . . ., 10^{6}

$101, 102, 103, ..., 10^6$

10^{6}

$10^6$

0 \leq X \leq 10

$0\le X\le 10$

1

Continuemos esta discusión en el chat .

Restablece a Mónica el

20

EDITAR: ¡Tragedia! ¡Mis suposiciones iniciales eran incorrectas! (O al menos en duda, ¿confía en lo que el vendedor le está diciendo? Aún así, un saludo a Morten también.) Lo que supongo que es otra buena introducción a las estadísticas, pero el Enfoque de hoja parcial ahora se agrega a continuación ( ya que a la gente parecía gustarle la Hoja entera, y tal vez alguien todavía la encuentre útil).

En primer lugar, un gran problema. Pero me gustaría hacerlo un poco más complicado.

Por eso, antes de hacerlo, permítame simplificarlo un poco y decir: el método que está utilizando en este momento es perfectamente razonable . Es barato, es fácil, tiene sentido. Entonces, si tiene que seguir con esto, no debería sentirse mal. Solo asegúrese de elegir sus paquetes al azar. Y, si puede sopesar todo de manera confiable (punta de sombrero para whuber y user777), entonces debe hacerlo.

Sin embargo, la razón por la que quiero hacerlo un poco más complicado es que ya lo ha hecho, simplemente no nos ha contado sobre toda la complicación, que es eso: contar lleva tiempo, y el tiempo también es dinero . Pero, ¿cómo mucho ? ¡Quizás sea más barato contarlo todo!

Entonces, lo que realmente está haciendo es equilibrar el tiempo que lleva contar, con la cantidad de dinero que está ahorrando. (SI, por supuesto, solo juegas este juego una vez. LA PRÓXIMA vez que esto suceda con el vendedor, es posible que se hayan dado cuenta y hayan intentado un nuevo truco. En teoría del juego, esta es la diferencia entre Single Shot Games e Iterated Juegos. Pero por ahora, imaginemos que el vendedor siempre hará lo mismo).

Sin embargo, una cosa más antes de llegar a la estimación. (Y, perdón por haber escrito tanto y aún no haber llegado a la respuesta, pero esa es una respuesta bastante buena a ¿Qué haría un estadístico? Pasarían una gran cantidad de tiempo asegurándose de que entendieran cada pequeña parte del problema antes de que se sintieran cómodos diciendo algo al respecto.) Y esa cosa es una idea basada en lo siguiente:

(EDITAR: SI ESTÁN REALMENTE ENGAÑANDO ...) Su vendedor no ahorra dinero quitando etiquetas, sino que ahorrando dinero al no imprimir hojas. No pueden vender sus etiquetas a otra persona (supongo). Y tal vez, no sé y no sé si lo haces, no pueden imprimir media hoja de tus cosas, y media hoja de otra persona. En otras palabras, incluso antes de comenzar a contar, puede suponer que el número total de etiquetas es cualquiera 9000, 9100, ... 9900, or 10,000. Así es como lo abordaré, por ahora.

El método de la hoja entera

Cuando un problema es un poco complicado como este (discreto y limitado), muchos estadísticos simularán lo que podría suceder. Esto es lo que simulé:

# The number of sheets they used
sheets <- sample(90:100, 1)
# The base counts for the stacks
stacks <- rep(90, 100)
# The remaining labels are distributed randomly over the stacks
for(i in 1:((sheets-90)*100)){
    bucket <- sample(which(stacks!=100),1)
    stacks[bucket] <- stacks[bucket] + 1
}

Esto le da, suponiendo que están usando hojas enteras, y sus suposiciones son correctas, una posible distribución de sus etiquetas (en el lenguaje de programación R).

Entonces hice esto:

alpha = 0.05/2
for(i in 4:20){
    s <- replicate(1000, mean(sample(stacks, i)))
    print(round(quantile(s, probs=c(alpha, 1-alpha)), 3))
}

Esto encuentra, usando un método "bootstrap", intervalos de confianza usando 4, 5, ... 20 muestras. En otras palabras, en promedio, si usaras N muestras, ¿qué tan grande sería tu intervalo de confianza? Utilizo esto para encontrar un intervalo lo suficientemente pequeño como para decidir el número de hojas, y esa es mi respuesta.

Por "lo suficientemente pequeño", quiero decir que mi intervalo de confianza del 95% tiene solo un número entero; por ejemplo, si mi intervalo de confianza fuera de [93.1, 94.7], elegiría 94 como el número correcto de hojas, ya que sabemos Es un número entero.

Sin embargo, OTRA dificultad: su confianza depende de la verdad . Si tiene 90 hojas y cada pila tiene 90 etiquetas, entonces converge muy rápido. Lo mismo con 100 hojas. Así que miré 95 hojas, donde existe la mayor incertidumbre, y descubrí que para tener una certeza del 95%, se necesitan alrededor de 15 muestras, en promedio. Digamos, en general, que desea tomar 15 muestras, porque nunca sabe qué hay realmente allí.

DESPUÉS de saber cuántas muestras necesita, sabe que sus ahorros esperados son:

$100N_{missing} - 15c$

$c$ $500 - 15*$

¡Pero también deberías acusar al tipo por obligarte a hacer todo este trabajo!

(EDITAR: ¡AGREGADO!) El enfoque de hoja parcial

Bien, supongamos que lo que dice el fabricante es cierto y no es intencional: solo se pierden algunas etiquetas en cada hoja. ¿Todavía quieres saber, sobre cuántas etiquetas, en general?

Este problema es diferente porque ya no tiene una buena decisión limpia que pueda tomar, eso fue una ventaja para la suposición de la hoja completa. Antes, solo había 11 respuestas posibles; ahora, hay 1100, y obtener un intervalo de confianza del 95% sobre exactamente cuántas etiquetas hay probablemente tomará muchas más muestras de las que desea. Entonces, veamos si podemos pensar en esto de manera diferente.

Debido a que realmente se trata de que usted tome una decisión, todavía nos faltan algunos parámetros: cuánto dinero está dispuesto a perder, en un solo acuerdo y cuánto dinero cuesta contar una pila. Pero déjame configurar lo que podrías hacer, con esos números.

Simulando de nuevo (¡aunque apoya al usuario777 si puede hacerlo sin él!), Es informativo observar el tamaño de los intervalos cuando se usan diferentes números de muestras. Eso se puede hacer así:

stacks <- 90 + round(10*runif(100))
q <- array(dim=c(17,2))
for(i in 4:20){
    s <- replicate(1000, mean(sample(stacks, i)))
    q[i-3,] <- quantile(s, probs=c(.025, .975))
}
plot(q[,1], ylim=c(90,100))
points(q[,2])

Lo que supone (esta vez) que cada pila tiene un número uniforme de etiquetas al azar entre 90 y 100, y le da:

Por supuesto, si las cosas fueran realmente como si hubieran sido simuladas, la verdadera media sería de alrededor de 95 muestras por pila, lo que es más bajo de lo que parece ser la verdad: este es un argumento de hecho para el enfoque bayesiano. Pero, le da una idea útil de cuánto más seguro se está volviendo sobre su respuesta, a medida que continúa probando, y ahora puede intercambiar explícitamente el costo de la muestra con cualquier trato que obtenga sobre los precios.

Lo cual sé por ahora, todos tenemos mucha curiosidad por saber.

one_observation
fuente

66

+1 Este análisis aborda directa y creativamente la pregunta: ¿cómo pensaría un (bueno) estadístico sobre el problema? Centrarse en el recuento de hojas es una información valiosa.

whuber

1

El enfoque de costo-beneficio es una gran idea. Ya diría que las horas colectivas * de capacidad intelectual dedicadas a este problema han excedido los ahorros de $ 284 de la muestra n = 6 que Neeraj usó. :)

RobertF

1

Buena respuesta. Como lo codificó actualmente, cuando la impresora recoge una pila completa, simplemente deja caer la etiqueta adicional al suelo, lo que puede ser razonable. Pero si desea tener 9000,9100...10000etiquetas totales al final, puede reemplazar su lógica if bucket <- sample(which(stacks!=100),1)y luego siempre incrementar la pila.

Adam C

1

Ah, acabo de notar eso yo mismo! Gracias por la captura. Definitivamente un error.

one_observation

1

¿Cómo estás calculando los intervalos de confianza? ¿Usando el bootstrap?

RobertF

3

Esta es una muestra bastante limitada. (Los fragmentos de código están en R)

> sample <- c(97,98,96,100,95,97)

Para una estimación inicial del número esperado en la población total y un valor de confianza del 95% para el precio, podemos comenzar con la media y el cuantil del 5%

> 100*mean(sample)
[1] 9716.667
> 100*quantile(sample,0.05)
  5% 
9525

Para ir más lejos, tendremos que crear un modelo teórico y hacer suposiciones adicionales. Hay varias fuentes de incertidumbre en juego: (1) incertidumbre para la forma funcional de un modelo de llenado de paquetes, (2) incertidumbre en la estimación de parámetros para el modelo y (3) error de muestreo.

$p$ $n=100$ $p$

> n <- 100
> (p<-1-mean(sample)/100)
[1] 0.02833333

$n\ge100$ $np \le 10$

> (lambda <- n*p)
[1] 2.833333

$\lambda =$ lambda

> var(sample)
[1] 2.966667

$\lambda_r =$ 100*lambda

> 100*100-100*lambda
[1] 9716.667
> 100*100-qpois(0.95,100*lambda)
[1] 9689

$p$ $p$ $\alpha$ $\beta$ $\alpha$ $\beta$ $\alpha = 1$ $\beta = 0$

$\alpha^* = 1+583$ $\beta^* = 0+17$

$\alpha^*$ $\beta^*$ $\alpha$ $\beta$

Ahora, suponiendo que cada paquete se llene de forma independiente, podemos ver la caja completa de paquetes como 10000 eventos independientes en lugar de 100 eventos de 100 subeventos. Por lo tanto, la media es 9717.138 con desviación estándar 69.57153. Usando la función de distribución, puede calcular el número de confianza del 95% para estar alrededor de 9593. He utilizado el paquete R VGAMpara sus *betabinom.abfunciones al hacerlo.

Entonces, la incertidumbre en el parámetro estimado reduce el precio de confianza del 95% en casi 100, y terminamos bastante cerca de nuestra aproximación simple inicial.

Cualquiera que sea el enfoque o modelo, se pueden usar datos adicionales para validar el modelo, es decir, para ver que los datos adicionales son razonables según el modelo teórico o si se justifican ajustes o un nuevo modelo. El proceso de modelado es similar al método científico.

A. Webb
fuente

2

En un apuro, mi primera inclinación sería calcular un intervalo de confianza del 95% para su media muestral sobre una distribución normal truncada que cae entre los límites inferior y superior de 90 y 100 etiquetas.

El paquete R le truncnormpermite encontrar intervalos de confianza para una distribución normal truncada dada una media de muestra especificada, desviación estándar de muestra, límite inferior y límite superior.

Como está tomando una muestra de n = 5 de una población relativamente pequeña (N = 100), es posible que desee multiplicar la desviación estándar de su muestra por un factor de población finito = [(Nn) / (N-1)] ^. 5 = 0,98.

RobertF
fuente

55

Me pregunto si las complicaciones adicionales de asumir una Normal truncada valen la pena, o incluso son válidas, dado que los recuentos son discretos y solo pueden tomar un pequeño número de valores posibles.

whuber

@whuber: es cierto, pero el intervalo de confianza se encuentra sobre la distribución de la media muestral, que es una cantidad continua. En lugar de usar un intervalo de confianza del 95%, quizás una mejor opción sería encontrar el área bajo la distribución entre cantidades discretas, digamos 93 y 99.

RobertF

Sin embargo, no necesita una Normal truncada para trabajar con la media de la muestra. Parece una complicación innecesaria.

whuber

1

El CLT no afirma que algo seguirá a una distribución normal truncada. El bootstrapping es probable que sea problemático porque se basa en resultados asintóticos para su validez.

whuber

1

Debido a que la desviación estándar de la media rápidamente se vuelve mucho más pequeña que el rango, el truncamiento es prácticamente irrelevante. Estamos hablando de una solución práctica que no se ve complicada por detalles innecesarios y posiblemente distractores.

whuber

2

Un enfoque rápido y simple es considerar todas las muestras posibles de tamaño 6. Solo hay 15,625 permutaciones. Mirando estos y tomando el promedio para cada caso, y luego clasificando los promedios y extrayendo el 5% cuantil, obtenemos un valor de 96.

Por lo tanto, la cantidad estimada que debería estar dispuesto a pagar es de aproximadamente 9600. Esto está en buen acuerdo con algunos de los enfoques más sofisticados.

Una mejora aquí sería simular una gran cantidad de muestras de tamaño 6 y usar el mismo procedimiento para encontrar el quinto percentil de las medias muestrales. Utilizando un poco más de un millón de resamples, encontré que el quinto percentil era 96.1667, por lo que al pago más cercano al dólar sería de 9617 dólares, que es solo una diferencia de 2 dólares del resultado del usuario 777 de 9615.

Soakley
fuente

1

¿Podría explicar por qué esta es una respuesta adecuada a cuánto se debe pagar? ¿Por qué no utilizar la media de la muestra, por ejemplo?

whuber

Usaría la media de muestra si quisiera tener un pago que esté alineado con la cantidad de etiquetas que cree que hay. Pero el interrogador pidió una garantía del 95% de que no pagaría más etiquetas de las que se hicieron. Entonces tenemos una idea de la distribución de la media muestral para muestras de tamaño 6 y usamos el percentil 5.

soakley

1

Sería bueno incluir esa explicación en su respuesta. También podría considerar explicar por qué cree que este procedimiento de remuestreo realmente produce un límite de confianza válido o confiable. Aunque puede hacerlo con muchos conjuntos de datos grandes, uno debe considerar si se puede usar de la misma manera con un conjunto de datos tan pequeño.

whuber

0

Parece que ya ha llegado a la conclusión de que el error se hizo intencionalmente, pero un estadístico no llegaría a tales conclusiones (aunque la evidencia parece respaldar esto).

Uno podría configurar esto como una prueba de hipótesis:

H0: El distribuidor es honesto pero bastante descuidado.

H1: El distribuidor es fraudulento y el déficit es intencional.

Supongamos H0, entonces cada desviación es un evento aleatorio con media = 0 e igual posibilidad de ser positivo o negativo. Supongamos además que las desviaciones se distribuyen normalmente. La desviación estándar para la distribución normal basada en las desviaciones en los 6 puntos de datos es sd = 1.722

Si el estadístico no recordaba muy bien su teoría, pero tenía R cerca (no es un escenario improbable), entonces podría escribir el siguiente código para verificar la probabilidad de no recibir desviaciones positivas (no paquetes de más de 100) si H0 es cierto.

numpackages=c(97,98,96,100,95,97)
error<-100-numpackages
errorStdev<-sd(error)
numSimulations<-1000000
max100orLes<-0
for(p in 1:numSimulations)
{
  simulatedError<-rnorm(6,mean=0,sd=errorStdev)

  packageDeviations<-round(simulatedError)

  maxValue<-max(packageDeviations)
  if(maxValue<=0)
  {
    max100orLes<-max100orLes+1
  }   
}
probH0<-100*max100orLes/numSimulations
cat("The probability the H0 is correct is:",probH0,"%")

El resultado de la simulación es:

The probability the H0 is correct is: 5.3471 %

La probabilidad de que el crupier sea honesto es solo del 5,35% y, por lo tanto, es muy probable que haya sido víctima de fraude.

Como usted dice que no se trata de una tarea, sino de una situación real para su empresa, deja de ser un ejercicio para calcular las etiquetas correctas de números esperados, sino que es un caso complicado de cómo manejar un proveedor deshonesto.

Lo que hagas desde aquí, realmente no puede ser respondido solo con estadísticas. Depende mucho de su influencia y relación con el distribuidor.

La mejor de las suertes !

Morten Bunes Gustavsen

Morten Bunes Gustavsen
fuente

1

17 / 6

$17/6$

1.72 / \sqrt{6} \approx 0.70

$1.72/\sqrt{6}\approx 0.70$

17 / 6 / 0.70 \approx 4.0

$17/6/0.70 \approx 4.0$

100

$100$

0.00003

$0.00003$

el fracaso siempre es una opción, por lo que podría haber cometido un error ... mis cálculos están documentados en el código R que he proporcionado, por lo que no debería haber ninguna razón para preguntarme cómo obtuve mi resultado. Sí, la hipótesis H0 en mi caso es que el distribuidor es honesto, y luego las desviaciones serían fluctuaciones aleatorias con una media de 100. El Stdev en mi cálculo es solo el Stdev de la serie (-3, -2, -4, 0, -5, -3), que es la desviación de 100 en cada paquete.

Morten Bunes Gustavsen

Realmente solo uso esta desviación normal, extraigo 6 muestras y compruebo si ninguna de ellas es mayor que 0. Ejecuto la simulación 1000,000 veces y contento cuántas veces tengo tanta mala suerte de no obtener ninguna muestra por encima de 0. Esto Resulta ser el 5,35% de los casos. La razón por la que elegí este ángulo fue que la pregunta declaraba explícitamente que se trataba de una situación real (es decir, no un ejercicio académico), y que le gustaría saber qué haría un estadístico en este caso.

Morten Bunes Gustavsen

3

La pregunta también decía que no había posibilidad de contar más de 100 etiquetas en un paquete. De todos modos, lo que ha hecho es una simulación extensa de números que se parecen a los datos, pero qué tiene que ver con la pregunta ("cuánto deberíamos pagar") es oscura.

whuber

-2

¿Qué tal algo como un modelo multinomial?

El problema de cada resultado se estima como 1/6, 1/6, .... (basado en las 6 observaciones) y, por lo tanto, E (x) = 97.16 y Var (x) = suma (95 ^ 2 * 1/6 + ...) - E (x) ^ 2 = 2.47 por lo que el IC del 95% sería [94, 100]

Xing
fuente

3

Esto no parece ser multinomial en absoluto: su IC parece ser un intervalo de teoría normal que utiliza la fórmula no corregida para la varianza. Además, ¿cómo responde la pregunta sobre cuánto pagar?

whuber

el multinomio se aplica al resultado, es decir, 95, 96, 97 ... 100 y sí, el IC es de teoría normal porque xe (x) / sd ~ N. cuánto pagar sería lo mismo que la expectativa, por lo que es 97.16 * 100

Xing

44

¿Notó que no usa la suposición multinomial en absoluto? Su IC es demasiado corto, como observó WS Gosset en 1908. Pero si va a basar su recomendación solo en la media de la muestra, ¿por qué calcular un IC?

whuber

Cuanto pagar Un problema practico

Respuestas:

El modelo bayesiano

¿Cuál es la forma apropiada de considerar el precio del lote?

Comparación con el bootstrap