Un instructor en mi universidad planteó una pregunta como esta (no para la tarea ya que la clase terminó y yo no estaba en ella). No puedo entender cómo abordarlo.
La pregunta se refiere a 2 bolsas que contienen una variedad de diferentes tipos de frutas:
La primera bolsa contiene la siguiente fruta seleccionada al azar:
+ ------------- + -------- + --------- + El | diámetro cm | masa g | ¿podrido? El | + ------------- + -------- + --------- + El | 17,28 | 139,08 | 0 | El | 6,57 | 91,48 | 1 | El | 7,12 | 74,23 | 1 | El | 16,52 | 129,8 | 0 | El | 14,58 | 169,22 | 0 | El | 6,99 | 123,43 | 0 | El | 6,63 | 104,93 | 1 | El | 6,75 | 103,27 | 1 | El | 15,38 | 169,01 | 1 | El | 7,45 | 83,29 | 1 | El | 13,06 | 157,57 | 0 | El | 6,61 | 117,72 | 0 | El | 7,19 | 128,63 | 0 | + ------------- + -------- + --------- +
La segunda bolsa contiene 6 frutas seleccionadas al azar de la misma tienda que la primera bolsa. La suma de sus diámetros es de 64,2 cm y 4 están podridos.
Dar una estimación de la masa de la segunda bolsa.
Puedo ver que parece haber dos tipos diferentes de fruta con diámetros y masas normalmente distribuidos, pero no sé cómo proceder.
regression
estimation
rutilusk
fuente
fuente
Respuestas:
Comencemos trazando los datos y echémosles un vistazo. Esta es una cantidad muy limitada de datos, por lo que será algo ad hoc con muchos supuestos.
Así que estos son los datos, los puntos rojos representan frutas podridas:
Tienes razón al suponer que parece haber dos tipos de frutas. Los supuestos que hago son los siguientes:
Debido a que se da que la suma del diámetro es de 64,2 cm, lo más probable es que dos frutos sean grandes y cuatro pequeños. Ahora hay 3 casos para el peso. Hay 2, 3 o 4 frutas pequeñas podridas ( una fruta grande podrida no afecta a la masa por suposición ). Entonces, ahora puede obtener límites en su masa calculando estos valores.
Podemos estimar empíricamente la probabilidad de que el número de frutos pequeños se pudra. Utilizamos las probabilidades para ponderar nuestras estimaciones de la masa, dependiendo del número de frutos podridos:
Dándonos una estimación final de 691.5183g . Creo que tiene que hacer la mayor parte de las suposiciones que he hecho para llegar a una conclusión, pero creo que podría ser posible hacerlo de una manera más inteligente. También tomo muestras empíricamente para obtener la probabilidad del número de frutos pequeños podridos, eso es solo pereza y se puede hacer "analíticamente".
fuente
Yo propondría el siguiente enfoque:
Todo esto es manejable mediante un simple script.
fuente
Los enfoques múltiples incluyen, desde el más simple hasta el complejo,
. . .
métodos combinatorios
Los enfoques se organizan en orden de simplicidad de cálculo, no en orden de que ningún enfoque sea mejor, o que no sea bueno en absoluto. La selección de qué enfoque usar depende de qué características de la población se conocen o se asumen. Por ejemplo, si las masas de frutas en la población de la tienda están normalmente distribuidas e independientes de los diámetros y el estado de pudrición, se podría usar el primer enfoque más simple sin ninguna ventaja (o incluso desventajas del error de muestreo de múltiples variables) de usar enfoques más complejos . Si no son variables aleatorias distribuidas idénticamente independientes, entonces una elección más compleja dependiendo de la información conocida o supuesta sobre la población puede ser mejor.
fuente