Dado un cuadro de control que muestra los límites de control medio y superior / inferior, ¿cómo puedo saber si la causa de los puntos fuera de control es asignable o no?

8

Examen de práctica IEEE CSDA - Estadísticas de ingeniería - Cuadro de control

Me dan 15 puntos. Los límites de control están en +/- 3σ. Los puntos 1, 4, 5, 6, 7, 8, 9, 10, 11, 13 y 15 caen dentro de los límites de control. Los puntos 2, 3, 12 y 14 están fuera de los límites de control, con 2 por debajo del límite de control inferior y 3, 12 y 14 por encima del límite de control superior.

¿Cómo sé si los puntos 2, 3, 12 y 14 están fuera de control causados ​​por causas fortuitas o por causas asignables?

Thomas Owens
fuente
1
Si alguien quiere que lo haga, puedo producir un gráfico similar al que me dieron y vincularlo aquí. Esta pregunta proviene de un examen de práctica de IEEE Certified Software Development Associate: la respuesta correcta es aparentemente "fuera de control causada por causas asignables". Desafortunadamente, no sé por qué esa es la respuesta: dije "fuera de control causado por causas fortuitas" ya que no hay una serie de puntos fuera de control.
Thomas Owens
Sí, el gráfico sería útil. Como se indicó en mi respuesta, el aspecto del gráfico también es importante, no solo qué puntos están fuera de los límites de control.
Carlos Accioly
Acabo de agregar una imagen de la pregunta, gráfico incluido. Marqué la respuesta correcta también.
Thomas Owens

Respuestas:

6

Sí, debe encontrar una causa asignable para cada punto que esté fuera de los límites. Pero las cosas son un poco más complicadas.

Primero debe determinar si el proceso está bajo control, ya que un gráfico de control no tiene sentido cuando el proceso está fuera de control. Casi 1/4 de sus observaciones que caen fuera de los límites es una buena señal de que el proceso puede estar fuera de control. Mirar el gráfico sería útil para determinar si el proceso está bajo control o no.

Además de caer fuera de los límites de control, existen otras razones potenciales para la necesidad de buscar causas asignables para ciertas observaciones. Por ejemplo, si tiene varias observaciones seguidas que caen en el mismo lado de la media, especialmente si están cerca del límite de control, es posible que deba asignar una causa especial.

Podría ser más específico si publicaras el gráfico en sí.

Si desea obtener más información sobre los gráficos de control, SPC Press tiene varios recursos gratuitos útiles. También puede consultar este libro : es breve, conciso y muy informativo.

(Editar:)

Supuse que estábamos hablando de datos del mundo real, no de una pregunta de examen. En este caso, la respuesta correcta es realmente la primera: los puntos fuera de los límites de control son (probablemente) causados ​​por causas asignables.

Sin embargo, el examen es un poco descuidado en su terminología: en realidad no se puede decir con 100% de certeza que los puntos fuera de los límites de control no son causados ​​por casualidad. Solo puede decir que hay una probabilidad del 99.7% de que un punto en particular fuera de los límites no sea causado por casualidad.

Carlos Accioly
fuente
Agregué una imagen que incluye la pregunta original y el gráfico.
Thomas Owens
5

Mi comprensión de los gráficos de control es un poco diferente ... Después de la primera señal en la observación 2, ¿no se detendría el proceso y se verificaría si tuviera problemas, y luego se reiniciaría?

En cualquier caso, podría usar un argumento de valor p. La probabilidad de observar 4 o más observaciones (de 15) más allá de sus límites de control es MUY pequeña si el proceso está realmente en control. Digamos que la probabilidad de que una observación salga de los límites de control mientras el proceso está realmente bajo control es de aproximadamente 0.01 (esta probabilidad exacta depende de la distribución de los datos bajo control), por lo que si el proceso está bajo control, esperamos un falso alarma (es decir, señal fuera de control causada por azar) cada 100 observaciones más o menos. La probabilidad de observar 4 o más señales fuera de control (de 15) mientras el proceso está bajo control es de aproximadamente 0.000012, por lo que es muy poco probable que las señales se deban a una posibilidad aleatoria.

Si bien un diagnóstico real requeriría que mire la tabla y posiblemente investigue el proceso físico, debido a que los puntos fuera de control están por debajo y por encima de los límites de control, apuesto a que hubo un cambio de escala (es decir, un aumento en la varianza. )

Bestia peluda
fuente
Solo tomé un curso en Estadísticas de ingeniería, pero parece recordar que no se detiene el proceso hasta que tenga 3 (quizás 2) puntos que están fuera de control. Sin embargo, su segundo argumento tiene sentido, donde un proceso verdaderamente en control no tendría 4/15 observaciones fuera de +/- 3 std dev. Desafortunadamente, no tengo mi libro EngStats en casa para verificar eso. Al menos es plausible. +1 por ahora, hasta que pueda investigar esto un poco más. Pero al menos es un punto de partida.
Thomas Owens
(+1) Buena respuesta. Alternativamente, suponiendo que la desviación estándar se haya estimado previamente a partir de una serie de datos muy larga, uno podría preguntarse sobre la normalidad de la distribución. Además, estos 15 puntos probablemente no fueron una selección aleatoria: deben haber sido elegidos como una secuencia corta en la que apareció un número inusual de mediciones de COO. El primero sugiere que la posibilidad de un solo OOC puede ser bastante mayor que 0.01, mientras que el segundo indica que el cálculo binomial es engañoso. Después de todo, ¡es prácticamente seguro que tal secuencia eventualmente ocurrirá por casualidad!
whuber
Agregué una imagen que incluye la pregunta original y el gráfico.
Thomas Owens
3
@Thomas Todavía me parece una mala pregunta. Intenta medir dos conceptos (cómo leer un cuadro de control y la distinción entre causas "asignables" y "casuales"), que es un error, y castiga al examinado reflexivo que sabe que se necesita mucha más información para interpretar los puntos OOC que se dan aquí, que es el error más atroz.
whuber
4

(Perdón por publicar una nueva respuesta, todavía no puedo responder a los comentarios directamente)

Realmente no estoy de acuerdo con la declaración:

"Aparentemente, si cruzas la UCL o la LCL, tiene que haber una causa asignable"

Para simplificar las cosas, si su distribución de control es N (0,1), aún obtendrá falsas alarmas una vez cada 370 observaciones, en promedio, utilizando un UCL de 3 y un LCL de -3. Cuando el cuadro señala, el proceso necesita ser investigado. Solo entonces se puede asignar un motivo para la señal (es decir, cambio de proceso o error aleatorio). La configuración de UCL y LCL requiere que el usuario equilibre la tasa de detección de falsa alarma / pérdida deseada (análoga a la compensación de error Tipo I / Tipo II en prueba de hipótesis.)

También puede esperar hasta unas pocas señales para detenerse e investigar el proceso, pero en ese caso, puede detectar el cambio demasiado tarde si realmente ocurrió en la primera señal. Una vez más, no puede tener algo por nada y el usuario debe usar su criterio para decidir cómo configurar el cuadro de control y monitorear el proceso.

Bestia peluda
fuente
2

Encontré algo interesante escondido en un documento de estudio del IEEE dirigido a este examen:

  • Los puntos de datos que se encuentran dentro del rango UCL y LCL se consideran controlados y causados ​​por causas fortuitas.
  • Los valores atípicos que caen por encima de la UCL o por debajo de la LCL se consideran fuera de control y causados ​​por causas asignables.
  • Si varios puntos caen sistemáticamente por encima o por debajo de la media (pero están dentro de UCL y LCL), esto puede indicar un estado de control no aleatorio.
  • El objetivo de un gráfico de control es detectar rápidamente los estados fuera de control.
  • El cuadro, por sí solo, no indicará las causas raíz del evento, pero proporcionará pistas de investigación.

Aparentemente, si cruzas la UCL o la LCL, tiene que haber una causa asignable.

Esto tiene sentido, dada la definición de Wikipedia de las características de causa asignable (especial) :

  • Fenómenos nuevos, imprevistos, emergentes o previamente descuidados dentro del sistema;
  • Variación inherentemente impredecible, incluso probabilísticamente;
  • Variación fuera de la base de experiencia histórica; y
  • Evidencia de algún cambio inherente en el sistema o nuestro conocimiento del mismo.
Thomas Owens
fuente
OK, gracias por la aclaración: resuelve tu pregunta original. "Asignable" parece significar "no atribuible al azar", lo cual es consistente con la dicotomía en la pregunta. Con lo que estoy luchando es con la suposición de que los eventos OOC no pueden deberse al azar. Esto está claramente equivocado, como ha notado @HairyBeast. Otro aspecto llamativo del documento de estudio es cuán informal, poco cuantitativo y ad hoc parece, como en "varios puntos" (¿cuántos?) Y "sistemáticamente" (¿qué significa?). Parece referirse a CUSUM o ejecuta gráficos sin proporcionar pautas apropiadas para su uso.
whuber
2
@whuber Estoy totalmente de acuerdo. Teniendo en cuenta que esto es publicado y mantenido por el IEEE, esperaba mucho mejor. Me pregunto si están agitando a mano un montón de cosas porque es una certificación de ingeniería de software, y no quieren profundizar demasiado en otras cosas. Pero eso no es excusa para algo de esta confusión.
Thomas Owens el