Suponga que la población, de la cual suponemos que está muestreando al azar, contiene proporciones de promotores, de pasivos y de detractores, con . Para modelar el NPS, imagine llenar un gran sombrero con una gran cantidad de boletos (uno para cada miembro de su población) etiquetados como para promotores, para pasivos y para detractores, en las proporciones dadas, y luego dibujando de ellos al azar. El NPS de muestra es el valor promedio de los tickets que fueron sorteados. El verdadero NPS se calcula como el valor promedio de todos los tickets en el sombrero: es elp 0 p - 1pags1pags0 0pags- 1+ 1 0 - 1pags1+ p0 0+ p-1= 1+ 10 0- 1nortevalor esperado (o expectativa ) del sombrero.
Un buen estimador del NPS verdadero es el NPS de muestra. La muestra NPS también tiene una expectativa. Se puede considerar como el promedio de todos los NPS de muestra posibles. Esta expectativa pasa a ser igual a la verdadera NPS. El error estándar del NPS de muestra es una medida de cuánto varían los NPS de muestra entre una muestra aleatoria y otra. Afortunadamente, no tenemos que calcular todas las muestras posibles para encontrar el SE: se puede encontrar de manera más simple calculando la desviación estándar de los tickets en el sombrero y dividiendo por . (Se puede hacer un pequeño ajuste cuando la muestra es una proporción apreciable de la población, pero no es probable que sea necesario aquí).norte--√
Por ejemplo, considere una población de promotores, pasivos y 1/6 detractores. El verdadero NPS esp 0 = 1 / 3 ppags1= 1 / 2pags0 0= 1 / 3pags- 1= 1 / 6
NPS =1×1 / 2+0×1 / 3+-1×1 / 6= 1 / 3.
La varianza es por lo tanto
Var (NPS)= ( 1 - NPS )2× p1+ ( 0 - NPS )2× p0 0+ ( - 1 - NPS )2×p- 1= ( 1 - 1 / 3 )2× 1 / 2 + ( 0 - 1 / 3 )2× 1 / 3 + ( - 1 - 1 / 3 )2× 1 / 6= 5 / 9.
La desviación estándar es la raíz cuadrada de esto, aproximadamente igual a0,75.
En una muestra de, digamos, , esperaría observar un NPS alrededor de % con un error estándar de aproximadamente %.1 / 33240,75 /1 / 3 = 334.10.75 / 324---√=4.1
De hecho, no conoce la desviación estándar de los tickets en el sombrero, por lo que la estima utilizando la desviación estándar de su muestra. Cuando se divide por la raíz cuadrada del tamaño de la muestra, estima el error estándar del NPS: esta estimación es el margen de error (MoE).
Siempre que observe un número considerable de cada tipo de cliente (por lo general, aproximadamente 5 o más de cada uno lo harán), la distribución de la muestra de NPS estará cerca de lo normal. Esto implica que puede interpretar el MoE de la manera habitual. En particular, aproximadamente 2/3 del tiempo en que el NPS de muestra se ubicará dentro de un MoE del NPS verdadero y aproximadamente 19/20 del tiempo (95%) el NPS de muestra se ubicará dentro de dos MoE del NPS verdadero. En el ejemplo, si el margen de error fuera realmente del 4,1%, tendríamos una confianza del 95% de que el resultado de la encuesta (la muestra NPS) está dentro del 8,2% de la población NPS.
3.52+ 4.12---------√
Al comparar muchos resultados de encuestas a lo largo del tiempo, los métodos más sofisticados pueden ayudar, ya que debe hacer frente a muchos márgenes de error separados. Cuando los márgenes de error son bastante similares, una regla general cruda es considerar un cambio de tres o más MoEs como "significativo". En este ejemplo, si los MoEs rondan el 4%, entonces un cambio de alrededor del 12% o más durante un período de varias encuestas debería llamar su atención y los cambios más pequeños podrían descartarse válidamente como error de encuesta. En cualquier caso, el análisis y las reglas generales que se proporcionan aquí generalmente proporcionan un buen comienzo al pensar en lo que pueden significar las diferencias entre las encuestas.
0 00 01 / n--√norte
También podría usar el estimador de varianza para variables continuas. En realidad, lo preferiría sobre el estimador de varianza para la variable discreta aleatoria, ya que existe una corrección bien conocida para calcular la varianza de la muestra: https://en.wikipedia.org/wiki/Unditional_estimation_of_standard_deviation Como otros notaron, la solución de Whubers se basa en fórmulas de población. Sin embargo, dado que está realizando una encuesta, estoy bastante seguro de que ha extraído una muestra, por lo que recomendaría usar el estimador imparcial (dividiendo la suma de cuadrados por n-1, no solo por n). Por supuesto, para tamaños de muestra grandes, la diferencia entre el estimador sesgado e imparcial es prácticamente inexistente.
También recomiendo usar un procedimiento de prueba t, si tiene tamaños de muestra medianos, en lugar de usar el enfoque de puntuación z: https://en.wikipedia.org/wiki/Student 's_t-test
@whuber: ya que otros también lo han preguntado: ¿cómo calcularía el estimador de muestra imparcial para la varianza / sd para su enfoque de variable discreta aleatoria? Traté de encontrarlo por mi cuenta, pero no tuve éxito. Gracias.
fuente
Potencialmente puede usar bootstrap para simplificar sus cálculos. En R el código sería:
fuente