Tengo datos sobre cuántos usuarios publican cuántas preguntas. Por ejemplo,
[UserCount, QuestionCount]
[2, 100]
[9, 10]
[3, 80]
... ...
Esto significa que 2 usuarios publicaron 100 preguntas cada uno, 9 usuarios publicaron 10 preguntas y así sucesivamente. Entonces, ¿cómo puedo determinar si la UserCount, QuestionCount
distribución sigue una ley de poder?
Encontré el paquete poweRlaw . Sin embargo, solo puedo pasar un grupo de números para hacer la evaluación. (El ejemplo proporcionado en este paquete es la frecuencia de palabras). Entonces, ¿cómo uso este paquete? ¿O tengo algo mal? También tengo los datos de recuento pregunta de cada usuario, es decir, [100, 100, 10, 10, 10 ... ]
. Si paso estos datos al paquete, ¿qué obtendré?
Respuestas:
Según Clauset et al., Así es como se prueba la cola de la ley de potencia con el
poweRlaw
paquete:las dos últimas líneas pueden reescribirse como una sola línea
Además, en este punto, puede ver la estadística KS:
Esto podría tomar algo de tiempo, así que ve y toma una taza de té ...
poweRlaw
compare_distributions
comp
comp$test_statistic
data_pl
comp$p_two_side
Repita este paso con
disexp
,dispois
clases de comparar la ley de potencia con esas alternativas.fuente
data("moby")
y usarlo enmoby
lugar dedata
en mi ejemplo, como en la introducción