¿Cómo puede ser gaussiano el número de conexiones si no puede ser negativo?

14

Estoy analizando las redes sociales (no virtuales) y estoy observando las conexiones entre las personas. Si una persona eligiera a otra persona para conectarse aleatoriamente, la cantidad de conexiones dentro de un grupo de personas se distribuiría normalmente, al menos de acuerdo con el libro que estoy leyendo actualmente.

¿Cómo podemos saber que la distribución es gaussiana (normal)? Hay otras distribuciones como Poisson, Rice, Rayliegh, etc. El problema con la distribución gaussiana en teoría es que los valores van de a + (aunque las probabilidades van hacia cero) y el número de conexiones no puede ser negativo.+

¿Alguien sabe qué distribución se puede esperar en caso de que cada persona elija de forma independiente (al azar) a otra persona para conectarse?

niko
fuente
1
Aclaración: ¿Es la pregunta sobre el "número total de conexiones para todo el grupo" o "el número total de conexiones para una persona"? Mi respuesta asume implícitamente la última.
1
Distribución de Riley ? Esa es una nueva para mí. ¿Tienes una referencia o enlace?
parada el
3
"Rayleigh" tal vez?
whuber

Respuestas:

6

Cuando hay personas y el número de conexiones realizadas por la persona i , 1 i n , es X i , entonces el número total de conexiones es S n = n i = 1 X ini,1in,Xi . Ahora, si consideramos que X i son variables aleatorias, supongamos que son independientes y que sus variaciones no son "demasiado desiguales" a medida que se agrega más y más gente a la mezcla, entonces seaplica elTeorema del límite central de Lindeberg-Levy. Afirma que lafunción de distribución acumulativaSn=i=1nXi/2Xide la suma estandarizada converge al cdf de la distribución normal. Eso significa aproximadamente que un histograma de la suma se parecerá cada vez más a un gaussiano (una "curva de campana") a medida que crece.n

Repasemos lo que esto no dice:

  • No afirma que la distribución de sea ​​siempre exactamente normal. No puede ser, por las razones que señalas.Sn

  • No implica que el número esperado de conexiones converja. De hecho, debe divergir (ir al infinito). La estandarización es un replanteamiento y reescalamiento de la distribución; La cantidad de reescalado está creciendo sin límite.

  • No dice nada cuando no es independiente o cuando sus variaciones cambian demasiado a medida que n crece. (Sin embargo, hay generalizaciones del CLT para series de variables "ligeramente" dependientes).Xin

whuber
fuente
Tenga en cuenta que no interpreto la pregunta para afirmar que todos eligen exactamente a otra persona para conectarse, eso conduciría a una teoría estéril porque el número de conexiones se determinaría, no al azar. En cambio, he interpretado que todo el mundo cuando ingresan a la red elige conexiones al azar entre las otras n, terminando con un total de 0 a n conexiones. La suposición sobre las variaciones está asegurada cuando hay un límite en el número de conexiones que hará cualquier recién llegado y ese número tiene una aleatoriedad "mínima".
whuber
Xyo
1
@Andy No personas: la cantidad de conexiones realizadas. Lo importante es que debe haber una buena posibilidad de que el número de conexiones realizadas por individuos realmente varíe y no se establezca en una constante. Cuando eso sucede, la distribución limitante (del número de conexiones) está determinada por el número finito de conexiones iniciales que varían, por lo que no es posible acercarse asintóticamente a una distribución Normal.
whuber
1

La respuesta depende de los supuestos que esté dispuesto a hacer. Una red social evoluciona constantemente con el tiempo y, por lo tanto, no es una entidad estática. Por lo tanto, debe hacer algunas suposiciones sobre cómo evoluciona la red con el tiempo.

norte

PAGrosi(No de conexiones para ningún individuo=norte-1)=1

Si una persona selecciona a otra persona al azar para conectarse, eventualmente todos estarán conectados.

Sin embargo, las redes de la vida real no se comportan de esta manera. Las personas difieren en varios aspectos.

  1. En cualquier momento, una persona tiene un tamaño de red fijo y la probabilidad de que se realice otra conexión es una función del tamaño de su red (cuando las personas presentan a otras personas, etc.).

  2. Una persona tiene su propia tendencia intrínseca a formar una conexión (ya que algunos son introvertidos / exterovertidos, etc.).

Estas probabilidades cambian con el tiempo, el contexto, etc. No estoy seguro de que haya una respuesta directa a menos que hagamos algunas suposiciones sobre la estructura de la red (por ejemplo, densidad de la red, cómo se comportan las personas, etc.).


fuente
@Srikant ¿Podría explicar cómo deriva la "respuesta trivial"? (Debe haber algunas suposiciones no declaradas detrás de esto). ¿Y a qué teorema se refiere cuando concluye que "eventualmente todos estarán conectados"? ¡Eso no es del todo obvio!
whuber
@whuber Supongo que el tamaño de la red es fijo. La pregunta dice: una persona elige a otra persona al azar para hacer una conexión y presumiblemente este es un proceso continuo. Por lo tanto, a medida que el tiempo llega al infinito, todos deberían estar conectados. Sin teorema, solo intuición. Quizás, estoy usando un lenguaje impreciso.
@Srikant Todavía estoy confundido, porque después de mucho tiempo, "Prob (No of connections = n)" es igual a 1 cuando n = 3 y de lo contrario siempre es cero. Después de todo, cuando "todos deberían estar conectados", el número de conexiones es igual a n (n-1) / 2. Sospecho que puede tener varios procesos aleatorios diferentes en mente al mismo tiempo. Podría ayudar revelar las suposiciones que está haciendo y ser un poco más preciso.
whuber