¿Qué método se usa en el correlato de Google?

8

Aquí hay una consulta reciente de correlación de Google:
http://www.google.com/trends/correlate/search?e=internet+usage&t=weekly#

Como puede ver en el cuadro de búsqueda en ese enlace, ingresé "uso de internet" y Google hizo el resto. Muestra un valor de 0.9298 como la "correlación" con la consulta "minería de datos". Sin embargo, cuando leo la página 2 del documento técnico de Google [PDF] , dice:

The objective of Google Correlate is to surface the queries in
the database whose spatial or temporal pattern is most highly correlated
with a target pattern. Google Correlate employs a novel approximate nearest
neighbor (ANN) algorithm over millions of candidate queries in an online
search tree to produce results similar to the batch-based approach employed
by Google Flu Trends but in a fraction of a second. For additional details,
please see the Methods section below....

Entonces, mi pregunta es:
¿Google está usando una correlación normal de Pearson o Spearman para encontrar estas cosas o están usando otra cosa? Si es así, ¿puedes explicar la técnica general?

==================

Además, observe en la trama que la búsqueda de "uso de internet" (y "minería de datos") cae durante los meses de verano y realmente se sumerge en Navidad. Supongo que los niños y su tarea tienen algo que ver con esto.

bill_080
fuente
3
¿No son estos solo coeficientes de correlación de Pearson como se informa en el tutorial ? (Sección de consultas correlacionadas )
chl
2
@chl: tienes razón. Hice clic en las preguntas frecuentes, pero el Whitepaper me desvió. Entonces, están usando la correlación de una serie de tiempo (no el cambio en la serie de tiempo). Eso es como calcular la correlación del precio de una acción, no los rendimientos. Eso es un poco sorprendente.
bill_080
3
@chl: aunque su respuesta es un poco obvia, sigue siendo una respuesta, y debe hacerlo, para que pueda ser aceptada.
naught101
1
@ bill_080 ¿Alguna respuesta de google sobre por qué los datos difieren entre los dos sistemas? En realidad, encontré esta pregunta buscando una explicación relacionada con su observación
chandler
1
@chandler: Google nunca respondió el correo electrónico. Jugué con Trend y Correlate por un tiempo, pero ninguno fue tan útil como esperaba, así que seguí adelante.
bill_080

Respuestas: