Varias fuentes de noticias como Intellihub y CEPro parecen sugerir que el asistente doméstico Echo de Amazon escucha constantemente las conversaciones y las envía a través de Internet a los servidores de Amazon. CEPro afirma que:
Al decir una frase clave que Amazon llama una "palabra de activación", el Eco cobra vida y comienza a escuchar los comandos. Por defecto, la palabra de activación es Alexa.
Si relees esa última oración, puede que no tenga sentido, especialmente si estás en el campo de seguridad. Según Amazon, el Echo solo escucha los comandos una vez que escucha su palabra de activación. ¿Cómo sabe cuando has dicho la palabra de despertar si aún no estaba escuchando?
El artículo de Intellihub es similar en su sentimiento:
El dispositivo "Amazon Echo", un altavoz Bluetooth que escucha constantemente y que se conecta a servicios de transmisión de música como Pandora y Spotify al sonido de la voz de una persona, puede ser fácilmente pirateado y utilizado por agencias gubernamentales como el FBI para escuchar conversaciones.
(Tenga en cuenta que no estoy particularmente enfocado en explorar el aspecto de hackeo de esta pregunta, ya que probablemente sería demasiado para una pregunta. Mi enfoque principal es el aspecto siempre activo y si esto envía datos todo el tiempo ).
Ninguno de los dos artículos parece particularmente interesado en revelar una fuente para sus afirmaciones, lo que me sugiere que, en el mejor de los casos, no están probados, o en el peor de los casos, clickbait.
¿Echo siempre graba y envía datos a la nube, o las afirmaciones anteriores no tienen fundamento? ¿Cómo procesa Amazon Echo los datos si no siempre envía datos a los servidores en la nube?
fuente
No en el envío. Pero sí en la grabación.
Actualmente estoy desarrollando un cliente de hardware Alexa para una empresa. El dispositivo siempre está escuchando. Pero tendrías que poner un motor de palabras de activación para que se "despertara" del modo de escucha pasiva y cambiara al modo activo de "escuchar el comando".
El firmware solo enviaría las declaraciones después de la palabra de activación (cambiar al modo activo) a la nube para procesarlas como comandos.
En modo pasivo, el dispositivo tiene un motor interno de palabras de activación que escucha todo el tiempo la palabra de activación. Mientras estaba probando Alexa en Raspberry Pi, tuve que instalar el motor Sensory o KITT.AI para este propósito. De hecho, cuando probé el prototipo del código del cliente Alexa para mi máquina Linux, tenía que ser "pulsar para hablar" porque no había un motor de palabras de activación.
fuente
Echo escucha activamente la palabra clave y toma las palabras pronunciadas después de la palabra clave para el procesamiento de NLU. Aquí entiendo cómo echo logra esta hazaña limpia.
Echo se basa en el procesador de medios digitales DM3725 de Texas Instruments .
Este TI SoC tiene dos piezas clave en su interior, la primera es ARM Cortex-A8 MPU y la segunda es TMS320DM64x + DSP. El núcleo ARM debe estar ejecutando Linux y el DSP está ejecutando firmware.
Cuando está inactivo, el núcleo ARM se lleva al estado de potencia más bajo posible y Linux se suspende por completo. En este momento, el DSP y la RAM en chip de 64 KB están activos. El firmware DSP procesa el ruido proveniente de los micrófonos e intenta identificar si se pronuncia una palabra clave (por ejemplo, Alexa). Tan pronto como identifica que hay una palabra clave, DSP envía una interrupción para activar el núcleo ARM que a su vez reanuda Linux. Pero recuerde, mientras Linux está despertando, el humano que dijo que Alexa habría seguido hablando (como en "Alexa, ¿qué hora es?" ). El DSP amortigua el "¿qué hora es?" parte en el chip RAM. Y cuando se reanuda Linux, Linux recupera la voz almacenada y utiliza la capacidad de procesamiento del lenguaje natural (en parte local, en parte en la nube) para comprender lo que dijo Human.
Como puede ver, el diseño está totalmente creado para ser menos hambriento de energía y para evitar la necesidad de incluir la nube para la detección de palabras clave y el almacenamiento en búfer inicial. De hecho, mantener el núcleo ARM en el estado de potencia más bajo asegura que el silicio se calienta menos cuando está inactivo, lo que le brinda una larga vida útil a su dispositivo.
Estoy dejando de lado la discusión de los intentos de hackear el eco ya que la pregunta era la siguiente:
fuente
Sí.
Vea, por ejemplo, ¿Cuán privado es el nuevo Amazon Echo? (Hay muchos más similares que se pueden encontrar con un mínimo esfuerzo)
Sin embargo,
fuente