Tags:

La seguridad en el sentido informático es un tema que preocupa mucho a cualquier persona, sobre todo si nos referimos a la seguridad de los datos personales y a cualquier tipo de protección de la intimidad. Cada día generamos inmensas cantidades de datos en nuestro recorrido por las redes sociales, abriendo correos electrónicos, manteniendo conversaciones privadas en WhatsApp, navegando por cualquier sitio web, y también dando instrucciones de voz a asistentes como los de Google, Apple o Windows. ¿Por qué esos asistentes personales necesitan grabar nuestras voces y qué hacen con esos datos?

La respuesta la encontraremos en el aprendizaje automático, o lo que en inglés se conoce como machine learning. Se trata de conseguir que las máquinas consigan aprender a partir de los datos, y no a través de la programación. Es decir, se diseñan algoritmos de aprendizaje (esta sería la parte programada) que son capaces de aprender al procesar cantidades ingentes de datos. Esta particularidad, la de nutrir a los algoritmos con la cantidad de datos suficiente como para poder aprender, es también una de las principales dificultades para que el aprendizaje automático tenga éxito.

El machine learning> permite que sean posibles los coches autónomos, permite avanzar en el descifrado del genoma humano, y también hace posibles los asistentes por voz con inteligencia artificial. Estos últimos los utilizamos cada vez más, tanto en el smartphone como mediante aparatos domésticos tales como Google Home o Amazon Echo. Lamentablemente en estos momentos las interfaces de voz con estos aparatos están en inglés (no así en el smartphone, que podemos hacer consultas en español).

google-home

¿Qué supone que el aprendizaje automático de las máquinas necesite tantos datos para aprender y mejorar? En primer lugar, supone que toda la voz que escuchen los aparatos en cuestión se envíe a los servidores adecuados para su procesamiento. Esto significa que esos datos, nuestra voz y los comandos que enumeremos, queda grabada en algún sitio que no conocemos. Por ejemplo, si alguna vez has utilizado comandos de voz en Android puedes buscarlos en myactivity.google.com. También puedes eliminarlos y desactivar las opciones de activación por voz, pero este es otro tema.

Si no se graban y se reutilizan esos datos para alimentar los algoritmos, estos no aprenden y los asistentes no mejoran. Es la realidad, y es imposible hacer mejores asistentes por voz sin disponer de voz real, de comandos reales, o con su ruido de fondo aleatorio, que depende del lugar en el que estemos, incluso de la hora del día o de la cantidad de gente que tengamos alrededor.

Por tanto, por regla general, los sistemas de asistente personal guiados por voz necesitan nuestras voces y nuestras órdenes para mejorar, para combinar clips de audio y generar nuevas entradas, necesitan jugar y tratar con ellas para poder evolucionar y mejorar el servicio que nos proporcionan. Podemos desactivar las opciones de almacenamiento en los servidores, por supuesto, igual que podemos desactivar la escucha de dispositivos como Google Home, pero en ese caso tendremos un dispositivo inerte que no es mejor que un pisapapeles.

Ciertamente podemos pensar en la privacidad… pero en realidad lo que se estaría haciendo es utilizar fragmentos de órdenes a los asistentes en un sistema de aprendizaje automático, es decir, desligando cualquier dato personal o identificativo del contenido en sí. Por eso, sabiendo cómo funciona el machine learning y cómo aprende de verdad, entenderemos la necesidad de que esos fragmentos de voz, esos comandos, tengan que ser enviados para su procesamiento. Eso sí, podemos tener claro que los envíos estarán cifrados y que solo en el destino será posible procesarlos.

Vía | Wired