Maldita Tecnología
03/11/2020

Filtros de Instagram, datos que usan empresas para llamarnos y bots: llega el 22º consultorio de Maldita Tecnología

¡Hola, malditas y malditos! Ya estamos aquí un martes más dando respuesta a esas inquietudes que os acompañan todos los días hasta que, por fin, nos preguntáis por ellas. Hoy respondemos a dudas sobre bots, sobre filtros de Instagram o TikTok y sobre las empresas que nos llaman para ofrecernos sus productos sin saber bien de dónde sacan nuestro número.

Ya sabéis, que arrancarse esa espinita de curiosidad os va a sentar bien: preguntadnos todo lo que queráis o necesitéis saber a través del correo [email protected], a nuestro Twitter, Facebook o directamente a través de este formulario.

¿Cómo consiguen los filtros de Instagram o TikTok cambiarme el pelo y diferenciarlo de mi camisa? ¿O los ojos? 

¿Preparados para convertiros en matemáticos e ingenieras durante un ratito? Esta pregunta no se resuelve sin meternos de lleno en el mundo técnico con el que funciona la inteligencia artificial, así que vamos allá. Lo primero que tenemos que saber es que en este proceso no actúa una sola aplicación tecnológica mágica. También, vamos a ver similitudes con cosas que ya os hemos explicado, como la tecnología de reconocimiento facial.

Imagen: Maroon5/Giphy.

“Los filtros de Instagram (y de otras aplicaciones) se nutren de una gran variedad de técnicas desarrolladas dentro del campo de la visión por computador (computer vision). Este campo de la ciencia e ingeniería se centra en hacer que las máquinas vean o, dicho de otra forma, que sean capaces de extraer información útil a partir de imágenes”, nos explica nuestro maldito David Castillo, doctorando en el instituto de Sistemas Inteligentes y Aplicaciones Numéricas en Informática (SIANI) de la Universidad de Las Palmas de Gran Canaria.

Para que esas máquinas consigan ver, hay que entrenarlas con miles y miles de imágenes de lo que necesita detectar. Si son gatos, gatos. Sin son caras, caras. De modo que cuando al programa informático se le presente una cara nueva que no tenía registrada en su base de datos, pueda detectar que es una cara humana. En otra ocasión, os explicamos cómo funcionaba una aplicación que también tenía que detectar a personas en un vídeo y eliminarlas.

Castillo recuerda que cada filtro es distinto y probablemente cada uno utilice técnicas adaptadas a cómo tiene que ajustarse a nuestra cara, pero su funcionamiento se suele apoyar en cuatro tareas esenciales de reconocimiento facial: la detección de caras, la detección de ojos, nariz y/o boca, la detección de puntos de referencia (llamados landmarks) y una estimación de profundidad.

68 puntos de referencia facial estándar y los 5 básicos para orientación facial y expresión de ojos.
Imágenes cedidas por David Castillo.

José Luis Calvo, director de Inteligencia Artificial en Sngular, que también nos ayuda con esta explicación, define los landmarks como puntos concretos que se asocian a partes de nuestra cara y que dan más precisión al programa informático que está reconociéndolos. Por ejemplo, se pueden usar landmarks para filtros complejos que tienen que colocarnos algo en el lagrimal del ojo, no cubrirnos el ojo entero.

“El reconocimiento facial funciona así, te identifica esos puntos de la cara: no es lo mismo certificar que tu cara y la de que aparece en tu documento es la misma, que identificarte dónde estás en una base de datos, pero toda la base es la misma”, explica Calvo.

Bien, ¿y qué clase de programa informático es capaz de hacer eso? Como os hemos dicho antes, es una tecnología basada en la inteligencia artificial. Es decir, que es un programa capaz de hacer tareas de forma automatizada y también de aprender nuevas si le damos más datos. No hay un solo tipo de inteligencia artificial, sino que es una rama que utiliza diferentes técnicas en función del problema que necesite resolver.

Una de ellas son las redes neuronales. Para esta labor, Calvo nos explica que se usan “redes neuronales convolucionales” y técnicas de “visión por computador”, que hemos explicado un poco más arriba. Este modelo computacional es el que se encarga en este caso de detectar con cada nueva cara dónde están la nariz, los ojos, si abrimos la boca, etc.

La cosa no termina ahí, porque Castillo nos explica que algunos filtros más avanzados, como los que nos maquillan o envejecen la cara, tienden a apoyarse en una reconstrucción 3D de ella: “Para ello, tienen que hacer un seguimiento constante de los puntos de referencia y calcular cuánto se desplazan de un fotograma a otro”.

Esto también tiene que ver con la profundidad: “Una regla sencilla es que los puntos que más se mueven estarán probablemente más cerca de la cámara, mientras que los que menos se mueven estarán más lejos”, añade.

Imagen cedida por David Castillo.

En realidad, todo esto que hemos explicado no es nada fácil de enseñar a una máquina. Castillo explica que las máquinas son muy eficaces “en el cómputo de tareas repetitivas y mecánicas”, pero para estas tareas de reconocimiento y detección facial entran en un campo que catalogan como tareas abstractas. Esas que las personas conseguimos hacer a base de experiencia y donde no hay unas reglas bien definidas.

“¿Sabes cuando ves a alguien de lejos y lo reconoces? ¿A que no sabrías explicar por qué lo reconoces? No es que camine muy rápido, o muy lento, o levantando mucho las piernas, o poco... pero tiene ‘algo’ que te hace saber que es esa persona”, incide Castillo.

Esos puntos (que en realidad tú no usas tanto como referencia) son los que se llevan utilizando durante años para entrenar a las máquinas a identificar a las personas. O en su defecto, a predecir aspectos de su personalidad. Este vídeo es un ejemplo de cómo se enseña a un programa basado en IA a clasificar a personas según su estado de ánimo: 

Vídeo originalmente subido por la revista Wired.

Son técnicas que se estudian como ‘inteligencia artificial emocional’, una disciplina que especialistas concluyen que no da buenos resultados de lo compleja que es y que puede causar discriminación en según qué situaciones. Imagina, por ejemplo, un programa informático que te analizara la cara durante una entrevista de trabajo y te considerara apto/a o no en función de lo que sonríes, cómo te mueves, si giras mucho la cabeza, etc. Por eso hay que ser consciente de las limitaciones que a día de hoy tiene la inteligencia artificial y aplicarla sólo en los casos en los que su posible discriminación no sea un riesgo. 

¿Puede una empresa obtener mi número de teléfono del censo para hacer llamadas comerciales?

Nos habéis preguntado si esto es posible y la respuesta es que no. Por muchas razones, pero la principal es que en el censo no aparece nuestro número de teléfono y que ninguna empresa puede acceder a esa clase de datos para hacer una campaña comercial sin enfrentarse a una sanción. Además, es algo que como usuarios, podéis denunciar.

El censo es un fichero público que recopila información sobre la población que puede votar. Aparte de nuestro nombre completo y nuestro DNI, incluye información sobre el domicilio y la provincia en la que residimos, en la que hemos nacido y también sobre nuestro grado de escolaridad o nuestro sexo. No incluye nuestro número de teléfono:

Captura de pantalla de los datos que figuran en el fichero del censo al que podemos acceder de forma digital.

Eso sí, no es inaudito que alguien se haya aprovechado del censo para utilizar datos de forma fraudulenta. En 2011, fue muy sonado el caso de un hombre llamado José Vicente Lucas, que se lucró vendiendo por poco más de 200 euros información personal de alrededor de 35 millones de electores. Distribuía los ficheros a través de una página web llamada “saberlotodo.com”, a la que la Agencia Española de Protección de Datos (AEPD) multó en varias ocasiones. Especialmente, porque no cesaba la actividad.

Cualquier empresa o persona individual a la que se le ocurriese utilizar los datos del censo para venderlos a compañías o simplemente distribuirlos, se enfrentaría a una multa considerable en caso de ser denunciada. Pero esto no sólo aplica al censo, sino a la comunicación de datos personales a terceros en general.

“La ley te obliga cuando llamas a cualquiera a decir de dónde han sacado tu número de teléfono si no los has obtenido directamente del usuario. Normalmente, el teleoperador que te asalta estaría obligado a decir de dónde ha sacado tu dato: si de una tarjeta de afiliación, de un registro en una promoción, etc.”, explica a Maldita Tecnología, Jorge García Herrero, abogado especializado en protección de datos en el Grupo Secuoya. 

Así lo dicta el artículo 14 del Reglamento General de Protección de Datos (RGPD): cuando los datos no se han obtenido directamente a través del interesado deben explicar entre otras cosas “la fuente de la que proceden los datos personales y, en su caso, si proceden de fuentes de acceso público”.

¿Qué pasa? Que esto no ocurre nunca, en parte porque no nos conocemos al dedillo las normas que tienen que seguir las empresas en materia de protección de datos y a qué tenemos derecho como consumidores. 

Es más, si tienes la certeza de que no has entregado tus datos a la empresa que te llama ni son capaces de explicarte con exactitud cómo los han conseguido, puedes interponer una denuncia ante la AEPD, según nos explica García Herrero.

También está el hecho de que a día de hoy, el mercado de compra-venta de datos personales es una verdadera jungla. Ya no solo intervienen los datos que se obtienen a partir de las aplicaciones que usamos o que sacan las tecnológicas y las redes sociales, sino que hay empresas de márketing dedicadas especialmente a recabar datos personales de fuentes públicas, registros, transacciones online, nuestra navegación… A estas compañías se las llama data brokers.

Imagen: LFDigita/Giphy.

García Herrero asegura que a la hora de hacer campañas comerciales, muchas empresas recogen y compran datos de donde pillan, incluidas estas compañías dedicadas a empaquetar datos personales y venderlas a otras.“Que un dato personal se haya hecho manifiestamente público por una persona, no quiere decir que cualquiera otro titular, pueda captarlo y utilizarlo para lo que le dé la gana”, afirma el abogado.

Nos habéis nombrado una empresa concreta que ha dicho obtener los datos de esta manera: Securitas Direct. Hemos contactado a la compañía, que nos asegura que desde su departamento de contacto realizan llamadas a personas que han dejado sus datos en su página web o que obtienen gracias a las diferentes campañas que realizan. 

Como ya os hemos comentado, muchas empresas obtienen nuestros datos de contacto a través de data brokers o de campañas anteriores (ya que en algunas ocasiones guardan los datos durante años). Sin embargo, también os animamos a ser especialmente cuidadosos con dónde introducís vuestros datos de contacto: en promociones, en registros para ofertas, en formularios en páginas web… En los Términos y Condiciones muchas veces avisan de que esos datos se comparten con la empresa X y no nos habríamos dado ni cuenta.

¿Cómo podrían detectarse cuentas en redes sociales dedicadas a hacer campañas de astroturfing? ¿Hay algunos pasos sencillos y comprensibles para alertar de que estamos ante una cuenta-bot?

El mundo de las redes sociales es de todo menos sencillo y cuando introducimos términos como el “astroturfing” ya ni os contamos. La actuación de bots en algunas de ellas es un fenómeno que no es nuevo, pero que cada vez está llegando más y más a los oídos de los usuarios. La pregunta que nos habéis hecho no tiene una respuesta fácil ni tampoco de sí o no, así que vamos a intentar explicar qué son y por qué es tan difícil detectarlos.

Lo primero es lo primero: un bot es un programa informático que se desarrolla para que realice una tarea de forma repetitiva. En las redes sociales, se puede configurar para que deje comentarios a otras cuentas o que interactúe con ellas de forma automática. Por eso en este contexto se dice que sirven para amplificar mensajes.

Un bot se puede anunciar de modo que todo el mundo vea que es un programa dirigido por personas (es decir, que no es un usuario real) o puede usarse para crear un perfil falso y engañar al resto de usuarios. Al fenómeno de que se usen de manera coordinada para apoyar una campaña y hacer que esta llegue a más gente con un impulso que en realidad es artificial, se le llama astroturfing.

Detectar este segundo escenario es tremendamente complicado, así como averiguar quién los controla y para qué. Se pueden usar con fines comerciales (empresas que usan bots para promocionar un hashtag o hacer que nos encontremos más veces sus productos) o políticos. En los últimos años se han detectado campañas de bots actuando para varios partidos políticos, independientemente de su ideología: PP, PSOE, ERC, etc., especialmente en la red social Twitter, la que más se analiza.

Mariluz Congosto, doctora en Telemática por la Universidad Carlos III y licenciada en Informática por la Politécnica de Madrid es una de las analistas referentes en España sobre este tema. Para hacernos una idea de lo complicado que es detectar una campaña de astroturfing, enlazamos una de sus investigaciones. Paso a paso describe cómo rastreó la actividad de una cuenta de Twitter para concluir que era un perfil falso dedicado a amplificar un discurso de forma artificial.

Otro de los analistas de estas campañas en Twitter, Javier Barriuso, compara este “hinchado artificial” con un agujero negro: “Sabes que está ahí pero no lo puedes ver salvo por los indicios”. ¿Cuáles pueden ser esos indicios?

En su blog, Marcelino Madrigal, experto informático en el análisis de redes, da algunas pistas que, combinadas, sugieren que una cuenta de Twitter podría ser falsa:

  • Cuentas creadas recientemente que se involucran mucho en un tema concreto.
  • Que usan de imagen de perfil a mujeres jóvenes o posando como modelos. 
  • Que su actividad se reduce a hacer retuits a determinadas cuentas.
  • Que tiene pocos seguidores, de los cuales muchos son parecidos y con poca actividad.
  • Su handle (el alias con el que nos registramos) incluye una cadena de números aleatoria junto al nombre.

Esta última indicación es porque al crear una cuenta en Twitter, la red social nos recomienda automáticamente un alias generado con nuestro nombre y varios números aleatorios. Ese número “matrícula” es un indicador más, igual que el que una cuenta no se identifique pero utilice una foto de una mujer posando. De forma aislada no sirven para esclarecer que una cuenta es falsa o que es un bot.

“Es muy común el uso de mujeres con apariencia de modelos, más que de hombres. Luego hacer búsquedas inversas de la foto y resulta que encuentras la foto en un blog, una página de citas, etc.”, explica Barriuso a Maldita Tecnología.

Otra de las técnicas que señala Barriuso es el comprobar la actividad pasada que tiene una cuenta: “Buscando a través de las herramientas que te da Twitter, puedes ver que un usuario hace tres años hablaba de Gran Hermano o del deporte, de un equipo determinado, y ha dejado de hacerlo”. En este post de Madrigal se explica cómo hacerlo.

También investigan si ha cambiado de nombre: “Aunque haya borrado sus tuits, las respuestas de otros usuarios no se pueden borrar y en ellas a veces se ve que aparece otro nombre. No es malo, pero si empiezas a rastrear esa cuenta concreta, a veces llegas a ver que sus tuits se han lanzado para una determinada acción”, añade.

Todas estas tácticas se usan para aprovechar el alcance de una cuenta. Si por ejemplo una cuenta había llegado a tener bastantes seguidores con una campaña, para no perderlos en la siguiente se le cambia el nombre y “empezar de cero”. Las personas especializadas en estos análisis tienen herramientas para detectarlas, incluidos programas informáticos diseñados para analizar en profundidad una cuenta, sus seguidores, su contenido, etc. Como os decíamos, no es tarea fácil para el usuario medio

 En el ámbito político es donde se hacen principalmente este tipo de análisis por la forma en la que los bots y las cuentas falsas pueden interactuar con personas reales que tienen cierta influencia, como los propios políticos, nos explica David Álvarez, analista y consultor en social media

Sin embargo, es cierto que el uso de bots no solo se puede encasillar en este tipo de actuaciones, ya que también hay bots “buenos”, por decirlo de alguna manera. Son simplemente programas o cuentas que se automatizan para un fin determinado, como analizar páginas web para comprobar precios de productos, por ejemplo.

¡No os vayáis!

No somos técnicos o ingenieros pero contamos con mucha ayuda de personas que son expertas en su campo para resolver vuestras dudas. Tampoco podemos deciros qué servicio usar o dejar de usar, solo os informamos para que luego decidáis cuál queréis usar y cómo. Porque definitivamente, juntos y juntas es más difícil que nos la cuelen.

Si tienes cualquier duda sobre esta información o cualquier otra relacionada con la manera de la que te relacionas con todo lo digital, háznosla llegar:

En este artículo ha colaborado con sus superpoderes el maldito David Castillo Bolado.

Gracias a vuestros superpoderes, conocimientos y experiencia podemos luchar más y mejor contra la mentira. La comunidad de Maldita.es sois imprescindibles para parar la desinformación. Ayúdanos en esta batalla: mándanos los bulos que te lleguen a nuestro servicio de Whatsapp, préstanos tus superpoderes, difunde nuestros desmentidos y hazte Embajador.

Primera fecha de publicación de este artículo: 03/11/2020.

Otros artículos de Maldita.es