Detección de bots en twitter (I): Botcheck

Desde el auge de las redes sociales, el incremento del volumen de información a nuestro alcance y la facilidad para viralizarla ha hecho que la cantidad de información falsa a la que estamos expuestos sea mayor que nunca. Las principales medidas para hacer frente a esta situación son intentar contrastarla con fuentes fiables o recurrir a mecanismos o herramientas para automatizar el proceso de detección de fake news. En este caso, vamos a hablar de una herramienta para detección de bots en twitter llamada Botcheck.

Botcheck es una herramienta en la línea del aprendizaje automático que comprueba la veracidad de las cuentas a través de la observación de su comportamiento. Por ejemplo, si la cuenta tuitea constantemente con solo unos minutos de diferencia entre mensajes, si los tuits consisten en mensajes políticos sensacionalistas y noticias falsas, si todo lo que publica es una copia exacta de los tuits de otra cuenta real, si ha conseguido grandes cantidades de seguidores en poco tiempo o se dedica a retuitear constantemente el contenido de otros perfiles identificados como bots, entonces podemos afirmar con bastante probabilidad que se trata de un bot.

Sin embargo, estas “reglas” no son del todo fiables y cuentan con algunas
excepciones. Puede ser normal que un personaje famoso que acaba de hacerse una cuenta en twitter consiga un número considerable de seguidores en un intervalo corto de tiempo. O que un aficionado al fútbol o a cualquier otra actividad se pase todo el día retuiteando o tuiteando sobre dicha actividad.

Aquí es donde entra el juego el machine learning, que es en lo que se basa
principalmente el potencial de esta herramienta. Para ello se utilizaron dos conjuntos de datos: miles de cuentas de ejemplo de bots propagandísticos como los que forman parte de las redes rusas, y miles de cuentas de personas o perfiles reales. Con toda esta información la herramienta es capaz de extraer patrones de una forma automatizada y determinar con un grado alto de precisión si un usuario de twitter es un ser humano o un bot político.

Vamos a la parte práctica. Para hacer uso de la herramienta, lo primero que se necesita hacer es instalar la extensión, que se encuentra disponible en el navegador Chrome.

Imagen que contiene captura de pantalla
Instalación de la extensión en Chrome

Una vez instalada la extensión, solo tenemos que utilizar twitter de forma completamente normal. Como se muestra en la imagen de debajo, nos aparece el icono de botcheck para comprobar si la cuenta que ha publicado el tuit o el retuit muestra un comportamiento normal o no.

Comprobación de la cuenta

Haciendo click en el icono de botcheck, este analizará el comportamiento de la cuenta y determinará si puede ser un bot o no.

En este caso, como se muestra a continuación, la herramienta ha determinado que la cuenta analizada tiene un comportamiento normal, por lo que se puede afirmar que es fiable.

Imagen que contiene captura de pantalla, monitor
Resultados obtenidos del análisis de botcheck

Para determinar que el comportamiento de la cuenta no sigue el patrón de las cuentas spam, botcheck se basado en tres variables:

  • Frecuencia de tuits
  • Frecuencia de los retuits.
  • Polarización, que representa la propagación de reclamos o propaganda exagerados.

Como se observa en la imagen anterior, la frecuencia de tuits y la polarización son elevadas, lo que podría llevarnos a pensar que podría tratarse de un bot. No obstante, la herramienta también valora la frecuencia de retuits, y como esta tiene un nivel bajo no cumple con las reglas para afirmar que se trate de un bot.

Si botcheck determina que una cuenta analizada es un bot, nos da la opción de reportar los resultados a twitter para que tome medidas, o se puede compartir el resultado del análisis para alertar a otros usuarios o seguidores de dicha cuenta que se trata de un bot.

Imagen que contiene captura de pantalla
Formulario de reporte
Compartir tweet del resultado del análisis

En ocasiones, puede que botcheck no sea capaz de mostrar un resultado concluyente del análisis debido a que, por ejemplo, el usuario no tenga una cantidad de mensajes suficientes para determinar si se trata de una cuenta legítima o un bot.

Por último, si no estamos de acuerdo con el resultado que nos muestra botcheck porque tenemos la certeza de que hay una persona real detrás de la cuenta, podemos reportar el fallo a través de la opción “Disagree”, para que los responsables de la herramienta tengan conocimiento del fallo encontrado y puedan solventarlo.

Imagen que contiene captura de pantalla
Envío de fallo por un error en el análisis

Espero que esta herramienta sirva para ayudar en la detección de noticias falsas o fake news en twitter.