Detección de bots en twitter (II): Botometer

El otro día veíamos la herramienta Botcheck para la detección de cuentas falsas y bots, creados esencialmente para el sabotaje de personajes públicos y la divulgación de noticias no verídicas, que han experimentado un incremento masivo en los últimos tiempos. En este artículo echaremos un vistazo a otra herramienta útil para la detección de este tipo de cuentas en Twitter llamada Botometer.

Botometer nace en el Instituto de Ciencias de la Red en unión con el Centro de Investigación de Redes y Sistemas Complejos, ambos de la Universidad de Indiana de Estados Unidos. Mediante miles y miles de etiquetados, su algoritmo de aprendizaje automático recoge información esencial de cuentas públicas, como podrían ser las funciones de red, amigos, estructura social, patrones de actividad temporal, lenguaje o intención. De esta manera, Botometer es capaz de identificar qué cuenta pertenece a un humano y cual es un bot.

Respecto a los métodos de uso de Botometer tenemos dos variantes: la web oficial (https://botometer.iuni.iu.edu/#!/) y por su API. Si optamos por la versión web, es simple y sencillo, pero si nos inclinamos más por el uso de la API es esencial saber que necesitaremos tener conocimientos sobre Python y utilizar la biblioteca de Botometer. El resultado de poner a correr este algoritmo es una probabilidad en una escala entre 0 y 1, de modo que si estamos frente una cuenta falsa obtendremos un 1, y si es una cuenta real la salida será 0.

Tanto si descargamos la aplicación como si nos sentimos más cómodos con su API, Botometer nos mostrará puntuaciones de las diferentes categorías que utiliza su algoritmo para designar su respuesta, como las características de red, las del usuario o las temporales, entre otras muchas.

Si profundizamos en las características de red, Botometer se sirve de ellas para recoger información sobre retuits, menciones y hashtags que un usuario ha podido tuitear en algún momento. De las características del usuario se recopila el nombre, fecha, idioma y ubicación. Estas variables son esenciales para Botometer, debido a que un bot no contiene ese tipo de
información. Por su parte, las características temporales ofrecen datos relevantes sobre patrones de tiempo de tuits y retuits de un usuario. En el caso de que estos patrones sean equidistantes, lo más probable es que Botometer identifique dicha cuenta como falsa.

Una vez explicadas las bases sobre las que se construye Botometer y qué referencias toma para alcanzar una decisión respecto a la veracidad de una cuenta, pasemos a ver como actúa en la práctica. En este caso he escogido el método de utilización de la web de la herramienta, ya que el algoritmo utilizado tanto por la API como por la aplicación es el mismo.

La interfaz de Botometer se presenta de la siguiente manera:

En la parte inferior a la izquierda podemos ver el cajetín donde indicar el nombre del usuario que queremos rastrear. En este ejemplo, escribimos el nombre de un perfil fiable, y vemos qué nos dice Botometer sobre él.

Resultado de una cuenta de una persona

En el resultado podemos observar cómo los indicadores de fiabilidad indican que es verídica, basándose en los parámetros que comentamos anteriormente.

Si tomamos otro ejemplo, vemos que Botometer señala la siguiente cuenta como falsa.

Cuenta de twitter correspondiente a un bot

Después de haber jugado un rato con esta herramienta, se puede afirmar que su rango de acierto es más que fiable, que los marcadores que toma como referencia ayudan al usuario de Botometer a comprender como sentencia las cuentas, y que como vemos, la Inteligencia Artificial puede ser de gran ayuda para comprobar la validez de la información en las redes sociales.