Per Capita

Analyze Dat: Visualization TOR

25 May 2013, 13:00 - 18:00

  • Arthur Heist [DK]

Sexe, drogues, blanchiment d'argent, armes, jeux d'argent, vol d'identité.Cet atelier explore l'utilisation des outils de traitement naturel de la langue pour analyser les biens, les services et les produits offerts sur les marchés clandestins en ligne, tentant ainsi de dresser une cartographie fidèle des zones cachées du web. Cet atelier débute par une introduction aux outils nécessaires permettant d'accéder à ces marchés clandestins en ligne (Tor bundle, bitcoins). Les participants sont ensuite invités à traiter les données de ces pages web pour en extraire les informations permettant de créer une carte de ces services obscurs. Ces outils servent par exemple à faire de simples analyses de fréquences de mots (i.e. nuage de mots) mais aussi des comparaisons sémantiques et statistiques plus complexes pour étudier les liens entre ces différents réseaux. Le but de cette opération est de permettre de visualiser ces données afin d'obtenir une meilleure compréhension des sentiments intrinsèques profonds que notre société essaie de rendre invisibles. Cet atelier est destiné à toutes celles et ceux qui souhaitent venir s'amuser avec le traitement naturel du langage ou qui veulent juste venir découvrir plus en détails ce qui se passe de l'autre côté du miroir du web. De ce fait, l'atelier essaiera d'alterner entre des sessions pratiques et de discussions autour de ces notions. Tous les participants sont invités à amener leur ordinateur portable, avec Tor et NLTK installés si possible, et surtout à venir avec leurs désirs inavouables.

25 May 2013, 13:00 - 18:00