June 2021

Jun 5, 2021

L'île au million d'yeux : Analyse des interactions sociales sur Twitter





#KohLanta : Finale de la saison 2021


Koh-Lanta est aujourd'hui un programme incontournable du paysage audiovisuel français. Cette émission inspirée du “Survivor” polarise les réseaux sociaux et suscite à la fois l’excitation, la joie et parfois la **colère** de ses milliers de fans.


Comme dans la vraie vie, où la nature humaine avec ses *qualités* et ses *défauts* se dévoile face aux épreuves, les **communautés** et les alliances se forment. 

Et souvent  la “trahison” et la “déception” se manifestent  (tiens, c’est comme si je te décrivais un épisode lambda de #Kohlanta 🧐) 


Dans cet article,  je joins l'utile à l'agréable et je partage quelques insights interessants, pour montrer que, comme dans la vraie vie (et exactement pareil dans #Kohlanta), les communautés sont souvent la formation sociale la plus **dominante** dans les interactions humaines et que le fait de partager la même vision/personnalité ou les mêmes opinions, joue un rôle important dans la formation de ces communautés et dans l’influence sur la formation des opinions. 




Visualisation des données collectées, identification visuelle des membres **importants** du réseau et identification des groupements d'utilisateurs


Contexte: Dans cet article, j'analyse les tweets publiques, les réactions, les mentions et les retweets autours du hashtag #Kohlanta. 

La récupération des données a été effectuée en temps réel durant la diffusion de l’émission et 2 heures avant et après cette diffusion pour garantir une exhaustivité maximale des données.

Les types/nature des relations entre les utilisateurs, et les tweets ont été analysés afin de comprendre ( et démontrer si possible) que ce qui se passe dans cette émission (et également sur les réseaux sociaux), n’est qu’une expression/manifestation de la nature humaine et sociale dans tous ses états .


(Interactions en temps réel entre les membres des communautés. @DenisBrogniart au centre des communautés dominantes sur le réseau )


[ PI: Juste avant la publication de ces analyses, toutes les données brutes ont été supprimées :) ]


🔥 Les top 5 utilisateurs sur Twitte🔥


Les tops 5 sont les utilisateurs ayant le nombre le plus élevés de followers == un reach maximal pour la diffusion d’un tweet. 

C’est les utilisateurs qui, en partageant une information, ont le **pouvoir** d’atteindre un grand nombre d’utilisateurs et, en fonction de la pertinence ou de l'intérêt que génère cette information, sont les premiers noeuds du graphe de diffusion de cette information (c'est ici que le concept de vitalité intervient)

Les utilisateurs dans notre top 5 ont le profil parfait pour ça: c'est 100% des utilisateurs/représentants  des médias:

1- @tf1 : 5 628 169 followers :




2- @le_parisien: 2 791 114 followers:




3- @20minutes : 2 448 378 followers:




4- @mediavenir : 1 155 465 followers :




5- @bchameroy : 1 047 579 followers:




Combinés, ces 5 utilisateurs seuls ont un reach total d’environ 13 millions d’utilisateurs. 

Le top 10 parmi les utilisateurs analysés ont un reach de 17 millions. 

Donc ils jouent bien leur rôle principale de relayer l'information et de lancer l'étincelle sur Twitter. 



🤼 Parlons des communautés 🤼


Sur les réseaux sociaux, il existe 4 sortes de groupements d’utilisateurs:

1. ceux qui suivent un utilisateurs ou un hashtag

2. ceux qui partagent sans suivre 

3. ceux qui créent eux mêmes le contenu 

4. ceux qui font 1 et/ou 2 et/ou 3


La formation d’une communauté est souvent basée sur des intérêts communs entre ses membres, soit ils sont amis ou se connaissent dans la vraie vie, soit ils partagent un dénominateur commun (ici, ils sont tous fans de l'émission #Kohlanta)


📊 Chiffres & Observations 📊


Sans trop rentrer dans les détails mathématiques, le point de départ de cette analyse est basé sur la théorie des graphes, et plus précisément sur les méthodes de détection de communautés, de cliques, de clans/clubs, de leaders et d'influenceurs

 (grossus-modus : il s'agit de mesurer les interactions et les relations entre tous les membres d'un réseaux, de trouver un points central, et réitérer pour arriver finalement à avoir des groupements d'utilisateurs ayant une certaine proximité)


J’ai pu ainsi détecter :

- 112 cliques d’utilisateurs

- 9 communautés à fort influence

- 3 leaders / influenceurs 


Ci-dessous une illustration des différents composantes de la "social network" du hashtag #Kohlanta sur Twitter: 



les cliques

Il s’agit d’un groupe d’individus qui interagissent et partagent des intérêts similaires. 

C’est les utilisateurs isolés, ayant un faible nombre de followers ( entre 0 et 60) donc un cercle réduit de contacts sur Twitter ce qui engendre un reach et des interactions inexistantes ou limités.

Les 112 cliques sont constitués de groupement d’utilisateurs qui s’interagissent en cercles fermés entre-eux, souvent ayant un nombre de membres limité entre 2 et 4 utilisateurs qui retweet ou like les tweets d’un des membres du clique.

  

Les communautés:

Elles sont 7, mais ont des liens communs très forts, c'est des utilisateurs “pivots” qui font le pont entre les différentes communautés. 

Tu vas comprendre toute suite le pourquoi du comment.



J’ai pu identifier le profil type de 3 de ces communautés, je les présente ici par ordre décroissant de leur taille totale en terme membres/ utilisateurs. 

Ci-dessous quelques exemples de la polarisation des opinions au sein des différentes communautés :













#1 : Les Fans neutres : 

Inexistence d’une polarisation particulière d’opinions. Il s’agit de fans qui suivent tout simplement l’émission et qui ne s’expriment pas sur le contenu et les événements . C’est la communauté qui a utilisé le moins d’insultes envers les participants de l’émission. L'analyse des tweets révèle  que l'utilisation (non intentionnelle) d'un certain champs lexical a une influence sur l'appartenance d'un utilisateur à l'une des 3 communautés.



#2: Les joyeux: 

C’est la communauté qui comptait le grand nombre de personnes contentes de résultats de la finale. Ceci ne se traduit pas forcément par une satisfaction par rapport au participant gagnant, mais selon leurs tweets, ces personnes n’ont pas exprimé un mécontentement particulier.  Ils ont cependant partager leurs avis particulièrement forts envers certain participants perdants.


#3: Les mécontents  : 


C’est un groupe d’utilisateurs qui partage une sensation de mécontentement généralisé envers l’émission, envers quelques participants ou tous, et surtout envers le résultat final.

C’est la communauté qui partagent aussi un point commun particulier: ils s’expriment d’une manière très prononcée et vont au-delà des commentaires simples, et emploient particulièrement les insultes ( parfois très personnelles et violentes) envers certains participants .


Une particularité de ces 3 groupes, est le fait que le lien de “follower” n’est pas le seul déterminant de l’appartenance préalable d’un utilisateur à un de ces 3 groupes. Certes, le fait de faire partie du réseau d’un leader ( on verra ça juste après), va confirmer une partie de l’hypothèse sur le partage des mêmes opinions sur certains sujets. 

Il faut préciser que, l'appartenance à ces communautés n'était pas un choix réfléchi des utilisateurs. C'est à dire, il n'y avait pas une sorte de condition nécessaire et obligatoire pour choisir ses mots ou ses sentiments dans le but de faire partie d'un groupe d'utilisateurs.

 C'est en fait la détection des communautés qui arrive pour confirmer des hypothèses à posteriori.

Ces utilisateurs n'ont pas donc forcement conscience qu'ils font partie d'une communautés partageant les mêmes avis et opinions sur la finale de #Kohlanta 2021 😉  (Même si en prenant 5 minutes pour y réfléchir, tout sera logiquement logique... all makes perfect sense at the end!)

  

👨‍✈️ Finalement les “Leaders” 👨‍✈️


J’ai pu identifier 3 leaders qui polarisent et orientent le “débat” sur Twitter.

Il ne s’agit pas des personnes les plus suivies (ah bon?).

C’est des utilisateurs qui ont les caractéristiques (ou avantages) suivants:

- être le premier à partager une capture ou une image de l’émission: quand #Kohlanta commence à apparaître dans les tendances Twitter,  c’est eux qui sont vus en premier et donc bénéficient du plus grand nombre de likes et de partages. Souvent les utilisateurs prennent l'option la plus facile de retweeter.

- Avoir un sens d’humour développé ? : Je ne pouvais pas expliquer ça d’un point de vu sociologique/psychologique, mais c’est le phénomène d'une personne qui trouve très rapidement un commentaire marrant sur un participant ou une situation dans l’émission et associe à ça une image ou un “meme”,  ce qui facilite leur accès à un grand nombre d’utilisateurs “passifs” qui ne font que partager, par manque de “créativité” peut - être. 

Comme par exemple:

 ou :

 ou encore :



- Etre le présentateur de l’émission : même si Denis Brogniart n’a pas fait de tweets durant l’émission (d’ailleurs inactif depuis le 28 mai), il centralise à lui seul l’ensemble des interactions des 9 communautés. 

Des mentions de son nom et de son compte Twitter ont monopolisé une grande partie des discussions durant la diffusion de l’émission:



(NB: Cet exercice n'avait pas pou objectif de classer et labelliser les gens dans ces 3 groupes, je n'ai pas donc révélé les identités des membres des différentes communautés ou les leaders. Sauf la mention de Denis Brogniart bien évidement)


à ma surprise: 

Les participants dans l’édition 2021 n’ont pas eu un effet sur les interactions sociales durant la finale de la saison 2021. Je m'explique:

Certains ont été mentionnés dans les tweets, mais leur présence sur Twitter n'a pas impacté ou orienté le **débat** entre les utilisateurs. Ils ont cependant, fait l'objet d'un nombre de commentaires "polarisants".  

Par contre,  plusieurs participants des éditions précédentes ont dominés une partie des interactions ( Go Sam! Go Claude! Go Teheiura!), donc c'est un effet de nostalgie si j'ose dire?

En gros hier soir,  c'était  les téléspectateurs qui ont animé et orienté le **débat** sur Twitter.




Bon voila! 

L'invest' total dans cet exercice était : 

5h pour récupérer les datas (j’ai surveillé le démarrage pendant 1h), 1h pour le nettoyage, 1h pour la construction et la validation des communautés et 1h30 pour avoir l’inspiration du texte ci-dessus.

4h30 de fun pour moi… 

Le sujet de SNA me fascinait depuis des années.. J’ai pu faire des travaux de recherche sur des problématiques similaires et j’ai réussi à mettre en prod quelques modèles qui tournent aujourd’hui (AKA générer du CA grace aux analyse des SN)

Ça me fascine car c’est la manifestation parfaite du comportement humain, et ça me permets de plonger sur des thématiques économiques, sociologiques et psychologiques afin de pouvoir donner un sens aux chiffres. 

Donc un projet SNA c'est souvent beaucoup de lecture et beaucoup de réflexions, mais surtout un exercice amusant !

🎤 💧

Mic drop


à lire dans le même thème, mon article de 2015 sur : l'analyse des interaction Twitter suite aux attaques terroristes en Tunisie