Sociological Researches about Twitter : I need some help to start

Nov 17, 2013 at 3:45 PM
Hi !

I'm a french student, and I'm working on Twitter for my master's dissertation. It's a sociological approach, and it's mainly qualitative (the main part of my researches is about interviews with Twitter's users in order to analyse their motivations, their background etc.).

But, in a first part, I want to use a more "quantitative" approach, using NodeXl. My research is about one specific community, with only few people. So I want to start with one specific twitter's user and I want to study all his network. So, I think NodeXL is accurate to do the job.

The problem is that all the documentation is in english and that I'm not really familiar with this kind of tool. I'have already test NodeXL + Gephi with few people and it seems quiet easy to use because I was testing, like a "try and see" way. But now I want to treat the "real" datas, I have several interrogations :

I want to get the whole network of my "user 0" followed and following, with the three edges for each, at a 1.5 level, with a limit of 150 people. -> my goal is to be able to create 3/4 groups like the political/professional/personal/cultural, and to distinguished the 15 persons my user 0 is the most connected to.

Does my configuration is relevant ? How long it will take ? 3 or 20 hours ?

Of course, there is the most common problem : the API. It's very long, and I've already try to extract this kind of "big data", but the software crashed. Can I find a way to make researches separately and then try to fusion data ? Without doubloon of course. And for example make the software running on different computers from different twitter accounts ?

And I'm really taker of advice to start.

Thx a lot !

Quentin
Nov 17, 2013 at 7:11 PM
Bonjour Quentin,

Je m'appelle Cyrille Papon, je suis en parcours doctoral en France. J'utilise NodeXL et Gephi, entre autres, pour faire mes recherches. Je vous réponds suite à la demande de Marc Smith, qui me soutient dans mes recherches sur l'analyse des réseaux sociaux, afin que nous puissions rentrer en contact.

Suivant les conseils de Marc, je vous suggère de vous concentrer sur les recherches Twitter plutôt que sur les réseaux d'abonnés de votre "utilisateur 0", l'obtention de réseaux d'abonnés étant relativement laborieuse et incertaine.

Si le réseau d'abonnés de votre "utilisateur 0" est indispensable à votre étude, le réseau devrait ressembler à priori à un graphe complexe avec une série de clusters plus ou moins denses. Par expérience, il vous faudra plusieurs jours pour obtenir un réseau d'abonné modeste et malheureusement NodeXL pourrait parfois s'arrêter (ou planter) durant la collecte de données. L'outil n'est pas adapté pour la collecte de réseau de grande dimension pour lesquels Twitter en a fortement limité l'accès: http://www.connectedaction.net/2013/06/11/over-the-edge-twitter-api-1-1-makes-follows-edges-hard-to-get/

Enfin, d'après mon expérience, il vous faudra employer un ordinateur avec au moins un RAM de 8 Go afin de faciliter les calculs. Un ordinateur avec un processeur un peu léger et moins de 8 Go de RAM risque de patiner, voire de faire planter NodeXL au moment des calculs, et de vous faire perdre toutes vos données. A ne pas négliger.

N'hésitez pas à me poser à des questions au travers de ce fil, ce serait parfait.

Bien à vous,

Cyrille.
.
Jul 16, 2014 at 12:57 PM
Edited Jul 16, 2014 at 12:57 PM
Bonjour, j'utilise également Node XL et Gephi, mais quand j'enregistre mes datas dans node xl au format graphML file, et que j'ouvre le fichier dans Gephi, il y a des données que je ne retrouve pas. Savez vous à quoi cela peut être du ?

Merci beaucoup
Chloé