anonymiser des traces d'apprentissage d'une plate-forme ?

anonymiser des traces d'apprentissage d'une plate-forme ?

par Pascal Boulerie,
Nombre de réponses : 0

Objet : anonymiser des traces d'apprentissage d'une plate-forme ?


Bonjour,

Pour son étude de doctorat, un étudiant me demande d'avoir accès aux archives de formation, dont les messages de tchats. Afin de faire progresser la recherche, je suis donc en train de lui préparer ces données.

Il faut donc cacher :
- noms et prénoms des intervenants (étudiants et tuteurs), et leurs numéros de téléphone et adresses @ (et noms de domaines des utilisateurs), éventuellement noms de villes et/ou pays pour éviter une localisation et identification indirecte. Quand une ville est très grande (par exemple, une capitale comme Paris), et qu'il y a de nombreux intervenant dans cette ville, il est possible de laisser le nom en clair, une géolocalisation fine n'étant alors pas possible lors de la relecture de l'archive des échanges.

Une partie de ce travail peut se faire par script automatique PHP pour chercher et remplacer des chaînes de texte.

Une autre partie demande un contrôle de relecture avant diffusion, pour vérifier que dans le fichier produit, il ne reste pas d'élément compromettant la vie privée des personnes concernées dans cet échange de 2010.

Il me faut aussi ne pas exporter les groupes confidentiels (par exemple, des « bureaux des élèves », fréquentés par eux seuls entre eux, sans présence de l'administration...)

Je suis à votre écoute si vous avez des suggestions sur des points que j'aurais oubliés, ou si vous connaissiez des outils ad hoc.

Bonne fin de journée,

Moyenne des évaluations  -