En étudiant les données fournies par les compagnies téléphoniques avec un algorithme prédictif, un analyste de données a pu dresser un profil de l’illettrisme.
À voir aussi sur Konbini
Selon les chiffres de l’Unesco, le monde compte aujourd’hui 875 millions de personnes illettrées, dont deux tiers de femmes. Pour satisfaire les ambitieux objectifs de développement durable fixés par l’ONU d’ici à 2030, la lutte pour l’éducation est indispensable, notamment dans les pays dits du “E9” — le Brésil, le Bangladesh, le Mexique, la Chine, l’Inde, l’Indonésie, le Nigeria, l’Égypte et le Pakistan —, densément peuplés et encore en développement économique.
Si les organismes de terrain existent, le plus difficile reste souvent d’identifier les zones les plus touchées par l’illettrisme. La seule arme de ces ONG reste souvent le bon vieux sondage en porte-à-porte. Grâce aux travaux de Pal Sundsoy, chercheur en télécommunications norvégien, la méthode pourrait bientôt radicalement changer.
L’approche de cet analyste se fonde sur un algorithme prédictif et une base de données énorme : les relevés d’activité des téléphones mobiles. Localisations, contacts, nombres de messages et d’appels, heures de réception de ces communications, etc. Les données téléphoniques fournissent énormément d’informations précieuses.
Repérer les populations illettrées grâce à leurs téléphones
En étudiant les résultats d’un sondage sur l’illettrisme effectué sur 76 000 usagers d’un service de téléphonie anonyme, présent dans “un pays asiatique en développement”, puis en comparant les résultats du sondage avec les relevés d’activité de ces usagers (fournis par la compagnie), Pal Sundsoy a pu établir une sorte de “profil” de l’utilisateur de téléphone mobile illettré. Des renseignements qui n’existaient quasiment pas jusqu’alors.
Pour Pal Sundsoy, interrogé par Technology Review, “ceux qui souffrent d’illettrisme tendent à concentrer leur communication sur un petit nombre d’interlocuteurs”. Autre facteur intéressant : certaines personnes envoient moins de messages qu’elles n’en reçoivent. Cela permet de repérer les personnes qui maîtrisent mal l’expression écrite et la lecture.
En additionnant ces données géographiques, sociales et économiques, le modèle prédictif parviendrait à identifier les zones d’illettrisme avec 70 % de précision, explique Sundsoy. Si le modèle parvient à être encore affiné, il pourrait se révéler être un puissant outil pour les ONG d’éducation sur le terrain. Et accélérer la course à l’éradication de la pauvreté de l’ONU.