28/03/07
Détecter le langage SMS en PHP

Le précédent billet abordait un fléau qui est le traitement automatisé des formulaires par des robots et donc une solution qui est le CAPTCHA.
Un autre fléau est ce que l'on pourrait appeler la désalphabétisation du Web, je veux bien sûr parler du langage SMS (mais pas seulement) ; heureusement que la technique peut venir au secours des diffuseurs de contenu qu'ils tiennent un blog, un forum ou toute autre forme similaire de gestionnaire de contenu (couramment appelé CMS) participatif.
Premier exemple de fonction PHP : DETECTION DE L'ECRITURE SMS - Code source N°26183 qui est intéressante car se basant sur une probabilité issue du rapport entre le nombre de mots et la moyenne de leurs longueurs ; c'est sympa même si ce n'est pas vraiment suffisant.
Deuxième exemple de fonction PHP : Détecteur de langage SMS, qui présente l'avantage d'effectuer tout un ensemble de tests sur le contenu soumis par le formulaire, allant de la détection du l33t, à la détection du langage SMS à l'aide d'un dictionnaire facultatif, en passant par l'absence de ponctuation et de majuscules ! Vraiment impressionnant (même si, à mon sens, quelques légers défauts subsistent dans la source).