Cette technique de machine learning détecte les sites de phishing en visualisant le balisage et le code.
Des chercheurs britanniques ont développé cette nouvelle méthode pour améliorer la précision et la vitesse de détection des sites d'hameçonnage. Ils ont formé le modèle d'apprentissage automatique pour visualiser la représentation du code d'un site web.
S'attaquer au phishing à l'aide du machine learning
Cette nouvelle technique est le fruit des travaux d'une équipe de recherche de l'Université de Plymouth et de l'Université de Portsmouth, au Royaume-Uni. Luke Barlow, Gueltoum Bendiab, Stavros Shiaeles et Nick Savage sont des chercheurs en cybersécurité. Ils ont cherché à répondre au manque de précision et à la lenteur des systèmes de détection des sites de phishing existants.
Pour rappel, un site de phishing ou hameçonnage est une attaque d'ingénierie sociale. Le principe est de se faire passer pour le site d'une entité réelle afin de voler des données d'utilisateurs. Il peut s'agir d'identifiants, de numéros de carte de crédit, etc.
La méthode consiste entre autres à transformer le balisage et le codes des pages Web en image RGB. Pour ce faire, ils ont utilisé des bibliothèques de « visualisation binaire ». Cela leur a permis de créer un ensemble de données des images légitimes et des phishings pour former le modèle de machine learning. Ainsi, quand un utilisateur visite un site, le modèle compare la visualisation binaire du site à la base de données pour vérifier son authenticité.
Par ailleurs, les chercheurs ont utilisé MobileNet afin d'accélérer les performances du modèle. Il s'agit d'un réseau de neurones optimisé pour fonctionner sur des appareils aux ressources limitées. Cette technique est connue sous le nom de mobile machine learning.
Une précision de 94 %
Cette nouvelle technique de machine learning a affiché une précision de 94 % dans la détection des sites de phishing, lors des expériences. De plus, grâce au réseau de neurones qui s'adapte à n'importe quel appareil, le traitement des résultats se fait en temps réel ou presque.
Stavros Shiaeles indique que l'équipe essaie actuellement de déposer une demande de brevet pour cette méthode. Notons qu'en 2019, Shiaeles avait déjà combiné le machine learning et le visionnage binaire pour détecter les logiciels malveillants. Avec ces nouveaux résultats, les chercheurs espèrent donc que cette technique sera bientôt adoptée.
- Partager l'article :