Ingénieur IA chez Nuiva
En tant que Data Scientist passionné, je combine des compétences analytiques avancées avec une expertise en programmation et en modélisation pour résoudre des problèmes complexes et transformer les données en décisions éclairées.
Je travaille actuellement comme Ingénieur IA chez Nuiva, où je suis responsable du développement et du déploiement de modèles d'apprentissage automatique pour améliorer la performance des produits de l'entreprise.
Conception, développement et déploiement d’un système prédictif capable d’anticiper le nombre d’occurrences d’alarmes pour chaque catégorie d’alarme sur les Éléments Réseau (Routeurs, Antennes Relais, etc.) sur une période de 14 jours.
Ce système permet d’optimiser la maintenance prédictive en identifiant les problèmes potentiels avant qu’ils ne surviennent, en s’intégrant aux systèmes opérationnels existants pour automatiser la création de tickets et en fournissant des informations exploitables pour améliorer la fiabilité du réseau et réduire les temps d’arrêt.
Ce projet vise à améliorer les systèmes de gestion des pannes en s’attaquant à deux aspects critiques de la maintenance réseau :
Détection des Alarmes Pertinentes : Classification des alarmes en pertinentes ou non pertinentes pour réduire le bruit et concentrer les ressources sur les problèmes critiques.
Prédiction des Occurrences d’Alarmes : Anticipation du nombre d’alarmes pour chaque catégorie sur 14 jours, permettant des interventions proactives.
En combinant ces deux approches, le système prédit non seulement les alarmes futures, mais identifie également celles nécessitant une intervention immédiate.
Cette approche globale améliore la fiabilité du réseau en réduisant les temps d’arrêt, en optimisant l’allocation des ressources et en facilitant la prise de décision.
L’apprentissage du modèle repose sur des données historiques.
L’ensemble de données initial contient environ 3,8 millions d’événements d’alarmes enregistrés entre 2019 et 2021.
Pour ce projet, nous avons filtré les données de 2021, obtenant 850 000 événements d’alarmes avec 14 caractéristiques principales.
date
: Date et heure de l’occurrence de l’alarme.site_id
: Identifiant du site où se trouve l’Élément Réseau (NE).ne_name
: Nom de l’Élément Réseau.zone_circle
: Zone géographique du NE.ne_type
: Type d’équipement.vendor
: Fabricant de l’équipement (Huawei, Ericsson, etc.).technology
: Technologie utilisée (3G, 4G, etc.).alarm_category
: Catégorie d’alarme (Exemple : Perte de signal, Température élevée, etc.).occurrences
: Nombre d’occurrences de l’alarme.Nous avons observé de fortes variations dans les occurrences d’alarmes en fonction des jours.
Certains jours ne présentaient aucune alarme, tandis que d’autres montraient d’importants pics d’événements.
Les nuances plus foncées indiquent un plus grand nombre d’alarmes.
Un exemple marquant :
Cette forte variation suggère des facteurs sous-jacents influençant la fréquence des alarmes.
Nous avons également constaté que :
Nous avons identifié 191 types d’alarmes distincts, ce qui est difficile à prédire individuellement.
Nous avons donc regroupé les alarmes en catégories.
Pour chaque variable cible, nous avons créé :
Les valeurs cibles ont été mises à l’échelle via log1p transformation, et les variables catégorielles ont été encodées.
Nous avons évalué le modèle en prédisant les alarmes pour les 14 jours suivants, puis en comparant les prédictions aux valeurs réelles.
Dans cet exemple :
Nous avons classifié les alarmes prédites en pertinentes ou non pertinentes.
Les alarmes sont jugées non pertinentes si elles :
Un CatBoostClassifier
a été entraîné pour prédire si une alarme est pertinente.
Confidentialité et Sécurité des Données
Toutes les données sensibles ont été anonymisées, garantissant la conformité aux réglementations sur la protection des données.