Ingénieur IA chez Nuiva
En tant que Data Scientist passionné, je combine des compétences analytiques avancées avec une expertise en programmation et en modélisation pour résoudre des problèmes complexes et transformer les données en décisions éclairées.
Je travaille actuellement comme Ingénieur IA chez Nuiva, où je suis responsable du développement et du déploiement de modèles d'apprentissage automatique pour améliorer la performance des produits de l'entreprise.
L’apprentissage contrastif est une forme d’apprentissage non supervisé où l’objectif est d’apprendre des représentations des données utiles pour des tâches ultérieures.
Il fonctionne en contrastant différentes vues d’un même point de données dans un espace latent, favorisant ainsi des représentations similaires pour un même point de données et différentes représentations pour des points de données distincts.
Cette méthode permet au modèle d’extraire des caractéristiques pertinentes même sans données annotées.
SimCLR est une méthode d’apprentissage contrastif introduite en 2020. Elle maximise la similarité entre des vues augmentées d’une même image et minimise la similarité entre des vues augmentées d’images différentes.
SimCLR utilise une architecture neuronale simple et efficace et a obtenu des résultats à la pointe de l’état de l’art sur plusieurs ensembles de données de référence.
Il a été largement adopté dans la communauté du deep learning et est considéré comme une approche prometteuse pour apprendre des représentations utiles à partir de données non étiquetées.
L’objectif principal de ce projet est de proposer une approche utilisant SimCLR sur le dataset MNIST afin d’obtenir un modèle performant avec seulement 100 données étiquetées.
Pour y parvenir :
Notre modèle repose sur l’association d’un encodeur et d’un projection head.
En appliquant un pré-entraînement avec SimCLR, nous avons observé une amélioration d’environ 7% de l’exactitude par rapport au modèle de référence (un réseau de neurones convolutionnel classique).
Exactitude top-1 | |
---|---|
Modèle de base | 0.8462 ± 0.0042 |
SimCLR | 0.9194 ± 0.0030 |