Qu'est-ce que l'Edge AI ? Comment elle fonctionne, ses applications et défis
|
Important
|
Traduction du site Source Cet article est la version Française de What Is Edge AI? How It Works, Applications, Challenges | DataCamp par Auteur Inconnu. |
Qu’est-ce que l’IA aux bords du réseau ?
L’IA aux bords du réseau est la pratique de déployer des modèles d’IA et des algorithmes directement sur les appareils aux bords, qui sont des dispositifs situés à la périphérie du réseau, près où les données sont générées et où des actions doivent être prises.
Ces appareils englobent une large gamme, allant des puissants serveurs aux bords jusqu’aux capteurs IoT contraints en ressources, et comprennent des exemples familiers comme les smartphones, les appareils domestiques intelligents, les véhicules autonomes et même les robots industriels.
Les progrès récents en IA, tels que le développement de modèles linguistiques plus petits et plus efficaces comme GPT-4o Mini, Llama 3.1 8B et Gemma 2 2B, accélèrent davantage l’adoption de l’IA aux bords du réseau.
Ce déplacement vers l’IA aux bords offre plusieurs avantages :
- Vitesse : Les décisions et les actions se produisent en temps réel, juste où les données sont générées. C’est nécessaire pour des applications comme les véhicules autonomes ou les dispositifs médicaux qui ne peuvent pas afforder les retards causés par l’envoi de données au cloud pour le traitement.
- Confidentialité : Les données sensibles peuvent être analysées localement sans avoir besoin d’être envoyées au cloud, renforçant la sécurité et la confidentialité.
- Fiabilité : L’IA aux bords réduit la dépendance à une connexion Internet constante, rendant l’application plus fiable dans les zones avec une connectivité limitée ou instable.
- Éfficacité : Le traitement des données localement réduit le bande passant requis pour envoyer tout au cloud, en économisant de l’énergie et des coûts.
Comment le Edge AI Fonctionne
Pour comprendre comment le Edge AI fonctionne, nous devons d’abord comprendre ses composants principaux et les processus impliqués.
Composants clés
Le Edge AI est composé de trois composants principaux : les appareils aux bords, les modèles d’intelligence artificielle et la communication.

Appareils aux bords
Les appareils aux bords englobent une large gamme de matériel, allant des serveurs aux bords puissants capables de gérer des charges de calcul importantes aux capteurs IoT extrêmement contraints en ressources, conçus pour des tâches spécifiques.
Ces appareils comprennent les smartphones, les drones, les véhicules autonomes, les robots industriels et les dispositifs intelligents du foyer, tous capables de traiter les données localement pour une analyse en temps réel. Certaines fabricants de matériel, comme NVIDIA et Intel, offrent même un soutien matériel pour le déploiement des modèles ML aux bords.
Modèles d’intelligence artificielle
Le Edge AI utilise différents types de modèles d’IA, y compris les apprentissage automatique, la deep learning et les algorithmes de vision par ordinateur, optimisés pour une exécution efficace sur les appareils aux bords.
Ces modèles sont conçus pour fonctionner dans les contraintes des environnements aux bords, assurant qu’ils peuvent opérer efficacement malgré la puissance limitée de traitement, la mémoire et le stockage.
Par exemple, les modèles comme GPT-4o Mini et Llama 3.1 8B sont spécifiquement conçus pour être légers et efficaces, rendant leur déploiement aux bords approprié.
Communication
L’échange efficace de données entre les appareils aux bords et le cloud est facilité par des protocoles de communication tels que MQTT et les API REST. Ces protocoles permettent une connexion fluide et un transfert de données, permettant des opérations synchronisées entre les appareils aux bords et les systèmes centraux lorsque nécessaire. Ces protocoles permettent le transfert d’informations sous forme compressée dans un mode quasi sans perte pour préserver l’information cruciale.
MQTT (Message Queuing Telemetry Transport) est un protocole de messagerie léger conçu pour les appareils contraints et les réseaux à faible bande passante, haute latence ou non fiables. Il utilise un modèle d’échange pub/sub, permettant aux appareils de publier (envoyer) et d’abonner (recevoir) des messages sans avoir besoin d’une connexion directe. Cela rend MQTT idéal pour les applications IoT où les appareils doivent communiquer efficacement et de manière fiable.
API REST (Representational State Transfer Application Programming Interface) est un style architectural pour concevoir des applications réseauées. Il utilise des requêtes HTTP pour accéder et utiliser des données. Les API REST sont sans état, ce qui signifie que chaque appel d’un client au serveur doit contenir toutes les informations nécessaires pour satisfaire cette demande. Cela rend les API REST échelonnables et appropriées pour diverses services web et applications, y compris celles impliquant des appareils aux bords.
Le Processus
Le flux de travail qui alimente l’IA aux bords implique trois étapes : la collecte de données, le traitement de données et l’action.

Collecte de données
Les appareils aux bords continuent de collecter des données à partir de capteurs, de caméras ou d’autres sources, fournissant une flux continu d’informations. Ces données peuvent varier des métriques environnementales et des paramètres de santé aux flux vidéo et enregistrements audio, formant la base de l’analyse en temps réel.
Un excellent exemple de collecte de données est celui de votre bracelet intelligent qui compte le nombre d’étapes que vous avez faites aujourd’hui.
Traitement des données
Les modèles d’intelligence artificielle déployés sur les appareils aux bords traitent les données recueillies localement. Cette étape implique l’analyse des données pour extraire des informations significatives, détecter des motifs et faire des prédictions en utilisant des modèles d’IA sans dépendre de ressources cloud.
Le traitement local assure que les décisions peuvent être prises rapidement, comme une voiture autonome qui détermine quel voie choisir en temps réel.
Action en temps réel
Sur la base de la sortie du modèle d’intelligence artificielle, les appareils aux bords peuvent prendre des actions immédiates. Ces actions pourraient inclure le déclenchement d’alarmes, l’ajustement du chemin ou l’envoi des données au cloud pour une analyse plus approfondie. La capacité à agir en temps réel est essentielle pour les scénarios nécessitant des réponses instantanées, tels que les systèmes de sécurité ou les dispositifs médicaux.
Applications réelles de l’intelligence artificielle aux bords
L’intelligence artificielle aux bords transforme diverses industries en permettant une intelligence et la prise de décision en temps réel. Exploreons quelques applications notables.
Industrie manufacturière
Dans la fabrication, le temps d’arrêt des équipements peut être coûteux. L’intelligence artificielle aux bords (Edge AI) résout ce problème en surveillant la santé des équipements et en prédiquant les éventuels dysfonctionnements avant qu’ils ne se produisent. En analysant les données provenant de capteurs en temps réel, les modèles d’IA peuvent détecter les anomalies et avertir les équipes de maintenance pour prendre des actions préventives. Cela non seulement réduit le temps d’arrêt mais étend également la durée de vie des équipements.
Assurer la qualité du produit est primordial dans la fabrication. Les caméras équipées d’intelligence artificielle aux bords peuvent inspecter les produits pour détecter les défauts en temps réel. Ces systèmes analysent les données visuelles pour identifier des imperfections telles que des égratignures, des bosses ou une assemblage incorrect. En automatisant le processus d’inspection, les fabricants peuvent atteindre une plus grande précision, la cohérence et l’efficacité, ce qui finit par améliorer la qualité du produit et la satisfaction des clients.
Santé
L’industrie de la santé en profite considérablement grâce à l’intelligence artificielle aux bords (Edge AI). Les appareils portables équipés d’intelligence artificielle aux bords peuvent analyser les images médicales telles que les rayons X, les IRM et les scans CT, fournissant des diagnostics plus rapides. Cette capacité est particulièrement précieuse dans les zones à distance ou peu servies où l’accès à des radiologues spécialisés peut être limité. En traitant les images localement, l’intelligence artificielle aux bords réduit le temps nécessaire pour le diagnostic, permettant un traitement rapide et améliorant les résultats de santé des patients.
Les appareils portables avec l’IA aux bords sont en train de révolutionner la prise en charge des patients grâce à leur capacité à surveiller continuellement les paramètres de santé. Ces appareils recueillent des données telles que le taux cardiaque, la pression artérielle et les niveaux de sucre dans le sang, les analysant en temps réel pour détecter les anomalies. Si une condition critique est identifiée, l’appareil peut alerter immédiatement les professionnels de santé. Cette approche proactive de la surveillance des patients aide à gérer les maladies chroniques, à détecter les problèmes de santé tôt et à réduire le nombre d’hospitalisations.
Magasin
La gestion efficace de l’inventaire est cruciale pour les entreprises de magasins. Les caméras et capteurs alimentés par l’IA peuvent suivre les niveaux d’inventaire en temps réel, assurant que les rayons sont toujours bien garnis. En analysant les données provenant de ces appareils, l’IA aux bords peut optimiser la recharge des stocks, réduire le gaspillage et prévenir les ruptures de stock. Cela conduit à une meilleure satisfaction des clients et à des coûts d’inventaire plus bas.
Comprendre le comportement des clients est crucial pour offrir des expériences de magasin personnalisées. L’IA aux bords analyse les données provenant des caméras et capteurs en magasin pour obtenir des insights sur les préférences et le comportement des clients. En fonction de cette analyse, elle peut proposer des recommandations et des promotions personnalisées à chaque client. La personnalisation améliore l’expérience du magasin, augmente la fidélité des clients et augmente les ventes.
Villes intelligentes
La gestion du trafic urbain est une tâche complexe qui nécessite une analyse en temps réel des données. L’IA aux bords peut optimiser le flux de trafic en analysant les données provenant des caméras de trafic, des capteurs et des appareils GPS. En détectant les modèles de congestion et en prédiquant les conditions du trafic, il peut ajuster les feux de signalisation, rediriger les véhicules et fournir des mises à jour en temps réel sur le trafic aux conducteurs. Cela améliore l’efficacité du trafic, réduit le temps de trajet et renforce la sécurité routière.
Assurer la sécurité publique est une priorité supérieure pour les villes intelligentes. Les systèmes de surveillance basés sur l’IA équipés d’IA aux bords peuvent surveiller les espaces publics, détecter des anomalies et identifier des menaces potentielles. Ces systèmes analysent en temps réel les flux vidéo, reconnaissant des activités suspects telles que l’accès non autorisé ou des sacs abandonnés. En alertant rapidement les autorités, l’IA aux bords renforce la sécurité et permet une réponse rapide aux incidents.
IA aux bords : Solutions matérielles et logicielles
L’implémentation de l’IA aux bords nécessite la combinaison appropriée de solutions matérielles et logicielles. Voici quelques options populaires :

Plateformes matérielles
Pour une implémentation réussie de l’IA aux bords, vous aurez besoin de plateformes matérielles adaptées pour exécuter les modèles d’IA efficacement aux bords. Exploreons quelques options :
- NVIDIA Jetson: NVIDIA Jetson est une plateforme puissante pour l’IA à l’extrémité, offrant des capacités de calcul haute performance. Elle est largement utilisée dans les applications telles que la robotique, les villes intelligentes et la santé. Les appareils Jetson fournissent le pouvoir de traitement nécessaire pour exécuter des modèles d’IA complexes localement, les rendant idéaux pour les déploiements d’IA à l’extrémité.
- Google Coral: Google Coral est conçu pour des déploiements rapides et efficaces de l’IA à l’extrémité. Il offre des capacités d’inferencement d’apprentissage automatique accélérées, le rendant adapté à diverses applications, y compris la vision par ordinateur et les IoT. Les appareils Coral sont connus pour leur facilité d’utilisation et leur intégration avec les cadres d’IA populaires.
- Intel Movidius: Intel Movidius est reconnu pour sa performance énergétique, la rendant idéale pour les applications basées sur la vision. Il prend en charge les charges de travail d’apprentissage profond et de vision par ordinateur sur les appareils à l’extrémité, permettant le traitement en temps réel avec une consommation minimale d’énergie. Les puces Movidius sont couramment utilisées dans les drones, les caméras de sécurité et les appareils intelligents du foyer.
Cadres logiciels
En plus du matériel, des cadres logiciels robustes sont essentiels pour le développement et le déploiement d’applications d’IA à l’extrémité. Explorez quelques options :
- TensorFlow Lite: TensorFlow Lite est une version légère de TensorFlow, optimisée pour les appareils mobiles et aux bords. Il permet aux développeurs d’déployer des modèles d’apprentissage automatique sur des appareils à faible ressource de manière efficace. TensorFlow Lite prend en charge une large gamme d’applications d’intelligence artificielle, allant de la classification d’images à la traitement du langage naturel.
- PyTorch Mobile: PyTorch Mobile permet le déploiement des modèles PyTorch sur les plateformes mobiles et aux bords. Il prend en charge une variété de tâches d’intelligence artificielle, y compris la vision par ordinateur, la reconnaissance vocale et les systèmes de recommandation. PyTorch Mobile est connu pour sa flexibilité et son facilité d’intégration avec les flux de travail existants PyTorch.
- ONNX (Open Neural Network Exchange): ONNX est un format ouvert pour les modèles d’IA, permettant la transfert des modèles entre différents frameworks. Il est particulièrement utile pour l’IA aux bords car il permet l’utilisation de modèles pré-entraînés sur diverses plateformes, y compris TensorFlow, PyTorch et autres. ONNX Runtime est optimisé pour les performances sur les appareils aux bords, assurant une exécution efficace des modèles.
- Edge Impulse: Edge Impulse est une plateforme spécifiquement conçue pour le développement d’IA aux bords. Elle offre des outils pour la collecte de données, l’entraînement et le déploiement, simplifiant le processus de création et de déploiement de solutions d’IA aux bords. Edge Impulse prend en charge une large gamme de plateformes matérielles et fournit une interface intuitive pour les développeurs.
Défis et considérations
Bien que l’IA aux bords du réseau offre de nombreux avantages, elle présente également plusieurs défis qui doivent être abordés :
- Ressources limitées : L’exécution de modèles d’IA complexes sur des appareils avec une puissance de traitement limitée, une mémoire et un stockage restreints est défiante. Les développeurs doivent optimiser les modèles pour équilibrer la performance et la consommation de ressources, assurant une exécution efficace sur les appareils aux bords. Des techniques telles que la quantification des modèles, la pétillade et la distillation de connaissances sont couramment utilisées pour réduire le charge de calcul et l’empreinte mémoire des modèles d’IA.
- Contraintes énergétiques : Les appareils aux bords, en particulier ceux alimentés par batterie, nécessitent des algorithmes et du matériel d’IA efficaces en énergie. Assurer une durée de vie de batterie longue tout en maintenant la performance est crucial pour le déploiement généralisé de l’IA aux bords. Des techniques telles que la conception de matériel à faible consommation d’énergie, les algorithmes efficaces en énergie et la gestion dynamique de l’énergie sont essentielles pour minimiser la consommation d’énergie sans compromettre la performance.
- Sécurité et confidentialité des données : Le traitement de données sensibles aux bords nécessite des mesures de sécurité robustes. La protection des données et le respect des réglementations comme le RGPD sont essentiels pour maintenir la confiance des utilisateurs et prévenir les violations de données. Des techniques telles que l’encryption, le démarrage sécurisé et les environnements d’exécution fiables sont couramment utilisées pour renforcer la sécurité et la confidentialité des données dans les déploiements d’IA aux bords.
Conclusion
L’IA aux bords du réseau représente un changement majeur dans la façon dont nous déployons et utilisons l’intelligence artificielle.
En ramenant le calcul plus près des sources de données, l’IA aux bords du réseau aborde les limites de l’IA basée sur le cloud, comme la latence, les préoccupations de confidentialité et les coûts de bande passante.
Les avancées en matériel et logiciel, y compris le développement de modèles d’IA plus petits et plus efficaces, stimulent la croissance de l’IA aux bords du réseau dans diverses industries.
L’IA aux bords du réseau promet un avenir où les appareils et applications intelligents s’intègrent de manière fluide à nos vies quotidiennes, les rendant plus rapides, plus sûrs et plus réactifs.
