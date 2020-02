L’Intelligence Artificielle se glisse dans tous nos appareils électroniques. On en trouve même aujourd’hui dans les frigo, les montres ou les ampoules connectées, les vêtements parfois. Généralement, la puissance de cette IA provient du cloud : les serveurs moulinent pour faire fonctionner l’IA qui est ensuite déportée sur un smartphone, smartphone lui-même connecté aux différents appareils IoT.

Le réseau mobile étant ce qu’il est, faire entièrement reposer l’IA sur les capacités de calcul du « nuage » reste une stratégie risquée. C’est pour cette raison que depuis quelques années, un certain nombre de sociétés de la tech tentent de faire évoluer les capacités de calcul de l’IA en local, ce que l’on appelle communément l’edge computing (opposé au cloud computing). Les « neural engine » ou NPU (Neural Processor Unit) se sont donc développés sur les SoC de nos mobiles (des derniers Snapdragon de Qualcomm aux Kirin de Huawei en passant par les Ax d’Apple).

ARM se jette à son tour dans la bataille de l’edge computing avec le Cortex-M55 et l’Ehtos-U55, des architectures processeur entièrement dédiées au calcul d’IA en local. Ces puces se destinent essentiellement aux appareils de type IoT, comme par exemple une caméra connectée qui pourrait reconnaitre les visages sans devoir recourir au cloud. Sans surprise, la puissance brute de ces nouvelles architectures s’avère impressionnante : ARM annonce une amélioration des perfs en Machine Learning d’un facteur 15 (x15) et des calculs généraux 5 fois plus rapides.

Le NPU Ethos-U55 s’avère même encore plus performant (x32 en machine Learning couplé avec le Cortex-M55). ARM estime qu’à terme, les calculs de type machine learning pourront s’effectuer 480 fois plus rapidement sur un SoC M55 équipé du NPU U55 (que sur les anciennes générations de processeur) !