Covid-19 : comment adapter sa stratégie Data ?
3
 min
Monter en compétence
 Publié le 
12/11/2020

Covid-19 : comment adapter sa stratégie Data ?

Lorsque les entreprises et organisations traversent des périodes où le monde est sujet à de grands bouleversements, où l'homme n'est plus capable de se baser sur la donnée historique : que faire pour réagir à tout cela ? Cédric, co-fondateur & directeur scientifique @ Kardinal - spécialiste de l'optimisation de tournée par l'IA - nous explique tout ceci.

Contextualisons : L’IA dans l’industrie

Dans l'IA théorique, les chercheurs ont la maîtrise technique des outils & librairies. Lorsque l'on bascule en entreprise ou dans l'industrie, il faut voir l’IA au sens plus large pour pouvoir l'appliquer.

Les 3 étapes d'un processus de décision par l'IA

Si on essaye de résumer les tâches et technos qui interviennent, nous pouvons décomposer le process d'IA en 3 étapes, en faisant l'analogie avec l'humain.

  1. Perception de l’environnement : il faut que la donnée soit collectée et stockée de la meilleure des manières, d’où les concepts de Big Data ou IoT
  2. Pour comprendre l’environnement : les tâches de l'analytics, de la visualisation de données sont en place pour construire de l‘information sur la donnée qui existe.
  3. Et prendre une décision : On va essayer de comprendre comment les différents indicateurs intéragissent ensemble pour prendre des décisions.

Parfois nous nous arrêtons à la phase de compréhension. Entre les dashboards de visualisation et la bonne performance d'un modèle, l’humain est capable de prendre la décision seul. Dans des problématiques très industrielles, où il faut prendre beaucoup de paramètres en compte, le Renforcement Learning & la recherche opérationnelle sont des tâches permettant la bonne prise de décision par l’IA.

Les modèles d'IA en industrie doivent toujours transiter par aux moins les 2 premières étapes pour apporter une valeur ajoutée, que l'on utilise les technologies ou pas.

Pour faire le lien avec la pandémie du Covid

Quand ces process sont imaginés, c'est le plus souvent dans un contexte classique, pour gérer du Day to Day. Il est facile d'imaginer que des événements comme le Covid peuvent rapidement être un grain important dans les rouages de la machine. Ces bouleversements vont rapidement remettre en cause la prédiction du modèle de Machine Learning dans cette chaîne de traitement.

Dans l’industrie, l’IA n’a de valeur ajoutée que si elle débouche vers une action. On peut classer les types de tâches sous 2 catégories :
  • Les tâches répétitives, avec peu de valeurs ajoutées : trier des déchets sur des tapis roulants, classifier des documents, classifier des contenus sous les tags. Chose que l’humain sait faire mais qui reste très chronophage et rébarbative.

Le but de l’IA est ici l’automatisation

  • Tâches plus complexes : elles ont un impact stratégique

Le but de l’IA est ici l’aide à la décision. Elle va assister l’humain pour éclairer ses indicateurs de performance.


On peut bien comprendre ici le dénominateur commun qui est l’action : tant qu’aucune action n’est prise, pas de valeur ajoutée à la mise en place d'une stratégie Data.

Quand on met en production un système avec une intelligence artificielle qui produit des actions ayant de la valeur, on y introduit une sorte de fragilité. Il faut alors être très prudent quand la donnée n’est plus bonne, lorsqu'un événement tel que la pandémie mondiale se produit.


Comment le covid-19 a-t-il impacté ces systèmes basés sur des modèles d'Intelligence Artificielle ?

Reprenons nos 2 typologie de tâches

  • L'automatisation, elle est ici toujours parfaitement réalisable et gérable et va même faire économiser beaucoup de temps à l'entreprise en crise.
  • Pour des tâches plus complexe, la Data va nous permettre de comprendre ce qu’il se passe pendant cette période trouble.
D’un autre côté, si une grande partie du processus de décision est basée sur des modèles de Machine Learning et des analyses qui se font en temps réel, on prend un risque de total déraillement découlant du déraillement de la Data également : l’historique de la donnée n’est plus fiable.


La notion de Concept Drift

En Machine Learning, comme dans tous secteurs, le contexte dans lequel on travaille change constamment.

Ce qui était vrai lorsque l’apprentissage a été réalisé, va devenir de moins en moins vrai, puisque le marché évolue. La performance va décroitre et le modèle va petit à petit devenir obsolète.
Ici, les concepts drifts sont classés du moins brutal (le blips, par exemple lorsqu'il y a des jours férié) au plus brutal (sudden, lorsque le changement se fait du jour au lendemain)

Nous avons ici 5 typologies de "dérives du concept", nous faisant passer d'un status quo A à un status quo B.

Nous pourrions apparenter la crise du covid au concept drift sudden qui reste le pire des cas : ce qui était valable à l’époque ne l’est plus du tout aujourd’hui. D’un jour au lendemain, le modèle est à mettre à la poubelle, ce qui peut arriver souvent dans l’industrie.

Comment mesurer le Concept Drift menant à une baisse de performance ?

La stratégie passive : mise à jour constante des modèles !

Avec un rythme qui est à définir selon la problématique, il faut remettre à jour la base de données avec celles qui arrivent en temps réel pour capter les changements et pondérer les features qui sont plus ou moins importantes selon le moment. Cette stratégie est adaptée à des changements progressifs : les features sont calculées sur un historique proche.

L'idée n’est pas ici de rechallenger totalement le modèle.

Stratégie active : détection du drift

Ici il s'agit de rechallenger toutes les hypothèses de son modèle d'IA. La stratégie est ici de monitorer en temps réel la performance pour identifier la baisse de performance, signe de concept Drift.


Le COVID : c’est même un peu plus que du concept drift sudden !

Quand on construit ses modèles, il faut toujours garder en tête qu’il peut y avoir des changements plus ou moins brutaux qui peuvent largement les mettre à mal.


C'est le concept "Upheaval", un niveau de difficulté supplémentaire.

Le Upheaval n'est pas ici un terme officiel utilisé dans les papiers scientifiques.



On ne parle pas ici d'une dérive progressive du concept, mais bien d'un bouleversement soudain avec d'importantes turbulences long-termistes. Pendant un moment, on ne peut compter sur aucune Data car elle change trop vite, et surtout trop souvent.

Les stratégies passives & actives deviennent alors complexes à appliquer pour rechallenger nos modèles de Machine Learning. Il faut attendre que cette période passe pour les réévaluer.


Quelles causes ?

Finalement, les chances qu'un de ces événements arrive et perturbe un modèle reste tout de même très importante. De quelles causes parle-t-on au juste ?

  • Les crises économiques : les subprimes se sont traduites par une baisse de la consommation sur du très long terme
  • Les catastrophes naturelles : une zone géographique  devient inaccessible que ce soit pour la production ou la logistique
  • Le terrorisme & la guerre
  • Les crises sanitaires
  • La disruption technologique : elle va impacter positivement des business avec de nouvelles opportunités, mais induit tout de même beaucoup de changements. On peut prendre pour exemple Tiktok qui induit un nouvel usage des réseaux sociaux, et peut bouleverser la stratégie CM de beaucoup d’entreprises. D'un autre côté, elle appelle tout de même à de nouvelles opportunités de production de contenus.

La notion de résilience est donc très importante. Le bouleversement implique un changement qui est permanent et auquel il faut faire face !

Use case - la livraison du dernier kilomètre (DPD, Colissimo, Chronopost )

Avec la crise sanitaire et les confinements, le e-commerce explose et s’appuie massivement sur ces prestataires pour leurs livraisons.

Nous trouvons ici un double enjeu :

  • Gérer le volume des commandes (particulier ou professionnel) de livraison passées très régulièrement. Il convient également de respecter les créneaux de temps.
  • Bien dimensionner les moyens pour trouver la rentabilité en optimiser les ressources nécessaires (camions, chauffeurs etc)

Pendant le confinement, la Supply Chain a fortement été mise à contribution pour une population qui s’est beaucoup reposée sur ces prestations de livraisons, que ce soit pour de l’alimentaire ou tout autre course non-alimentaire demandant une livraison.

Les retours d'expérience d'un CEO d'une entreprise de livraison.

Volume de demandes pour l'entreprise de livraison
"A l'annonce du confinement, le volume de livraison a été divisé par 5. La semaine suivante, le B2B remontait à la moitié de la normale. La semaine suivante, le B2C était multiplié par 2, puis par 3 la semaine d'après."

Pour cette entreprise, il a fallu se réinventer chaque jour pour réadapter leur système de livraison. Pour cause ? La stratégie utilisée un jour n'est plus valable le lendemain, car le volume de commandes évoluait extrêmement brutalement pendant cette période.

Décomposons la citation du messager : l'illustration de la violence du changement

  1. Le volume global a été divisé par 5 : Est-ce que ça va rester comme ça ? Dois-je mettre mes chauffeurs au chômage partiel ? Dois-je me séparer de certains prestataires ?
  2. La semaine suivante : le B2B remontait à la moitié de la normale alors qu’il avait été divisé par 5. Les entreprises qui avaient pour habitude de commander de petits volumes ponctuellement, commandaient par exemple 1 fois par semaine de gros volumes. D’autres adoptaient la stratégie inverse.
  3. Puis il a été multiplié par 2, puis par 3 la semaine d’après : Les tournées B2C et B2B se sont fractionnées. Egalement, beaucoup de commerces qui ne faisaient habituellement pas de livraisons s’y sont mis pendant le confinement.
Avec toutes ces variations : comment se faire des tendances ? Comment gérer tout ceci ? "Un modèle de Machine Learning ne tient pas 2 jours avec autant de changements : il faut parvenir à gérer le tout venant de la meilleure des façons."


Le Upheaval & crise sanitaire : Comment gérer son activité ?

L’IA en production dans l’industrie n’est pas encore totalement au fait dans les entreprises. Il revient aux Data Scientists la responsabilité de prendre ces éléments en comptes quand qu’ils construisent leur système et modèle, avec une réflexion autour de l’environnement de l’entreprise, des produits etc.

Que faire pour aborder la problème d'une telle variation d'activité ?

1. Back to basics : l'analytics

La connaissance business prend alors tout son sens : Il s'agit ici de se replonger dans ses données, et d'appliquer de l'analytics simple. Cela se matérialise par des ressources humaines qui doivent être allouées en interne : Business Analysts, Data Analysts, ceux-ci doivent pouvoir sortir au plus rapidement les nouveaux KPIs qui permettront de comprendre et anticiper les nouveaux changements. Cette mission peut in fine faire gagner des jours voire des semaines dans un contexte si rude, en trackant les indicateurs pour essayer de comprendre les volumes à traiter le lendemain.

2. Détourner vos systèmes de prise décision pour simuler !

Penser un système pérenne, c'est arriver à pouvoir le faire marcher sans Machine Learning, afin de comprendre se qu'il se passe dans son modèle et gérer lorsqu'une crise arrive. Il s'agit d'utiliser l'IA comme aide à la décision et non comme un fin en soit.

Quand l’analytics permet de faire des hypothèses sur les actions à prendre dans le futur, il faut tester ces scénarios avec le système pour comprendre ce que serait le pire des cas possibles, les moyens minimum à avoir, les pools de ressources à allouer etc.  L’idée est ici de retrouver la stabilité sans forcément retourner aux performances d’antan. Il convient ensuite de montrer l'impact chiffré de chaque décision en fonction des scénarios aux décideurs.

3. Sur-exploiter les technos d'IA d'aide à la décision

Il s'agit ici de débrancher la partie 'prédiction' quitte à diminuer la rentabilité afin d’assurer que les livraisons finales soient assurées. Sur ces tâches complexes, il faut garder en tête que l'IA doit être un outil d'augmentation de l'expertise humaine et non de remplacement.


Un mot pour la fin

Les bouleversements qui ont été engrangés par le Covid posent la question de la résilience du processus industriel quand on y implémente une IA. Tout ceci reste une action à forte valeur ajoutée sur tous les niveaux lors d'une période normale. Mais laissant une partie de l’expertise à la machine, il peut alors se poser le problème de la solidité du système lorsqu’un bouleversement arrive et que l'on ne plus utiliser ce modèle.


Rejoignez la communauté sur JULIE !

Python, SQL, gestion de projet Data, toutes les compétences à acquérir pour monter en compétences

Cédric Hervet
Écrit par
Cédric Hervet
 - 
Co-fondateur & Directeur Scientifique
@ Kardinal

Python : le language de programmation le plus
populaire parmi les professionnels de la Data !

Obtenez notre livre d'Introduction Pratique à Python !

Programmes, thématiques Data, admissions,
vous avez une question ?

Prenez rendez-vous avec nos équipes