• Articles
22min mai 24, 2022 22min Mai 24, 2022
mai 24, 2022 22 minute read

La gestion des données industrielles : des bases de données aux Jumeaux Numériques

Des données, des données, encore des données. Outre votre personnel et vos produits, les données sont l’un des biens les plus précieux de votre entreprise. Alors que l’Industrie 4.0, la transformation numérique et les technologies intelligentes continuent de remodeler le paysage industriel, les données sont essentielles pour demeurer compétitif. Pour les chefs d’entreprise, il est impératif de bien comprendre les outils de gestion de données et leur impact sur l’industrie.

D’une part, cela vous permettra d’assurer que votre entreprise utilise chaque outil correctement et efficacement dans votre écosystème, mais également de maximiser ses avantages et de renforcer la valeur qu’il apporte à votre entreprise.

Voici une introduction à la gestion de données à titre de référence. Vous découvrirez les différents outils de gestion de données, leur utilisation dans le paysage industriel et leur valeur ajoutée.

Les méthodes de stockage de données

Les outils de gestion de données peuvent prêter à confusion pour tout industriel. Décortiquons certains des termes les plus courants en matière de solutions de données.

Les solutions traditionnelles de gestion de données

Data Lake (Lac de données)

Un Data Lake est un référentiel central permettant de stocker des données dans leur format natif. Tout comme un lac, il a une architecture plate, les données y étant simplement déversées. Chaque élément de données se voit attribuer un identifiant unique qui permet de le retrouver lors des requêtes.

Les exigences en matière de schémas et de données ne sont pas définies avant que les données ne soient utilisées. Les Data Lake sont souvent utilisés comme zones d’attente pour les données avant qu’elles ne soient transférées dans un conteneur de stockage plus structuré. Les Data Lake peuvent être installés sur site ou dans le Cloud.

Base de données

Une base de données est une compilation organisée d’informations ou de données stockées et accessibles par voie électronique. Les bases de données facilitent l’accès aux informations, leur gestion, leur modification, leur mise à jour, leur contrôle et leur organisation.

Il existe de nombreux types de bases de données, notamment les bases relationnelles, hiérarchiques et orientées objet. En général, elles ont une structure bidimensionnelle en colonnes et en lignes. Voici quelques exemples de bases de données : Oracle, SQL Server, MS Access, FileMaker.

Data Warehouse (Entrepôt de données)

Un Data Warehouse est également un référentiel de données. Mais contrairement au Data Lake, le Data Warehouse est structuré.

En règle générale, les Data Warehouses sont orientés sujet, intégrés, temporaires, non volatiles (les données ne peuvent pas être modifiées ou supprimées une fois qu’elles y figurent) et synthétisés. Une entreprise peut avoir plusieurs Data Warehouses pour plusieurs sujets. Ils stockent des données historiques ou résumées.

Les solutions innovantes de gestion de données industrielles

Les systèmes SCADA et les Jumeaux Numériques ne sont généralement pas considérés comme des environnements de stockage de données classiques. Cependant, nous les avons inclus, car ils collectent tous deux des données en temps réel.

SCADA

Cet acronyme signifie « Supervisory Control And Data Acquisition » (système de contrôle et d’acquisition de données). Le SCADA est un système de contrôle qui comprend des ordinateurs, des communications de données en réseau et des interfaces graphiques, pour la surveillance de haut niveau des machines et des processus, comme le réglage de la température, la consommation d’énergie, la vitesse des machines, etc.

Les systèmes SCADA collectent des données via des dispositifs et des capteurs en réseau connectés à des PLC et/ou des RTU. Les informations sont visualisées sur une interface homme-machine (IHM). Les systèmes SCADA recueillent et transmettent les données en temps réel.

Jumeau Numérique

Un Jumeau Numérique est une réplique numérisée d’un objet, d’un produit, d’un processus, d’une chaîne d’approvisionnement ou d’un écosystème opérationnel complet. Pour les industriels, les Jumeaux Numériques s’appliquent aux actifs, aux lignes de production spécifiques, aux produits finis ou à tout autre scénario du « monde réel » au sein d’un processus de production. 

Il est important de noter que les Jumeaux Numériques ne se limitent pas à des simulations : ils utilisent des données en temps réel provenant des entités physiques qu’ils représentent. Les données passent par un modèle qui les rend plus exploitables pour l’analyse et la compréhension. Dans le cas du Jumeau Numérique de Braincube, le modèle collecte, cartographie et structure les variables du processus avant de les ajouter à une base de données mise à jour en continu.

L’accès à cette base de données dans un environnement virtuel, notamment via une plateforme IIoT, permet aux équipes de modifier et de tester les changements apportés aux applications, modèles ou programmes tiers. Elles peuvent ainsi valider les changements avant de les introduire dans le système physique. Quelle que soit la manière dont vous créez votre Jumeau Numérique ou le type de Jumeau Numérique dont vous disposez, vous obtenez une représentation numérique que vous pouvez utiliser pour avoir une meilleure visibilité sur votre production. 

Votre entreprise manufacturière utilise probablement déjà la plupart (si ce n’est la totalité) de ces outils de gestion de données. Ce sont les piliers d’un environnement virtuel.

Si vous comprenez comment les optimiser en fonction des différentes utilisations et tâches, vous pourrez tirer le meilleur parti de vos investissements technologiques actuels et futurs.

Voici une synthèse de ces solutions de gestion de données industrielles, dans quatre domaines de valeur clés.

Le coût des solutions de gestion de données

La technologie coûte cher et les dépenses sont toujours au cœur des préoccupations. Une bonne compréhension de vos investissements en matière de données vous permettra de maximiser le ROI.

Les Data Lake se situent en bas de l’échelle des investissements. Un Data Lake vous permet de stocker un grand nombre de données à un prix relativement bas. Vous obtenez un grand volume pour un coût initial moindre. Si vous souhaitez collecter toutes les données produites par votre entreprise, les Data Lake conviennent parfaitement. 

L’inconvénient des Data Lake, c’est qu’ils ne sont pas conçus pour regrouper rapidement les informations. Leur manque de structure rend l’extraction des données lente et fastidieuse. Ce que vous économisez initialement pourrait être dépensé en temps ou dans d’autres systèmes dès que vous chercherez à en extraire des données. Souvent, les entreprises utilisent les Data Lake comme zone d’attente avant de déplacer les données vers un autre système plus structuré ou vers une équipe de spécialistes des données pour les catégoriser.

Les bases de données se situent à l’extrémité la plus abordable de l’échelle des prix. Elles sont très efficaces pour le stockage de grands volumes de données. Leurs coûts de stockage flexibles varient généralement selon les besoins. Leur structure simple (lignes et colonnes) permet de récupérer et d’utiliser les informations assez rapidement et facilement. Toutes les infrastructures technologiques disposent d’un composant de base de données et certaines en ont plus d’un. 

Les bases de données entraînent des coûts supplémentaires cachés, notamment en ce qui concerne la qualité des données. Au fur et à mesure de l’utilisation de vos bases de données, la qualité des données s’érode inévitablement. Les utilisateurs ne respectent pas les protocoles de saisie des données, des personnalisations et des solutions de contournement sont ajoutées, et des redondances sont créées. Ces problèmes sont généralement mis en évidence lors des mises à niveau. Au fil du temps, cela crée des problèmes de performance et de latence, qui sont coûteux à résoudre. 

Les Data Warehouse se situent à l’extrémité supérieure de l’échelle des prix. Leur coût dépend du volume de données, ce qui fait rapidement grimper les prix. Cependant, cet investissement permet aux équipes de disposer d’un environnement de données fortement structuré, puisque les données historiques sont triées au fur et à mesure de leur stockage. Cela se traduit par des économies ultérieures en termes de facilité d’utilisation et d’accessibilité (bien qu’il puisse encore y avoir une certaine latence). 

Le SCADA et les Jumeaux Numériques permettent aux équipes d’accéder facilement, voire instantanément, aux données. Cette capacité n’est pas à la portée d’autres options de stockage de données, et elle a d’énormes répercussions sur les industriels. La capacité de « voir » ce qu’il se passe sur une machine ou une ligne de production à un moment donné est essentielle pour l’efficacité, la qualité des produits, la santé des machines et la réduction des coûts. 

Malgré leur coût, les systèmes SCADA et les Jumeaux Numériques apportent des informations précieuses et des économies aux opérations. Ils méritent amplement leur place et leur ROI.

Comme il s’agit de systèmes très spécifiques, ils se situent au sommet de l’échelle des prix des outils de gestion de données industrielles. Cependant, compte tenu des informations et des économies qu’ils apportent à la production et aux opérations de l’entreprise, ils méritent amplement leur place et leur ROI.

Agilité du système et accessibilité des données

Les systèmes de gestion de données ne servent pas uniquement à stocker les données. Vous devez exploiter les données pour obtenir des informations et des tendances, qui permettront à votre entreprise de rester compétitive. Il est donc important de comprendre l’agilité et l’accessibilité de chaque solution. Est-il facile d’accéder et d’exploiter les données ? Quel est le niveau d’expertise nécessaire pour effectuer ce travail ?

Les Data Lake sont extrêmement agiles mais leur accessibilité est limitée. Leur architecture plate et leurs données non structurées facilitent la configuration et la reconfiguration des données pour les modèles de données, les requêtes et les applications. 

Cependant, comme les données ne sont pas structurées, il faut une expertise technique pour pouvoir réellement les exploiter. Par conséquent, les données ne sont pas facilement accessibles à tous. L’accès aux données est plutôt limité aux Data Scientists et aux développeurs de données (ou aux équipes informatiques). Cela crée un goulot d’étranglement pour les autres utilisateurs de votre organisation, notamment les opérateurs, ingénieurs, responsables d’usine et la Direction.

En comparaison, les bases de données et les Data Warehouse ont une agilité limitée, mais une grande accessibilité. L’ajustement de leurs structures nécessite une expertise technique et peut prendre beaucoup de temps. C’est un processus lent et délicat. Cependant, leurs protocoles de données structurées rendent les données accessibles à un plus grand nombre d’utilisateurs. 

À l’heure des Citizen Data Scientists, l’accessibilité est la clé du succès. Les employés de tous niveaux dépendent des données pour être efficaces sur leur lieu de travail. L’utilisation d’une technologie de gestion de données qui facilite la démocratisation des données permet aux industriels d’exploiter les connaissances et l’expertise collectives de l’ensemble de leur personnel, au lieu de les limiter aux seules équipes techniques. C’est une façon d’équiper les experts en processus d’analyses en libre-service et d’une IA à commande humaine, pour favoriser la découverte, sans avoir à écrire de code.

Les systèmes SCADA et les Jumeaux Numériques facilitent tous deux l’accès. Grâce à un flux d’informations continu et en temps réel provenant de ces deux technologies, les équipes bénéficient d’un meilleur accès aux données. Cependant, ce n’est pas parce que les systèmes SCADA et les Jumeaux Numériques facilitent l’accès aux données qu’ils offrent la même facilité d’utilisation

Ce n’est pas parce que les systèmes SCADA et les Jumeaux Numériques facilitent l’accès aux données qu’ils offrent la même facilité d‘utilisation

Les systèmes SCADA disposent d’interfaces visuelles (IHM) simplistes pour communiquer avec les machines. Les systèmes SCADA permettent de suivre et de contrôler facilement ce qu’il se passe dans l’atelier, ce qui est précieux.

Néanmoins, la plupart des systèmes SCADA n’ont pas la capacité de faire quoi que ce soit avec les données. Les équipes ne peuvent utiliser un système SCADA pour faire des découvertes ou des améliorations. La visibilité issue d’un système SCADA peut être très utile, mais elle ne suffit pas à générer les changements transformationnels, qui permettront à votre organisation d’atteindre des performances optimales. 

En outre, il n’est pas toujours possible de regrouper les données provenant de différents dispositifs dans un SCADA. La plupart des systèmes SCADA exigent que tous les capteurs et dispositifs de votre usine soient de la même marque ou de la même société, afin de compiler les données de toute la chaîne de production. La plupart des industriels ont des machines et des équipements de marques différentes dans leurs usines. Cela a une incidence considérable sur l’utilisation des données, car les équipes ne peuvent pas accéder à toutes leurs données de production en même temps. Elles continueront probablement à travailler en silos, ce qui rendra difficile la transformation de toute une organisation à l’aide des données.

Les Jumeaux Numériques, notamment ceux de Braincube, intègrent et améliorent les données SCADA pour des utilisations plus larges au sein de l’organisation. Les Jumeaux Numériques renforcent le contexte des données, qui peuvent ensuite être exploitées dans des applications ou d’autres systèmes.

Les données du Jumeau Numérique peuvent être exploitées dans les applications de Braincube, comme l’application Analyses Avancées, pour optimiser la production.

Par exemple, un système SCADA peut collecter des données sur la température, les vibrations, la consommation d’énergie et d’autres variables clés du processus. Les Jumeaux Numériques de Braincube prennent ces données et les contextualisent grâce au balisage des métadonnées, aux temps de latence et à d’autres sources de variation (par ex : les informations sur les fournisseurs). Ce niveau de détail des données dote les équipes d’informations pertinentes pouvant être mises à profit, au lieu d’être stockées et utilisées uniquement en cas de besoin.

Les applications avancées de Business Intelligence (BI) de Braincube facilitent l’accès et l’utilisation des données provenant d’un Jumeau Numérique. Ces applications prêtes à l’emploi sont conçues spécifiquement pour les cas d’utilisation industriels et disposent d’interfaces conviviales. Elles rendent les données du Jumeau Numérique instantanément accessibles et exploitables par les employés, à tous les niveaux de l’entreprise.

Par conséquent, les équipes ne nécessitent pas de compétences avancées en codage, en modélisation ou en analyse, pour faire des découvertes significatives à partir des données : c’est le cœur du mouvement Citizen Data Scientists. Les applications effectuent de gros calculs complexes, afin que les employés puissent se concentrer sur l’utilisation de leur connaissance intrinsèque des processus pour obtenir des résultats. 

Vitesse de traitement

Les vitesses de traitement des systèmes de gestion de données varient. Étant donné que l’industrie manufacturière évolue à la vitesse de l’éclair, comprendre les variables de vitesse impliquées pour accéder aux données et les utiliser permet de gérer les attentes. Cela peut également vous permettre de déterminer quel système convient le mieux à vos besoins et à vos objectifs.

Les Data Lake sont de vastes dépôts de données. Leur capacité à accueillir des données dans n’importe quel format est pratique. Comme indiqué ci-dessus, une architecture plate et un schéma de données non structurées permettent une exploitation des informations de diverses manières, mais cela prend du temps. Lorsqu’une requête est effectuée, le système doit examiner chaque élément de données un par un, afin d’extraire les données demandées. Le temps nécessaire dépend de la taille du Data Lake. Si votre Data Lake devient un Data Swamp (marécage de données), ce qui peut facilement arriver, les temps de traitement augmentent.

Les bases de données et les Data Warehouse traitent les données plus rapidement. Leur architecture et leurs données structurées permettent des recherches plus ciblées : le système peut aller directement à la zone de données pertinente. La latence est minimale et les résultats sont, dans la plupart des cas, instantanés. Ces solutions sont donc idéales pour les fonctions opérationnelles quotidiennes : rapports, analyses, visualisation, etc. Elles peuvent répondre à la demande. 

Néanmoins, les systèmes existants et la qualité des données peuvent avoir un impact sur les vitesses de traitement des bases de données et des Data Warehouse. Une latence notable peut signaler qu’il est temps de procéder à une mise à niveau ou à un nettoyage des données.

Les SCADA et les Jumeaux Numériques fournissent des informations en temps réel. Leur temps de latence est même inférieur à celui des autres systèmes. Les systèmes SCADA sont constitués d’un réseau de dispositifs interconnectés, qui offrent une vue d’ensemble de votre chaîne de production en cours de fonctionnement. Les données en temps réel permettent de maintenir l’efficacité et la qualité des produits, tout en gardant une longueur d’avance sur l’état et la maintenance des machines.

Les Jumeaux Numériques rendent les données instantanément disponibles, exploitables et prêtes à être analysées. Ils permettent d’accélérer la prise de décision, l’innovation et la résolution de problèmes.

Les Jumeaux Numériques vont un peu plus loin que les systèmes SCADA : les données sont instantanément disponibles, exploitables et prêtes à être analysées. Ils facilitent l’exploration des données provenant de votre système SCADA sans perturber les opérations en cours. Le seul obstacle à la vitesse de traitement pourrait être la bande passante de votre entreprise. Même avec des limitations de bande passante, les délais de traitement ne représentent généralement qu’une fraction des autres solutions de données énumérées ici. 

Grâce aux Jumeaux Numériques de Braincube, les équipes disposent d’un accès permanent à des données contextualisées, pouvant être utilisées dans des logiciels d’analyse, d’optimisation et autres efforts d’amélioration continue. Ces outils logiciels peuvent inclure les applications de BI de Braincube, Tableau, RapidMiner, ou une variété d’autres systèmes. Cela accélère la prise de décision, l’innovation et la résolution de problèmes.

Mise à l’échelle

La capacité à mettre à l’échelle un système de gestion de données est un aspect essentiel à prendre en compte au moment de choisir la voie à suivre. Il est essentiel de veiller à ce que les solutions de données soient interopérables au sein de votre infrastructure pour réussir leur mise à l’échelle.

À l’instar des autres systèmes traditionnels de gestion des données (Data Lake, Data Warehouse et bases de données), les systèmes SCADA fonctionnent sur des serveurs et ont une architecture de stockage traditionnelle. Ces limitations matérielles entraînent un impact considérable sur les performances d’un système SCADA lorsque de nouveaux utilisateurs sont ajoutés au système et commencent à en extraire des données. En d’autres termes, l’architecture du système ne permet de traiter qu’un nombre limité de demandes à un moment donné. 

En outre, les données étant stockées sur des serveurs physiques situés sur site, il est difficile d’extraire des données SCADA de sites distants. Bien que les équipes n’aient pas de difficulté à accéder aux données dans l’usine où elles travaillent, il leur faudra plus de temps pour exécuter des rapports ou extraire des données d’autres usines. Cela complique le recoupement des performances, la collaboration sur des problèmes communs ou l’examen des données collectives pour les initiatives ou les objectifs de l’entreprise. À l’ère du travailleur connecté et de la démocratisation des données, ces limitations peuvent avoir de graves conséquences sur les résultats de l’entreprise.

En d’autres termes, il est extrêmement difficile de mettre à l’échelle un système SCADA pour l’étendre à l’ensemble de l’entreprise. Ils n’ont pas la capacité d’extraire facilement et rapidement les données de plusieurs usines simultanément. Les systèmes SCADA fonctionnent bien au niveau de l’usine, mais ne sont pas des solutions adaptées à l’ensemble de l’entreprise – une tendance qui ne semble pas près de s’estomper

Cette contrainte importante de mise à l’échelle des systèmes SCADA est surmontée par l’utilisation de Jumeaux Numériques. Les Jumeaux Numériques exploitent (et produisent) des données de l’Internet des objets (IoT). Les données IoT peuvent provenir de n’importe quelle source pertinente en dehors de votre organisation, quel que soit le fabricant du capteur ou du processeur. 

Quelle est la différence entre IoT et IIoT ?

Découvrez leur différence dans ce court article.

Les Jumeaux Numériques utilisant des données IoT ne sont pas limités à l’utilisation des mêmes marques de capteurs ou de dispositifs que les systèmes SCADA. Les Jumeaux Numériques peuvent accueillir des données provenant de n’importe quel système ou dispositif, les modifier et les rendre facilement accessibles à tous.

Par exemple, l’IoT permet de transférer dans votre Jumeau Numérique des données MQTT (ex : échanges de données entre un MES et un système SCADA), XMPP (ex : communications provenant d’un équipement informatisé), CoAP (ex : données web), ou REST (ex : données entre logiciels).

Le recours à Internet permet également de réduire les limitations en termes de nombre d’utilisateurs, de volume de demandes d’extraction ou d’autres obstacles à l’utilisation généralement associés aux architectures sur site. Il est également plus facile d’accéder de manière transparente à des données provenant d’autres usines, pays ou réseaux via une connexion Internet, ce que les systèmes sur site auront toujours du mal à faire

Si vous évaluez la mise à l’échelle des systèmes SCADA et IIoT, tenez compte de ceci : à terme, vous pourriez dépenser bien plus pour plusieurs systèmes SCADA que pour une seule solution IIoT.

Quand vient le moment de déployer vos Jumeaux Numériques dans d’autres usines, votre fournisseur tiers s’occupe de presque tout. Chez Braincube, notre Cloud et nos capacités d’interopérabilité nous permettent rapidement et facilement de mettre à l’échelle tous les aspects des systèmes de données de votre entreprise (notamment les Jumeaux Numériques), avec très peu d’implication de votre équipe informatique. En revanche, les solutions sur site telles que les systèmes SCADA nécessitent bien plus d’efforts de la part de vos équipes internes pour obtenir la même mise à l’échelle.

Si vous évaluez la mise à l’échelle des systèmes SCADA et IIoT, tenez compte de ceci : à terme, vous pourriez dépenser bien plus pour plusieurs systèmes SCADA que pour une seule solution IIoT(IoT Industriel).

Conclusion

En réalité, les infrastructures industrielles utilisent une combinaison de ces outils de gestion de données. Les Data Warehouse stockent les données historiques. Les bases de données gèrent les fonctions quotidiennes. Les systèmes SCADA suivent les opérations au sol. Les Jumeaux Numériques collectent les données en direct (y compris les données SCADA), les contextualisent et les rendent facilement accessibles pour étudier votre production sous un angle nouveau.

Une bonne compréhension des capacités et des inconvénients de chaque outil de gestion de données vous permettra de les utiliser à bon escient et de tirer le meilleur parti de leurs atouts individuels.

Plus important encore, une compréhension claire de ces solutions de gestion de données vous permet d’optimiser votre plus grand capital industriel : votre personnel. En dotant les équipes de données, vous assurez le bon fonctionnement de vos lignes de production et la progression de votre entreprise. L’alignement de vos outils de gestion de données sur l’employé et la tâche à accomplir garantit l’efficacité et l’efficience.

Ressources associées: