Des contrôleurs avancés au lieu de contrôleurs classiques ?
L'avenir des techniques de contrôle
Les contrôleurs classiques perdront de l'importance à l'avenir, tandis que les techniques de contrôle plus avancées gagneront en importance. C'est du moins la conclusion d'une enquête menée par l'IFAC, la fédération internationale du contrôle automatique. Ces techniques de contrôle avancées, telles que la commande prédictive par modèle (CPM), devraient servir de solution à la complexité croissante que les nouvelles applications exigent du système de contrôle.
L'enquête de l'IFAC a été menée dans différentes secteurs industriels, dont l'industrie de transformation, l'industrie automobile et le secteur aéronautique, pour connaître leur opinion sur les contrôleurs classiques par rapport au contrôle avancé des machines du futur. Il en ressort que les personnes interrogées s'attendent à ce que les contrôleurs classiques, tels que le contrôleur PID (proportionnel-intégral-dérivé), perdent de leur importance.
En effet, ils pensent qu'à l'avenir, les variables du processus seront plutôt pilotées par des techniques de contrôle avancées. Cela s'explique notamment par la complexité croissante des systèmes mécatroniques et les défis qui en découlent pour le système de contrôle, qui dépassent de plus en plus les capacités des contrôleurs classiques.
COmmande PRÉDICTIve par MODÈLE (cpm)
c pour commande et M pour modèle
La commande à base de modèle est une approche spécifique du contrôle au sein de l'ensemble des systèmes désignés sous le nom de commande par modèle interne (CMI). Les dispositifs CMI sont définis comme ceux qui utilisent un modèle interne d'une manière ou d'une autre. Cela permet de trouver une architecture appropriée pour le contrôleur et de le configurer, c'est-à-dire de trouver les meilleurs paramètres.
Comparons-le à un simple contrôleur PID, où un modèle du système est utilisé pour déterminer les paramètres (les termes P, I et D) au cours de la conception. Les paramètres de contrôle trouvés sont ensuite appliqués au système et affinés si nécessaire. Dans un contrôleur PID simple, ce modèle ne se reproduit pas pendant le fonctionnement du contrôleur.
Dans la commande prédictive par modèle (CPM), un modèle est également utilisé au cours du processus pour déterminer l'action de contrôle.
P de prédictif
L'idée de base qui sous-tend la CPI est qu'un bon modèle d'un système peut être utilisé pour prédire ce que sera la sortie du processus, la réponse, pour une entrée construite donnée, y compris la dynamique des systèmes (voir encadré).
DYNAMIQUE DES SYSTÈMES
Tout ce qui nous entoure évolue dans le temps, tout est en mouvement. La dynamique des systèmes étudie la manière dont un élément évolue dans le temps, si un équilibre sera atteint, si nous pouvons prédire ce qui se passera et si nous pouvons intervenir si l'évolution n'est pas celle souhaitée. Un exemple: une entreprise souhaite répondre le mieux possible à la demande d'un produit. Une petite fluctuation de la demande peut entraîner d'importantes fluctuations de la production. Il est donc souhaitable de pouvoir l'adapter à temps. En d'autres termes, il est important de comprendre la structure sous-jacente qui détermine l'évolution temporelle d'un système et, en outre, de rechercher une stratégie pour corriger tout comportement indésirable.
Un système est une partie de la réalité qui est reliée à l'environnement par un certain nombre d'entrées(déclencheurs) et un certain nombre de sorties (grandeurs dont on souhaite connaître l'évolution temporelle). L'évolution des entrées, ainsi que la nature du système, détermine l'évolution des sorties. Le concept de dynamique implique que les sorties à un moment donné dépendent non seulement des entrées à ce moment-là, mais aussi des entrées à des moments antérieurs.
Le système transforme l'entrée en sortie. Pour analyser ce système, nous avons besoin d'un modèle dynamique qui capture la relation entre les entrées et les sorties. Le système dont nous souhaitons influencer le comportement est appelé processus. La sortie du processus est contrôlée par un signal de commande. Le contrôleur génère ce signal de commande. Une boucle de contrôle contient une mesure de la sortie. La sortie est la variable contrôlée. L'entrée est appelée variable manipulée et fournit l'action de contrôle. Le trajet vers l'avant contient les éléments de contrôle et le processus. Le trajet de réaction est le trajet de transmission de la variable contrôlée au point de sommation et contient les éléments de rétroaction. Le signal de référence, fourni de l'extérieur par le contrôleur, représente généralement le comportement idéal du processus. Pour un système de contrôle, il s'agit d'une valeur de souhait constante (point de consigne), pour un système de suivi (système servo), d'un signal variable dans le temps. La sortie est mesurée et comparée au signal de référence. Le contrôleur transforme la différence entre les deux en un signal de commande afin d'obtenir le comportement souhaité (approximatif). Si nous voulons influencer la sortie d'un processus, nous devons évidemment être en mesure de prédire le comportement de la sortie sur un signal de commande.
Un système doté d'une boucle de rétroaction est un système en boucle fermée. En l'absence de boucle de rétroaction, on parle de système à circuit ouvert.
Un modèle du système peut donc être utilisé pour déterminer quelle sera la réponse dans le temps, à partir de l'état actuel du système, dès qu'une entrée particulière est constituée. Cette réponse sera testée par rapport à une valeur cible, le point de consigne, qui peut varier par paliers ou être une trajectoire dans le temps. L'objectif de la CPM est alors de déterminer l'entrée qui, à l'aide du modèle, permet à la sortie prédite de correspondre le plus possible à la valeur de consigne. En d'autres termes, il s'agit d'un problème d'optimisation, où l'entrée du système est la variable à résoudre et donc l'action de contrôle.
Problème d'optimisation dans le temps
Cependant, une CPM n'essaie pas seulement de faire en sorte que la sortie corresponde au point de consigne à un moment donné (maintenant), mais sur un horizon temporel réglable. La CPM se distingue des schémas CMI par l'utilisation de ce que l'on appelle l'horizon de prédiction. Il s'agit de prédire la sortie du processus à un moment échantillon sur l'horizon de prédiction. Lors du calcul de cette prédiction, les grandeurs de contrôle (les sorties) sont actualisées (= comptabilisées) jusqu'au moment échantillon actuel.
Plus l'horizon de prédiction est long, plus l'action de contrôle sera optimale. Mais plus le modèle doit être performant pour faire cette prédiction vers l'avant du système, plus il faut de puissance de calcul pour faire la prédiction et plus le problème d'optimisation dont nous parlons devient complexe.
Le contrôleur CPM détermine les futures variables de contrôle ou sorties optimales sur un horizon de contrôle. Le résultat de la CPM est alors une prédiction de la meilleure action de contrôle dans le temps, où seule la première action de contrôle est transmise au système à chaque temps d'échantillonnage. Dans ce processus, le modèle interne est toujours corrigé sur la base des valeurs mesurées réelles. En effet, au pas de temps suivant, un nouveau problème d'optimisation est résolu sur la base de la situation réelle. Il en résulte alors une mise à jour de l'action de contrôle optimale. Le fait de répéter le calcul à chaque pas de temps permet de générer un retour d'information et de compenser en outre les petits écarts.
Lorsque l'on détermine la modification optimale des variables manipulées, les entrées constituées, on parle également de mouvements. Parmi les mouvements calculés, seul le premier est toujours exécuté, car l'ensemble de la procédure est répétée à tous les temps d'échantillonnage suivants.
L'horizon de contrôle est donc le nombre de mouvements futurs à calculer. Ce nombre peut être au maximum égal à l'horizon de prédiction, mais il est souvent fixé à un niveau inférieur pour réduire le problème d'optimisation. Cela contraste avec la résolution du problème d'optimisation sur l'ensemble de l'horizon de la tâche (par exemple, le déplacement point par point d'un robot) et la soumission de ce résultat au système en tant que feedforward . Le CPM peut intégrer le contrôle feedback et feedforward de manière optimale. Les déviations et les défauts du modèle peuvent entraîner des résultats indésirables en cas d'horizons de contrôle trop longs. Il est donc important de disposer d'un retour d'information sur l'état actuel, comme dans le cas de la CPM.
L'optimisation pour le calcul des mouvements optimaux est effectuée sur la base d'une prédiction de la sortie, qui dépend à la fois des entrées de commande et de perturbation. Le retour d'information se fait en comparant la sortie réelle du processus et la sortie prédite, ainsi qu'en ajustant le modèle interne.
COMPOSANTS D'UNe CPM
Avec un contrôleur ou un régulateur classique, tel que le PID, l'action de contrôle consiste en une comparaison en boucle fermée. Une CPM implique un problème d'optimisation qui, dans sa forme la plus simple, peut être exprimé sous la forme d'une comparaison explicite, mais qui nécessite généralement le calcul numérique d'un problème d'optimisation. En d'autres termes, les éléments qui composent une CPM déterminent à chaque pas de temps ce que sera l'action de contrôle. À cet égard, nous parlons des composants suivants :
- La fonction cible détermine ce qui sera optimisé. Il s'agit généralement d'un écart par rapport à une valeur de référence (point de consigne) tout au long de l'horizon, complété par un certain coût sur l'action de contrôle elle-même et éventuellement un coût pour ne pas atteindre la valeur de référence à la fin de l'horizon.
- Les contraintes qui peuvent être ajoutées au problème d'optimisation peuvent s'appliquer à la fois aux entrées (par exemple, 12 V maximum pour un actionneur donné), aux états (par exemple, limitation de la vitesse d'un chariot linéaire) et aux sorties (par exemple, limitation de l'espace de fonctionnement d'un robot). Le calcul de l'action de contrôle optimale dans une CPM prend en compte ces contraintes, alors que dans un contrôleur classique, l'action de contrôle elle-même sera contrainte.
- Le modèle du système doit permettre de prédire dans le temps les sorties (la réponse) et l'état du système. La situation actuelle (sortie, état du système) sert alors de point de départ à cette prédiction.
En d'autres termes, la CPM diffère des contrôleurs PID classiques à bien des égards. Par exemple, la connaissance du modèle est combinée en temps réel avec l'état actuel du système pour déterminer une action de contrôle optimale. En outre, dans la fonction cible, différents éléments peuvent être mis en balance et les contraintes sur le système peuvent être prises en compte dans la détermination de l'action de contrôle optimale.
La complexité croissante des applications entraîne différents défis pour le système de contrôle. Dans de telles situations, les contrôleurs CPM offrent un avantage considérable par rapport aux contrôleurs classiques, tels que le PID.
AVANTAGES De la CPM
Le principal avantage de la CPM réside dans sa capacité à relever un large éventail de défis imposés au système de contrôle par l'application. Nous en donnons une liste non exhaustive ci-dessous.
Fonctions cibles multiples
Le contrôle classique, tel que le PID, est bon pour le suivi (suivi des changements de point de consigne ), entre autres choses, mais dans une application, ce n'est pas toujours l'objectif. Pensez au contrôle optimal en termes de temps ou d'énergie. Avec la CPM, la fonction cible ne doit pas seulement être le suivi d' une certaine valeur de référence, mais peut être complétée ou remplacée par d'autres fonctions de coût, telles que le coût de l'énergie, le temps de cycle, les pertes énergétiques ... permettant ainsi de contrôler directement ce coût - et non indirectement via le suivi.
Largement applicable
Les applications de la CPM sont également très vastes. Elle peut être utilisée simplement pour déterminer une action de contrôle à une fréquence plus élevée ou pour déterminer des points de consigne pour des sous-systèmes qui sont ensuite réalisés par des contrôleurs classiques. En outre, la CPM peut également être utilisée pour générer le chemin ou le trajet optimal de systèmes mobiles ou de robots, pour la gestion énergétique du stockage de l'énergie dans une batterie en fonction de la demande/production/prix futurs, pour la planification logistique et pour toute une série d'autres objectifs.
Contraintes sans limiter l'action de contrôle proprement dite
Comme indiqué brièvement plus haut, dans un contrôleur CPM, d'éventuelles contraintes peuvent être imposées directement dans le système, avec un impact direct sur l'action de contrôle. Par exemple, si une restriction sur la sortie devait être ignorée à l'avenir, l'action de contrôle qui est maintenant constituée reste limitée. Le contrôle classique n'en tient pas compte, ce qui peut entraîner un comportement indésirable.
En outre, une contrainte sur un actionneur peut être incluse directement, au lieu de limiter le calcul de l'action de contrôle à une certaine valeur.
Des contraintes plus complexes peuvent également être prises en compte dans une CPM, comme la prévention des collisions lors de la commande de robots. Ces contraintes sont fonction de la cinématique et de la géométrie du robot et ne s'appliquent donc pas de manière univoque à une contrainte sur l'actionneur.
Anticiper plutôt que réagir
En utilisant un modèle du système et un horizon de prédiction, le contrôleur CPM peut anticiper certaines choses, au lieu de se contenter de réagir à une déviation qui s'est déjà produite, comme c'est le cas dans le contrôle classique sans feedforward solide. Pensez, par exemple, à l'anticipation de la violation future d'une contrainte, à la prise en compte d'entrées variables dans le système ou à l'utilisation du comportement du système à son avantage, par exemple en utilisant le balancement d'une charge sur un portique à son avantage au lieu de toujours contrôler ce balancement.
En outre, une CPM peut également bien gérer les non-linéarités (si elles sont modélisées) dans les systèmes ou la combinaison d'actions de contrôle continues (par exemple, la vitesse de rotation d'une pompe) et discrètes (par exemple, l'ouverture ou la fermeture d'une vanne), qui sont généralement des problèmes difficiles à résoudre pour les contrôleurs classiques.
Bon nombre des avantages de la CPM décrits ci-dessus correspondent bien aux besoins de plus en plus importants des applications (et donc du système de contrôle). Au fur et à mesure que la complexité des applications augmente et que la CPM peut répondre à ces besoins, l'impact attendu de la CPM en tant que contrôleur s'accroît.
LES DÉFIS de la CPM
Toutefois, la mise au point d'un contrôleur CPM pose des problèmes en termes de développement, de mise en œuvre, de déploiement et de maintenance.
Problème d'optimisation
La base de la CPM est la formulation d'un problème d'optimisation. Le défi consiste à traduire un certain comportement souhaité en fonction cible et en contraintes, et à formuler le problème d'optimisation de manière à ce qu'il soit aussi facile à résoudre que possible. Envisagez d'affiner le "poids" des fonctions de coût.
Modèle du système
La CPM utilise un modèle du système et/ou les éventuelles entrées non contrôlables. Un modèle incorrect se traduira par un contrôle "optimal" incorrect, nécessitant une correction plus importante au cours du pas de temps suivant.
Par ailleurs, le modèle ne doit pas être trop complexe, car il doit pouvoir être calculé efficacement par le résolveur du problème d'optimisation. Le problème d'optimisation est résolu numériquement. Plus la tâche et le modèle sont complexes, plus il est difficile de calculer le problème d'optimisation (par exemple, variables discrètes et continues, modèles dynamiques de robots...). Il faut également ajouter que les systèmes à temps de réponse rapide nécessitent des mises à jour régulières de l'action de contrôle et que le problème d'optimisation doit être calculé en peu de temps.
État actuel
La prédiction effectuée part de la situation actuelle (sortie, état du système). Parfois, cet état ne peut pas être mesuré ou ne peut l'être que partiellement. Dans ce cas, une estimation est nécessaire, par exemple à l'aide d'estimateurs simples (par exemple, la vitesse d'un système basée sur une mesure de la position) ou d'un filtre de Kalman utilisant un modèle. Un filtre de Kalman est une méthode de calcul qui réduit les interférences (bruit) dans des série de mesures ou d'autres données.
En outre, la CPM peut être utilisée pour gérer de manière proactive des paramètres/perturbations incontrôlables (par exemple, le prix variable des matières premières, de l'énergie...). Toutefois, ceci nécessite d'estimer ces perturbations sur un certain horizon. D'autres complexités liées à la CPM sont le démarrage (qui nécessite un réglage fin des paramètres en fonction du comportement souhaité) et la mise en œuvre dans une application industrielle (commande, PLC, IPC...).
pour terminer
La complexité croissante des applications entraîne plusieurs défis pour le système de contrôle. Les contrôleurs CPM offrent un avantage considérable par rapport aux contrôleurs classiques tels que le PID dans de telles situations, bien qu'ils présentent également certains défis. Les défis découlant de l'application, tels que les contraintes complexes et les fonctions cibles, la coordination d'une multitude d'entrées et de sorties liées ou la nécessité d'anticiper certaines références ou défaillances, sont en fait ancrés dans le contrôleur.