LSTM Path-Maker : une stratégie à base de réseau de neurones LSTM pour la patrouille multiagent
Revue Ouverte d'Intelligence Artificielle, Post-actes de la Conférence Nationale en Intelligence Artificielle (CNIA 2018-2020), Volume 3 (2022) no. 3-4, pp. 345-372.

Depuis plus d’une décennie, la tâche de la patrouille multiagent a attiré l’attention de la communauté multiagent de manière croissante, notamment en raison de son grand nombre d’applications potentielles. Cependant, les algorithmes à base de méthodes d’apprentissage profond pour traiter cette tâche ont jusqu’à présent peu été développés. Dans cet article nous proposons d’intégrer un réseau de neurones récurrent (RNN) à une stratégie de patrouille multiagent en introduisant un modèle formel de stratégie multiagent basée sur l’architecture de RNN LSTM que nous avons nommé LSTM-Path-Maker. Le réseau LSTM est entraîné sur des traces de simulation d’une stratégie coordonnée et centralisée, puis embarqué dans chaque agent en vue de patrouiller une zone le plus efficacement possible sans communication. Enfin, cette nouvelle stratégie basée sur l’architecture LSTM est évaluée en simulation et comparée à deux stratégies représentatives de référence : d’une part une stratégie coordonnée et d’autre part une stratégie réactive. Les résultats indiquent que la stratégie proposée, comparable à une stratégie réactive car non coordonnée, est meilleure que la stratégie réactive.

For over a decade, the multiagent patrol task has received a growing attention from the multiagent community due to its wide range of potential applications. However, the existing patrolling-specific algorithms based on deep learning algorithms are still in preliminary stages. In this paper, we propose to integrate a recurrent neural network as part of a multiagent patrolling strategy. Hence we proposed a formal model of an LSTM-based agent strategy named LSTM Path Maker. The LSTM network is trained over simulation traces of a coordinated strategy, then embedded on each agent of the new strategy to patrol efficiently without communicating. Finally this new LSTM-based strategy is evaluated in simulation and compared with two representative strategies : a coordinated one and a reactive one. Results indicate that the proposed strategy is better than the reactive one.

Mots-clés : Systèmes multiagents, Réseaux de neurones artificiels, Réseaux récurrents à mémoire court et long terme.
Keywords: Multiagent Systems (MAS), Artificial Neural Networks (ANN), Long Short-Term Memory (LSTM).

Mehdi William Othmani-Guibourg 1 ; Amal El Fallah Seghrouchni 2 ; Jean-Loup Farges 3

1 ONERA Dept. traitement de l’information et systèmes 2 avenue Edouard Belin 31400 Toulouse, France
2 Ai movement - Université Mohammed 6 Polytechnique et LIP6 Sorbonne Université 75005 Paris, France
3 ONERA Dept. traitement de l’information et systèmes 2 avenue Edouard Belin 31400 Toulouse, (France)
