Optimisation contrainte d'une politique d'équilibrage de charge
Abstract
International audience ; L'équilibrage de charge consisteà répartir le trafic entre une paire de noeuds sur plusieurs chemins afin d'améliorer les performances du réseau. Idéalement, la politique d'équilibrage devrait s'adapter en fonction du trafic et anticiper son impact sur le réseau mais l'intégration de modèles pour la Qualité de Service est un défi. Nous proposons une solution basée sur l'apprentissage par renforcement profond, qui est capable d'apprendre la relation entre le trafic et la QoS, tout en offrant la sécurité nécessaire pour maximiser le débit etéviter de violer les contraintes de capacité des liaisons. Elle intègre un algorithme d'optimisation de politiques sous contraintes. Dans un scénario SD-WAN où les délais suivent le modèle de mise en file d'attente M/M/1, nous démontrons,à l'aide d'un programme non linéaire en nombres entiers, que notre solution peut atteindre un délai de bout en bout proche de l'optimum. Nous montronségalement que notre solution apprend automatiquement les paramètres de récompense pour répondre aux contraintes de capacité. Mots-clefs : Equilibrage de charge, apprentissage par renforcement, SD-WAN.
Themen
Sprachen
Französisch
Verlag
HAL CCSD
Problem melden