Elicitation des préférences dans un domaine de négociation multi-issues non linéaire.
Elicitation des préférences dans un domaine de négociation multi-issues non linéaire.
No Thumbnail Available
Date
2022
Authors
Miroud Aymen
Journal Title
Journal ISSN
Volume Title
Publisher
université chadli ben djedid eltarf
Abstract
La négociation est un processus par lequel toutes les parties peuvent parvenir à une
solution. Dans le cadre de ce travail, nous abordons les mécanismes de négociation
bilatérale multi issues dans un domaine non linaire à fin d’obtenir une bonne solution de
compromis.
Le but est de proposer une approche qui permet de modéliser les préférences
d’adversaire en basant sur les négociations passées.
Dans ce travail, nous développons un agent basé sur l'apprentissage par renforcement
(AR) et implémenté via l’algorithme SARSA pour prédire les intentions d'autres agents et
les actions futures possibles. Afin de maximiser le rôle de notre agent et en fonction de la
décision de sélectionner la meilleure offre parmi plusieurs offres multi-issue non linéaires
(y compris les stratégies acceptation / refus, concessions et proposition).
Nous montrons que notre agent est capable d’apprendre dans un environnement non
linéaire
multi-issue et obtient une valeur d’utilité meilleure que les autres agents disponibles dans
la plateforme de simulation des négociations automatiques appelée GENIUS
Negotiation is a process by which all parties can reach a solution. In this work, we
approach the mechanisms of bilateral multi-issue negotiations in a non-linear field in order
to obtain a good compromise solution.
The aim is to propose an approach that allows modeling of adversary preferences
based on past negotiations.
In this work, we develop an agent based on reinforcement learning (RL) and
implemented via the SARSA algorithm to predict the intentions of other agents and
possible future actions. In order to maximize the utility of our agent and depending on the
decision to select the best offer among several non-linear multi-issue offers (including
acceptance / refusal, concessions and proposal strategies).
Weshow that our agent is able to learn in a non-linear multi-issue environment and
obtains a value in use better than the other agents available in the automatic trading
simulation platform called GENIUS.
التفاوض هو عملية يمكن من خلالها لجميع الأطراف الوصول إلى حل. في هذا العمل، نتناول آليات التفاوض الثنائي متعدد القضايا في مجال غير خطي من أجل الحصول على حل وسط جيد.
الهدف هو اقتراح نهج يسمح بنمذجة تفضيلات الطرف المعارض بناءً على المفاوضات السابقة.
في هذا العمل، نطور وكيلاً قائمًا على التعلم المعزز (RL) ويتم تنفيذه عبر خوارزمية SARSA للتنبؤ بنوايا الوكلاء الآخرين والإجراءات المستقبلية المحتملة. من أجل تعظيم فائدة وكيلنا وبالاعتماد على القرار لاختيار أفضل عرض من بين عدة عروض متعددة القضايا غير خطية (بما في ذلك القبول / الرفض، والتنازلات واستراتيجيات المقترح).
نُظهر أن وكيلنا قادر على التعلم في بيئة متعددة القضايا غير خطية ويحقق قيمة استخدام أفضل من الوكلاء الآخرين المتاحين على منصة المحاكاة التجارية التلقائية المسماة GENIUS.