您当前的位置:首页 > 学术报告

合作多代理系统中强化社会学习的动态规划

报告时间:2013-12-21   报告人:王倩

合作多代理系统中强化社会学习的动态规划

报告人:王倩   报告时间:2013-12-21
地点:厦门大学软件学院科研一号楼313会议室
 
一、汇报内容概要
本次报告主要是对于《The Dynamics of Reinforcement Social Learning in Cooperative Multiagent Systems》这篇paper的学习汇报。
这篇文章主要是讲合作多代理系统中社会学习框架下的强化学习算法的动态规划。文章首先对合作多代理系统中的强化学习等技术进行了概述。介绍了相关的研究现状,通过对比分析出研究社会学习的必要性。然后介绍了社会学习框架,以及这个框架下的两种不同的学习环境和学习者。通过实验分析了两种学习者在不同的合作博弈测试环境下的性能以及信息共享度对整体性能的影响。最后进行了总结了这篇文章的工作以及对以后研究工作的展望。
 
二、问题探讨和建议
1.关于IAL与JAL对应的两种公式的比较,讨论了这两个公式中的环境影响情况。
2.关于随机问题实验(部分随机爬上问题、全随机爬山问题等)的疑问。
3.提出合作多代理系统与数据挖掘的结合以及在社交网络和多人在线游戏中的应用建议。
4.关于文中所提方法的时间和空间复杂度的探讨。
5.提出在算法细节上将原随机选择改为近邻选择的改进建议。

 

厦门大学 厦门大学软件学院 厦门大学智能与科学系 厦门大学信息科学学院 厦门大学模式分析与机器智能研究中心