窗体顶端
A new performance criterion for zero-sumstochastic games--郭先平教授
中山大学数学学院郭先平教授莅临我院指导
2017年11月21日下午,应771771威尼斯.cm大全岭南统计科学研究中心的邀请,中山大学数学学院郭先平教授在文清楼518作了题为“A new performance criterion for zero-sum stochastic games”的讲座,旨在进一步提高年轻学者及研究生对研究的理解。此次讲座由李元教授主持,相关专业的师生参加了此次讲座。
郭先平教授从事马氏过程和随机最优化的研究. 曾应邀到美国WayneState大学,英国Liverpool大学,澳大利亚Queensland大学,澳大利亚South Australia 大学,墨西哥CINVESTAV, 香港科技大学,香港中文大学等进行多年合作与研究.在马氏决策过程(英文缩写为MDP)和随机对策(又称博弈)的研究中取得若干创新性成果和重要进展. 他的主要成果以学术论文形式发表在Ann. Appl. Probab., IEEE Trans. Autom.Control, SIAM J. Optim., SIAMJ. Control Optim., Math. Oper. Res.,Adv. in Appl. Probab., J. Appl. Probab., J.Optim. Theory Appl., J.Theory Probab., IFAC Automat., European J. Oper. Res.,Systems Control Lett., Bernoulli,《中国科学》,《科学通报》等上多种国际杂志上,并在国际顶级出版社Springer 出版第一本关于连续时间MDP的英文专著. 难得的是,他的科研成果还得到国际同行学者发表在 SIAM J. Control Optim., Automatica J.IFAC, Math. Meth. Oper. Res.,J. Math. Anal. Appl.,TOP, Math. Reviews,和ZentralblattMATH等国际杂志上的高度肯定和公开评价.
在这个讲座中,我们关注的是离散时间的二人零和随机博弈,并将引入一个新的标准。更准确地说,我们考虑了回报超过一水平的概率,这意味玩家1的安全概率和玩家2的风险概率。游戏模型的原始数据在适当条件下,我们不仅建立了游戏的价值和一对优化策略,同时也提供了一种计算游戏价值的递归方式和最优策略。最后,我们将主要结果应用于库存系统。
摘要: In this talk, we concern with two-person zero-sum stochastic games in discrete-time, and will introduce a new performance criterion. More precisely, we consider the probability that the payoff exceeds a level, which means a security probability for player 1 and risk probability for player 2. Under a suitable condition on the primitive data of the game model, we not only establish the existence of the game’s value and a pair of optimal policies, but also provide a recursive way of computing the value of the game and optimal policies. Finally, we applied our main results to an inventory system.