学术报告
报告题目: 基于强化学习的末制导研究
报告时间: 2021年12月12日 14:00
腾讯会议ID:785 621 820
主办单位: 地下空间智能控制教育部工程研究中心
800cc全讯白菜网
报告摘要:
末制导在对空防御、空间对接及深空探测着陆等方面有着广泛应用,尤其是在对空防御中,当目标进行大机动,智能突防时,经典末制导方法往往性能下降;本工作尝试将强化学习应用到该问题中,由于该方法对防御环境假设少,同时其天然的处理不确定问题能力为设计新的制导律提供了潜在能力;通过模拟环境训练与测试,当前强化学习方法得到的制导律已经优于经典方法;同时,这一方法也为今后多智能体拦截及博弈对抗提供了统一框架,展示了良好的应用前景。
报告人简介:
刘扬,哈尔滨工业大学计算机学院副教授、博士生导师。刘扬于1999年获得哈尔滨工业大学工学学士学位;2001年获得哈尔滨工业大学工学硕士学位;2006年获得哈尔滨工业大学工学博士学位。
刘扬长期从事机器学习理论及应用研究,专注于图数据的表示学习与推理、高效强化学习及弱监督学习问题。获得2019年中国计算机专业优秀教师奖励计划和哈工大研究生教学优秀青年教师称号。主持国家自然科学基金多项、国家重点研发计划项目2项及基础加强计划1项,发表论文50余篇,部分成果在航天及互联网行业中得到应用,作为主要参加人获得教育部科学技术奖二等奖一项。
欢迎广大师生参加!