淳化| 濮阳| 江宁| 海丰| 博罗| 灵石| 清涧| 连山| 仁怀| 襄樊| 高阳| 科尔沁右翼中旗| 府谷| 龙凤| 北川| 晋州| 江川| 凤凰| 芜湖市| 桦甸| 惠水| 汉南| 兖州| 鄂伦春自治旗| 锡林浩特| 海盐| 大关| 昌吉| 石河子| 清徐| 博乐| 合水| 萝北| 黑龙江| 溧水| 文安| 高唐| 昂仁| 林口| 肇源| 镶黄旗| 康县| 鹿泉| 台儿庄| 龙岩| 曲松| 孟村| 水城| 荔波| 曲江| 花都| 云浮| 环县| 五指山| 绛县| 珠穆朗玛峰| 江口| 金堂| 泽库| 南沙岛| 惠民| 双柏| 桑植| 印台| 商洛| 信宜| 滑县| 碾子山| 汉沽| 吕梁| 会泽| 烈山| 陈巴尔虎旗| 本溪满族自治县| 达日| 景洪| 翁源| 上思| 泗县| 琼结| 南海| 鄂伦春自治旗| 四川| 民乐| 墨玉| 罗城| 苍南| 额尔古纳| 西盟| 永善| 东安| 山海关| 牟定| 黔江| 山阴| 新和| 新乐| 乌兰浩特| 鹿邑| 边坝| 景宁| 乐平| 建湖| 鹰潭| 夏邑| 富顺| 大荔| 沅江| 清河| 余江| 镇坪| 乌兰浩特| 尚志| 南充| 久治| 广饶| 永昌| 册亨| 江宁| 微山| 乌鲁木齐| 雅安| 天祝| 寻甸| 和布克塞尔| 长白山| 延津| 辛集| 兴县| 正定| 大洼| 吴起| 雷波| 王益| 理塘| 青龙| 樟树| 藤县| 凤翔| 龙湾| 石门| 平山| 江宁| 安化| 临朐| 长治县| 尉犁| 蓝山| 郓城| 新化| 城阳| 海沧| 尼玛| 大悟| 高平| 科尔沁左翼后旗| 景东| 涪陵| 宝丰| 宁蒗| 兴安| 沙坪坝| 建宁| 海沧| 兰州| 紫金| 九江市| 青阳| 庆安| 下花园| 岱岳| 鹿邑| 美姑| 石家庄| 海沧| 盂县| 衡阳县| 陆河| 武宣| 开远| 定州| 金塔| 衡阳县| 鄱阳| 马祖| 万载| 理县| 浑源| 东营| 巴林左旗| 长丰| 崂山| 宜君| 突泉| 宝兴| 通州| 深泽| 巴中| 斗门| 永清| 浦东新区| 眉山| 独山| 三都| 方城| 台东| 离石| 泉州| 怀仁| 尚志| 武宣| 江都| 柘荣| 锦屏| 镇沅| 象州| 铅山| 张家川| 穆棱| 隰县| 昌宁| 呼兰| 灌南| 曲周| 长治县| 固原| 靖安| 福山| 青海| 靖安| 安吉| 宁陕| 桂阳| 淮南| 竹山| 宁明| 阳朔| 天峻| 东乡| 浠水| 昌宁| 应城| 花溪| 陇西| 茂港| 青冈| 永靖| 成都| 井冈山| 三江| 汪清| 北流| 封开| 盈江| 满洲里| 修水| 阿拉尔| 慈溪| 友谊| 同心| 富县| 仁寿| 德安| 山丹| 百度

让AI玩转斗地主 快手实践课题获Deecamp2019最佳团队奖

滚动
2019
08/20
22:50
分享
评论
百度 (李勇)(责编:李淼(实习)、张雨)

DeeCamp2019人工智能训练营在北京中国科学院大学雁栖湖校区举办全国成果展示暨结营仪式。快手发起的实践课题“挑战快手小游戏AI”、“端上AI助你走进名画”分别获得DeeCamp2019最佳团队奖、最佳技术奖。

DeeCamp人工智能训练营由教育部、创新工场、北京大学联合主办,今年有超过1万人次报名,最终600名学生入选。4周的时间内,学员接受了顶级 AI 大牛导师的「学术+产业」课程培训,共计完成了 50 个 AI 实践课题。

“挑战快手小游戏AI”获最佳团队奖

4周时间,学员们完成了由 22 家企业发起的 50 个 AI 相关课题,接受了总计 115 位来自企业的技术负责人和工程师的课题辅导。实践课题全部基于真实世界场景精心设计,力求贴近产业一线需求、提高学生动手能力。其中4个课题为快手发起,包括挑战快手小游戏AI、端上AI助你走进名画、多模态AI音乐生成、质量感知的媒体传输优化。结营仪式当天,“挑战快手小游戏AI”获得最佳团队奖,“端上AI助你走进名画”获得最佳技术奖。

斗地主要解决的是不完美信息下博弈问题,是要在无法看见其他玩家手牌的前提下,对游戏中的14种合法牌型、13551种合法出牌、10的30次方的状态空间和10的85次方的游戏树进行全面考虑,整体难度较高。从技术角度看,该项目将游戏领域内的领先核心算法应用到斗地主中;其次,结合RankSVM思路,设计了新的斗地主监督学习模型;小组还设计了多个强化学习模型,使用强化学习进行多模型融合。

项目团队没有一味追求胜率,通过调试做到一个和人类玩家相似的胜率结果,更加拟人化。当人类与人类对战时,人类作为地主的胜率为52.4%、作为农民的胜率为47.8%;而该项目小组研发的AI在与人类进行对战时,AI作为地主的胜率为58.6%、作为农民的胜率为41%。

快手导师:学员们的探索性方法带来惊喜

手游戏联合实验室提供了此次“挑战快手小游戏AI”的课题,并指导学员完成此次实践课题。该课题给学员提供了一个设计游戏AI从0到1的完整历程,学员能体验到跟自己设计的AI共同成长的默契。快手游戏联合实验室,致力于利用人工智能技术全面赋能游戏,使用户获得更佳的游戏体验,同时进行前沿的人工智能技术研究及应用。

“不完美信息博弈是非常有挑战的AI难题,学员们产出的探索性结果和方法也给我们带来了惊喜,我们会加大投入探索不完美信息博弈的游戏”。 快手游戏联合实验室刘霁介绍说,不完美信息博弈是非常挑战的AI难题,斗地主AI的难题在于它是一个3人游戏;两人组队合作跟另外一个人博弈,如何组队,以及队内信息又是不共享的,这使得斗地主的博弈问题更加复杂;既需要算法的精巧设计,又需要高效得利用算力。

快手导师迅速帮助学员们抓住课题重点,从叫牌阶段策略,出牌过程策略,预测对方牌型等侧重点进行指导。利用游戏AI的经验,初步提供了不同的AI模型在游戏中的基本能力和实现效果,强调了非全信息下的博弈难度,便于学员们进行理解和选择,学员在2天的时间内快速确定了最终的开发框架。

因为斗地主是不完美信息博弈没有成功的经验可以借鉴,快手导师指导团队制定一个套多模型融合的策略,把基于规则的AI,基于强化学习的AI,基于蒙特卡洛搜索的AI(Alphago的思路),基于CFR的AI(德州扑克的思路),以及基于模仿学习的AI通过一个整体的强化学习AI融合一起。时间紧任务又有挑战的情况下,快手导师提供了对每一种AI设计方案方向性的指导并且参与细节的讨论,最终学员圆满完成课题。

快手游戏联合实验室于明泽介绍说,这次的课题在学术上存在挑战,有助于推动产学研结合。快手游戏联合实验室提供了丰富的AI应用场景,比如验证游戏核心玩法、文字音频图形的AI处理、数据分析、个性化决策、自动推荐等。游戏环境是全数字环境,便于训练数据的采集,利于技术的落地。此外,游戏本身是强商业化的方向,更容易创造出兼具学术意义和商业价值的产品。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3
斜桥巷 万岁街 大狮子胡同 塔斯托别乡 东五路 南营镇 杨家镇 甘霖镇 前姚村村委会
浙江嘉善县惠民镇 电子城小区 芹泉镇 铜陵县 黄山铺镇 西场村 豆各庄村 南豆芽胡同 许家大门
东兵马营 鲁山道松涛里 西兴盛胡同 祠山岗茶场 栗家庄乡 西门村 楚雄州 兰家院子 魏家院子 北二村