过去在电子竞技项目中与人类争锋的AI选手其实通常会使用相当于作弊的方式。
曾在即时战略游戏《星际争霸》中战胜人类的AI可以直接以内部调用的方式操作单位,实现真正的多线操作,这对于使用鼠标键盘实现输入的人类选手来说,是不可能做到的。而在moba对战类游戏里,如DOTA,AI可以读取对方的操作指令集,能实现对人类来说极其不可思议的躲避瞬时法术的惊人操作。(AI能用隐刀躲掉红杖……)
这些看似有利的情况其实削弱了AI的存在价值,毕竟,人们制造出人工智能是希望它们能以正面的方式超越人类,突破思想上的极限。
OpenAI ——Elon Musk和Sam Altman 合作创立的非商业AI研究组织——向世人宣布,他们研发的算法,在公平环境下,战胜了五位DOTA2高分段人类玩家,平均天梯分数超过4200分。
秋天,Dota 2世界冠军赛The International就将拉开战幕,OpenAI将派出5个运行不同算法的AI组成战队报名参赛。 通过和顶级选手同场较量,实地检验AI的性能。
AI参加并赢得了去年大赛中的1v1solo游戏环节,职业选手说,看比赛回放,他们发现机器人有值得他们借鉴之处。但是,作为一个团队来进行游戏引入了不同类型的复杂性, OpenAI必须教会AI机器人进行协作。
在任何时候,英雄(或角色)可以从1000个动作中选择出一个来执行;机器人必须做出有效的判断,同时处理大约20000个值,这些数值代表特定时间游戏时刻正在发生的事情。国际象棋中可能采取的行动的平均数量为35,因此它比在90年代击败国际象棋特级大师加里·卡斯帕罗夫的超级电脑深蓝还要来得稍微复杂点。
OpenAI使用强化学习算法。这基本上是一种试错法,随着时间的推移,人工智能从完全随机的行为发展出有方向性的游戏风格。 OpenAI在超过100000个CPU上运行Dota 2,并且AI每天的训练量大概相当于人类180年的游戏时间,给AI提供充足的学习机会。此处链接为此前AI学习dota的画面。
处理河道刷出的神符对AI来说是一个挑战,因为它们可以改变游戏的走向。由于不允许作弊,AI的视野也被限制在一屏上的内容,人工智能需要推断对手正在做的事情,并根据推断做出后续决定。所以,在前面提到的团队测试中,人类玩家不能购买水瓶和真假眼一类的物品,以及双方可选的对战阵容也相对狭窄——以免游戏走向对程序来说过于复杂的局面。
但我们有理由相信这仅仅是个开始。
机器人具有先天优势,例如80ms的反应时间,这比人类更快。他们每分钟执行150-170次动作,这与顶级人类选手相当。而随着游戏时间累积,程序开发出的战术思想与人类玩家越来越接近,比如打野、pick游戏中特定的核心战略角色,合理分路,Gank 和支援队友等。
当然,OpenAI的目标不是打造一支无与伦比的Dota 2战队,在把1500万美元的大赛奖金带回家,而是尝试训练AI解决各种复杂的问题。与此同时,在保留部分限制的条件下,吊打Dota人类冠军团队也足以令OpenAI的科学家感到心满意足。
本文译自engadget,由译者 majer 基于创作共用协议(BY-NC)发布。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )