人工智能大模型下围棋已不是新鲜事,玩电脑游戏水平如何?不久前,淘天集团未来生活实验室算法工程师,尝试利用多模态大模型体验国产电脑游戏《黑神话:悟空》,探索大模型在特定场景中的能力边界,取得令人惊喜的效果。相关研究成果已上线论文预印本网站arXiv。
《黑神话:悟空》是典型的动作角色扮演类游戏。在当前大模型研究领域,有不少研究者选择将该类游戏作为研究平台,采用纯视觉输入、复杂动作输出的模式,测试大模型在特定场景下的性能表现。其中,纯视觉输入是指模型仅通过理解和分析游戏截图进行决策,而复杂动作输出则需要模型生成并执行复杂而连续的动作,如战斗场景中的精确操作。
想要让多模态大模型控制游戏角色,要克服两大困难。一是直接视觉输入的挑战。由于大模型所需的环境数据不一定能通过游戏API获取,因此对于那些需要深入理解游戏界面的大型游戏而言,学习从视觉输入中进行推理是一种更直接的策略,这给大模型带来不小挑战。二是面向动作任务的困难。在动作类游戏中,基于强化学习的框架仍然占主导地位,但在特定任务上需要大量训练时间,迁移到其他任务上泛化能力较差,表现往往不佳。
技术团队定义了10个基本任务和2个挑战任务,其中75%的任务发生在战斗场景中。对于战斗任务,如果玩家角色击败了敌人,则任务成功;如果玩家角色被敌人击败,则任务失败。研究结果显示,该框架在基本任务和简单到中等难度的战斗中,胜率高达90%,但在面对高难度任务时,表现相对较差。总体来看,其整体水平仍不如高水平人类玩家,但研究成果可为设计应对更广泛挑战、更复杂的智能体提供参考。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
上一篇:2024北京攀岩公开赛助推新兴体育项目发展...
下一篇:返回列表
秋季来临,适宜的气候容易让人忽略皮肤的日常护理,不少人出现皮肤干燥、脱屑等问...
2024-10-21 04:17:19
记者从2日召开的2024年国家网络安全宣传周新闻发布会上获悉,2024年国家...
2024-10-21 04:00:30
10月18日,半导体板块再次狂飙。截至记者发稿,Wind半导体指数涨幅达到1...
2024-10-21 03:48:58
近日,汉西污水处理厂三期扩建项目正如火如荼地进行中,预计将在下月上旬完成关键...
2024-10-21 02:49:33
近日,华为全联接大会2024期间,在以“全面光进铜退,共赢园区智能化”为主题...
2024-10-21 02:30:14
为期三天的2024金融街论坛年会20日落下帷幕。本届论坛年会以“信任和信心—...
2024-10-21 00:46:04
“大模型的核心意义是做更好的信息处理,大部分的信息体现在多模态的内容里面,而...
2024-10-20 23:08:11
无人机获取田块激光雷达数据。受访单位供图 天空地立体监测系统界面。受访单位...
2024-10-20 23:06:36
近日,中国科学院上海微系统与信息技术研究所研究员陶虎团队与上海交通大学医学院...
2024-10-20 22:56:45
热水器已经成为现代居家生活中不可或缺的日常家电,在几种热水器类型中,即热式热...
2024-10-20 22:55:16