人人妻人人澡人人爽欧美一区九九,男人激烈吮乳吃奶动图,吃瓜爆料黑料网站,80岁的老太婆松弛怎么办

籃球 足球 綜合
當(dāng)前位置:首頁 > 體育 > 電競

AI玩《超級馬力歐兄弟》:Claude模型操作最溜,推理模型表現(xiàn)不佳

時(shí)間:2025-03-04 16:24:24 來源:24直播網(wǎng)
加利福尼亞大學(xué)圣地亞哥分校的 Hao 人工智能實(shí)驗(yàn)室(Hao AI Lab)上周五開展了一項(xiàng)獨(dú)特的研究,將人工智能(AI)引入經(jīng)典游戲《超級馬力歐兄弟》中,以測試其性能表現(xiàn)。研究結(jié)果顯示,在參與測試的 AI 模型中,Anthropic 的 Claude 3.7 表現(xiàn)最為出色,緊隨其后的是 Claude 3.5。相比之下,谷歌的 Gemini 1.5 Pro 和 OpenAI 的 GPT-4o 則表現(xiàn)不佳。

需要明確的是,此次實(shí)驗(yàn)所使用的并非 1985 年最初發(fā)布的《超級馬力歐兄弟》版本。游戲運(yùn)行在一個(gè)模擬器中,并通過一個(gè)名為 GamingAgent 的框架與 AI 進(jìn)行連接,從而讓 AI 能夠控制馬力歐。GamingAgent 由 Hao 人工智能實(shí)驗(yàn)室自主研發(fā),其向 AI 提供基本指令,例如“如果附近有障礙物或敵人,向左移動或跳躍以躲避”,同時(shí)還提供游戲內(nèi)的截圖。隨后,AI 通過生成 Python 代碼的形式來操控馬力歐。

據(jù)實(shí)驗(yàn)室介紹,該游戲環(huán)境迫使每個(gè) AI 模型“學(xué)習(xí)”如何規(guī)劃復(fù)雜的操作并制定游戲策略。有趣的是,實(shí)驗(yàn)發(fā)現(xiàn)像 OpenAI 的 o1 這樣的推理模型(它們通過逐步思考問題來得出解決方案)表現(xiàn)不如“非推理”模型,盡管它們在大多數(shù)基準(zhǔn)測試中通常表現(xiàn)更強(qiáng)。研究人員指出,推理模型在實(shí)時(shí)游戲中表現(xiàn)不佳的主要原因之一是它們通常需要花費(fèi)數(shù)秒時(shí)間來決定行動。而在《超級馬力歐兄弟》中,時(shí)機(jī)至關(guān)重要,一秒鐘的差別可能意味著安全跳過和墜落死亡的不同結(jié)果。

數(shù)十年來,游戲一直是衡量 AI 性能的重要工具。然而,一些專家對將 AI 在游戲中的表現(xiàn)與技術(shù)進(jìn)步直接掛鉤的做法提出了質(zhì)疑。與現(xiàn)實(shí)世界相比,游戲往往是抽象且相對簡單的,并且能夠?yàn)?AI 訓(xùn)練提供理論上無限的數(shù)據(jù)。

IT之家注意到,最近一些引人注目的游戲基準(zhǔn)測試結(jié)果引發(fā)了 OpenAI 研究科學(xué)家、創(chuàng)始成員安德烈?卡帕西(Andrej Karpathy)所說的“評估危機(jī)”。他在 X 平臺上發(fā)表的一篇帖子中寫道:“我目前真的不知道該關(guān)注哪些 AI 指標(biāo)。”他總結(jié)道:“我的反應(yīng)是,我目前真的不知道這些模型到底有多好。”

熱門數(shù)據(jù)

更多

相關(guān)信息

相關(guān)集錦

熱門TAG

本站所有直播信號均由用戶收集或從搜索引擎搜索整理獲得,所有內(nèi)容均來自互聯(lián)網(wǎng),我們自身不提供任何直播信號和視頻內(nèi)容,如有侵犯您的權(quán)益請通知我們,我們會第一時(shí)間處理。

Copyright ? 2021-2024 24直播網(wǎng). All Rights Reserved. 粵ICP備18084515號-4

主站蜘蛛池模板: 石景山区| 县级市| 永登县| 云龙县| 达日县| 太仓市| 松阳县| 汝南县| 云南省| 广安市| 博白县| 扎鲁特旗| 孝昌县| 开鲁县| 宁海县| 灵川县| 西畴县| 巴楚县| 通辽市| 米泉市| 航空| 城步| 隆化县| 寿阳县| 沁水县| 张北县| 榆社县| 宾川县| 奉新县| 清流县| 汪清县| 五常市| 景洪市| 利津县| 海盐县| 满洲里市| 基隆市| 靖州| 邵阳县| 潜山县| 土默特左旗|