精国产品一区二区三区,精毛在线一区二区三区,午夜毛片小福利

數字經濟創新門戶網站

下載APP

掃一掃

下載數字化報APP

在線投稿

網站首頁

數智化

資訊

科技

能源

工業

貿易

保險

公益

行業洞察

旅游

酒店

消費

生活方式

家居

母嬰

零售

體育

教育

農業

汽車

地產

健康醫療

航空

文娛

游戲

藝術

智慧經營

食品·餐飲

支付

電商

企業

經營

人物

品牌

科技金融

經濟

財經

人工智能

區塊鏈

在線投稿

掃一掃

下載數字化報APP

首頁人工智能正文

兩大AI模型性能提升登上國際榜單

數字化報 2025-01-16 4.44w

科技日報訊(作者李禾)近日，由盛大AI團隊研發的模型Watt-tool-70B和Newsbang/homer-72B，登上國際知名AI排行榜榜首。其中，Watt-tool-70B是由盛大旗下Watt團隊研發的旗艦模型，目前位列BFCL Leaderboard總榜單第一。

據悉，榜單BFCL Leaderboard是由加州大學伯克利分校開發的評估LLM工具調用能力基準測試平臺。作為目前大語言模型(LLM)最熱門的研究方向之一，工具調用(Function-Calling)是為了讓LLM理解，并能準確使用API(應用程序編程接口)，來執行更復雜而具體的任務。在近期公布的最新一輪評估結果中，Watt的“多輪對話執行能力”相較于排名第二的GPT-4o 領先11分，比排名第十的Gemini-1.5-Pro 領先近40分。

“這個模型將加速大模型落地‘融合’過程?！盬att有關負責人說，還有助于從底層數據標注到人機交互的體系化建設，讓大模型初步實現從“光說不練”到“能文能武”。

此外，由盛大集團NewsBang團隊開發的Newsbang/homer-72B 模型位列Open LLM LeaderBoard v2榜單第一。Open LLM Leaderboard V2是由Hugging Face維護的開源語言模型評測平臺升級版本，采用更全面和嚴格評估標準，對各類開源大語言模型進行多維度測試和排名。Newsbang/homer-72B重視提升模型在推理和思考方面的能力，通過搭配數據篩選機制等，在多個核心評測維度，該模型性能有了大幅提升。

據公開報道，2023年初，盛大集團宣布All in AI戰略，去年10月，聯合多家高校發表了AI與長期記憶方面的論文，其自研的OMNE大模型多智能體框架登上GAIA 基準測試排行榜榜首;其旗下的天橋腦科學研究院(TCCI)與國際學術雜志《Science》合作推出全球AI驅動科學大獎，舉辦和支持包括“AI+精神健康”在內的各種高水平國際會議和夏校項目，助力培養跨學科青年AI人才等。

——【編輯：程詩亞】

THE END

未經數字化報網授權，嚴禁轉載或鏡像，違者必究。

特別提醒：如內容、圖片、視頻出現侵權問題，請發送郵箱：[email protected]。

風險提示：數字化報網呈現的所有信息僅作為學習分享，不構成投資建議，一切投資操作信息不能作為投資依據。本網站所報道的文章資料、圖片、數據等信息來源于互聯網，僅供參考使用，相關侵權責任由信息來源第三方承擔。

本文地址: http://www.xzhrc.cn/news/68951.shtml

2025-08-06

中關村人才協會海峽兩岸Ai工委會大健康項目孵化平臺落地海易特

2025-08-01

固生堂領跑中醫AI技術，10大國醫分身賦能線上診療

2025-07-30

AI-CAD項目獲人工智能創新創業大賽一等獎，引領國產工業設計軟件新紀元