全球微速讯:天桥脑科学研究院团队自研的OMNE AI大模型框架登上基准测试GAIA榜首|钛媒体AGI

来源:钛媒体

天桥脑科学研究院创始人陈天桥雒芊芊夫妇(图片来源:天桥脑科学研究院官网)

天桥脑科学研究院(Tianqiao and Chrissy Chen Institute,TCCI)的 AI 团队在 AI 技术领域取得了重要进展。

近期,天桥脑科学研究院自研OMNE Multiagent大模型——是一个基于长期记忆(Long Term Memory, LTM)的多智能体协作框架,每个智能体拥有相同且独立的系统结构,能够自主学习和理解完整的世界模型,从而独立理解环境。基于LTM的多智能体协同体系,使AI系统能够实时适应个体行为变化,优化任务规划与执行,推动个性化与高效的自我进化。

根据Hugging Face 发布的 GAIA 基准测试排行榜,目前,OMNE的整体成功率为40.53%,领先于Meta、微软、Hugging Face、普林斯顿大学、香港大学、英国 AI 安全研究所、百川等知名机构提交的结果,而GPT-4仅为15%。因此,OMNE Multiagent大模型多智能体框架登上了GAIA基准测试排行榜榜首,超越了包括微软研究院在内的众多顶尖机构提交的多智能体框架。

TCCI表示,这是自去年天桥脑科学研究院创始人、前中国互联网大佬陈天桥宣布All In AI战略以来,旗下AI团队取得的一项重大成果。

GAIA 是由 Meta AI、Hugging Face 和 AutoGPT 联合推出的基准测试系统,旨在提供一个涵盖真实世界问题集的测试环境,用于全面评估 AI 助手的能力,包括推理、大模型多智能体处理、网页浏览和工具使用等核心功能,是当前最具挑战性的多代理智能评估数据集。

OMNE框架登上该榜单榜首,充分体现了AI 团队的技术深度与创新能力。本次重大突破在于,借鉴了天桥脑科学研究院多年的大脑研究积累,通过给予Agent长期记忆的能力,让模型能够进行深度慢思考,加强了LLM对复杂问题的决策能力,同时融合了长期记忆的机制,通过长期记忆大幅降低了MCTS的搜索空间,提高了在复杂问题上的决策能力。通过引入更高效的逻辑推理,OMNE不仅提升了单个智能体的智能水平,还通过优化协作机制,显著增强了多智能体系统的整体能力。这一提升机制正是受到了人类大脑皮层柱状结构研究的启发,皮质柱作为大脑认知和行为功能的基础单元,通过复杂的协作机制实现信息处理。AI模型通过强化单体智能与智能体间的协作,可能逐渐产生认知能力的涌现,构建出内部的表征模型,进而推动系统整体智能的飞跃。

天桥脑科学研究院AI团队负责人表示,“我们非常自豪地看到 OMNE 框架登上 GAIA 榜首。这表明了利用LTM进行AI自我进化以及解决现实世界问题的巨大潜力。我们相信,推进长期记忆和AI自进化的研究,对于AI技术的持续发展和实际应用至关重要。”

据悉,天桥脑科学研究院由陈天桥、雒芊芊夫妇出资10亿美元创建,是世界上最大的私人脑科学研究机构之一。研究院始终围绕全球化、跨学科和青年科学家三大重点,支持AI和脑科学研究,致力于造福人类。今年以来,天桥脑科学研究院与《Science》杂志合作推出了全球AI驱动科学大奖,并举办和支持了包括"AI+精神健康"在内的各种高水平国际会议和夏校项目,致力于培养跨学科的青年AI人才。

(本文首发于钛媒体App,作者|林志佳,编辑|胡润峰)

<!–article_adlist[

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

]article_adlist–>

特别声明:以上内容仅代表作者本人的观点或立场,不代表新浪财经头条的观点或立场。如因作品内容、版权或其他问题需要与新浪财经头条联系的,请于上述内容发布后的30天内进行。

文章来源于网络。发布者:至诚财经网,转转请注明出处:https://www.nbdtoutiao.com/2024/10/26/59013.html

Like (0)
至诚财经网的头像至诚财经网
Previous 2024 年 10 月 26 日 下午4:31
Next 2024 年 10 月 26 日 下午4:31

相关推荐

  • 全球观天下|这场论坛在普陀举行,带你了解叙事医学(叙事医学官网)

    转自:上观新闻 近日,为期两天的“叙事胜任力 赋能基层医疗机构新质生产力”–上海市基层医疗卫生机构叙事论坛在普陀区圆满闭幕,来自全市各级基层医疗卫生机构50余名学员参加本次论坛。 论坛现场 论坛设主旨演讲、专题分享、叙事报告及叙事工作坊四个板块。在主旨演讲板块,与会专家围绕《道德创伤与道德叙事》《叙事医学专家共识2023及探索实践》《基于叙事医学…

    2024 年 7 月 18 日
    00
  • AI时评|服贸会“朋友圈”再扩容(服贸会评论)

    <!–article_adlist[ 来源:​经济日报 ]article_adlist–> 9月12日至16日,2024年中国国际服务贸易交易会在北京举行。80余个国家和国际组织设展办会,400余家世界500强企业和行业龙头企业线下参展,现场举行上百场活动。大家展创新、促交流、谋合作,共谋服务贸易发展新机遇。 大“秀”创新…

    2024 年 9 月 25 日
    00
  • 近千家破净股深陷市值“泥淖”,新政能否带领它们脱离困境?

    A股首部市值管理指引来了! 2024年9月24日,证监会官网发布《上市公司监管指引第10号——市值管理(征求意见稿)》,(以下简称《指引》),向社会公开征求意见,意见反馈截止时间为10月24日。 今年以来,无论是国资委还是证监会,不止一次提到市值管理,新“国九条”也明确提出制定上市公司市值管理指引。 专业人士指出,本次《指引》要求更具体、力度更大,明确两类公…

    2024 年 9 月 26 日
    00
  • 业绩快报财务数据披露不准确 光韵达及责任人遭警示

    览富财经网消息,8月22日公开信息显示,因业绩快报财务室数据披露不准确,光韵达(300227)及董事长候若洪、财务负责人王军被深圳监管局出具警示函。 详细违规行为如下: 经查,深圳光韵达光电科技股份有限公司在2023年度业绩快报编制过程中,未充分评估新业务领域新客户的回款能力,相关收入确认不审慎;未准确计算应收账款账龄、未充分考虑客户违约情况,应收账款坏账计…

    2024 年 8 月 30 日
    00
  • 券商解读政治局会议,会议召开时间不同以往,诸多新提法、新举措首次出现,传递出稳增长、稳预期的重大决心

    金融界9月26日消息 中共中央政治局9月26日召开会议,分析研究当前经济形势,部署下一步经济工作。会议提出,我国经济的基本面及市场广阔、经济韧性强、潜力大等有利条件并未改变。同时,当前经济运行出现一些新的情况和问题。 要全面客观冷静看待当前经济形势,正视困难、坚定信心,切实增强做好经济工作的责任感和紧迫感。要抓住重点、主动作为,有效落实存量政策,加力推出增量…

    2024 年 9 月 27 日
    00

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信