摘要:不仅如此,与其竞争的选手都是世界级选手等等。因此,致远研究院在6月推出了致远学者计划。同时,致远研究院非常重视重大科研任务沿途产卵。截至目前,已申请中国专利,获得发明专利授权,注册软件著作权。
雷锦来自宇宙中心的报道| qbi tai某AI研究院的“打开方式”,微信官方账号是这样的;
国际峰会发表了1470多篇文章。
8个月打造全球最大超大规模智能模型“启迪”
图灵奖获得者每年都会来参加大会。
世界级AI科学家94人,人才团队近260人。
……
也许你会说,这才是一个研究所应该有的样子。
但是如果我说只成立了三年呢?
而且在搭建大模型方面,它是世界上唯一一个没有大工厂做后盾的民办非企业组织。
不仅如此,与之竞争的还有“世界级选手”——deep mind、OpenAI等等。
即使是在这个专家众多的大模型赛道上,这个研究所也设法碾压其实力,引起了国内外科研界和媒体的关注。
甚至吴恩达也对此评论道:
启蒙的发布改变了科研模式。
至此,围绕这个年轻却“成功”的研究所,产生了许多疑问:
是谁呀?
你是怎么做到的?
一个刚刚成立三年的研究机构,叫做北京致远人工智能研究院(以下简称致远研究院)。
也许现在已经很出名了,但是说实话,如果是三年前命名的话,很多人都不知道。
致远研究院的成立其实是从2018年的一次会议开始的。
当时由微软亚太R&D集团前首席技术官张宏江博士、国家自然科学基金委原主任杨伟院士、清华大学药学院白潞教授牵头组织了会议。
而且,可以说是“一声呐喊”。这时候,北京艾圈的“显赫”人物来了:
孙茂松、陈、、、周伯文、马、等。都是当时乃至现在AI圈的“名人”。
与会的专家可以说是横跨行业、高校、研究机构。
当这些人聚在一起时,要讨论的一个问题是:
如何在人工智能基础设施建设、科研组织模式、数据开放、场景开放、人才培养、国际合作等方面推动北京人工智能创新发展。
经过几个小时的激烈讨论,他们达成了以下六点建议:
“北京致远”等人工智能软硬件计算平台建设
建立基于产学研联合创新的人工智能基础研究模式。
积极推进政府数据和企业数据开放共享
开放人工智能应用场景,增加基础保障。
加大人员培训,出台和完善保障措施。
加强国际交流。
要实现上述目标,需要一个“载体”来统筹规划。
因此,他们一致决定在北京成立人工智能领域的新研发机构——北京致远人工智能研究院。
然而,就像普通的创业公司一样,致远研究院在成立之初可以说是举步维艰:一个办公室,几个人,开始了人工智能的新征程。
但致远研究院成立之初,虽然艰难,但还是立下了这样的旗帜:
十年内成为世界前三的著名人工智能研究机构,取得三项以上具有重大国际影响或重大产业价值的科研成果。
支持北京在2028年成为全球领先的人工智能创新中心,国际人工智能城市综合创新排名全球前三。
为此,一张名为“顶天”“立地”的科研布局图诞生了。
从布局上不难看出,主要分为“学术自由探索”和“目标导向的重大科研任务”两大方向。
结合科研布局这个名字可以推断,不仅要做最前沿技术的研究,还要让研究真正有用。
要实现这些目标,人才成为首要解决的问题。
为此,致远研究院于2019年4月启动了“致远学者计划”。
三年来,94名致远学者入选,其中38岁以下青年科学家40名。
涉及的主要研究方向包括人工智能的数学基础、人工智能的认知神经基础、机器学习、自然语言处理、智能信息检索与挖掘、智能系统架构与芯片等。
“智库”成立后,致远研究院锁定了人工智能的三条可行路径——“信息、生命、物理”,前后研发了超大规模模型。
比如,在信息方面,致远研究院发布了一系列大规模的预训模式——以启蒙为核心的“启蒙2.0”,这是国内首个、全球最大的超大规模预训模式。
启蒙模型的参数规模达到了1.75万亿,是GPT-3的10倍,打破了此前谷歌Switch Transformer预训练模型创造的1.6万亿的参数记录。
同时也是首个在100%国产超算上训练的万亿模型。“启迪2.0”系列机型在国际公认的基准中取得了9项精确记录,达到世界先进智能水平。
不仅在参数上,在模型架构上,致远研究院提出的GLM2.0首次打破了BERT和GPT的壁垒,用单一模型同时实现自然语言理解和生成的任务。
在生命方面,致远研究院发布的“自然表现”生命智能模型,可以说推动了信息科学从计算范式到仿脑范式的飞跃。
截至目前,田燕已经构建了第一个基于精细神经元的深度学习系统,比传统的深度学习系统更接近真实的大脑。
它还发布了一个超大规模的小鼠纹状体重建模型,该模型具有真实的形态特征,拥有数百万个精细神经元(11.968亿个突触),是欧盟大脑计划已公布模型的6倍。
而且运行精细神经元模型的效率比主流神经元平台(欧盟脑计划开发的高精度脑仿真软件)提高了两个数量级。
除了重大科研任务外,致远研究院在学术探索方面也取得了令人瞩目的成就。
三年来,自由探索与目标导向相结合的体制机制显示出强大的生命力,实现了科研成果的数量与质量并重。致远研究院在国际AI峰会期刊上发表或支持发表论文1470余篇,其中约1060篇论文被AAAI、CVPR、ACL、ICLR、NIPS、SIGIR、TPAMI等国际顶级会议期刊收录,占比超过70%,形成多项国际第一和重大成果。
同时,致远研究院非常重视重大科研任务的“沿途产卵”。截至2021年10月,已申请国内专利78项,获得发明专利44项,注册软件著作权24项。
学术生态是致远研究院“关注”的另一个重要方向。
通过建设致远社区、清远会等线上线下社区组织,每年举办一次北京致远大会,邀请全球人工智能领域的顶尖专家,共同探讨人工智能的前沿研究进展和产业发展热点。
甚至很多图灵奖获得者都会来这里探讨人工智能发展的前沿方向。
……
以上只是致远研究院成果的一瞥,更多相关内容可在此查看。
但是在三年的时间线上,它的效率和质量真的很惊人。
那么下一个问题是:
为什么「智力源模型」能有这样的速度?在致远研究院之前,国内同时或更早成立了很多类似的研究机构。
但回过头来看这个时间节点,他们可以说是“雷声大雨点小”,在人群的视线中更加模糊。
在我的印象中,致远研究院似乎从成立之初,每年都会发布令业界瞩目的科研成果,规模也在朝着越来越大的趋势发展。
那么致远研究院和其他科研机构有什么区别呢?为什么可以这么「快速准确」?
就在刚刚,它在“宇宙中心”五道口致远楼新址举办了三岁“生日会”。
在这个活动中,很多相关的谜团都得到了解释。
还是以启蒙模式为例,它的速度可以说是非常快的:
从立项到发布只用了八个月。
接下来的两次更新迭代也各花了3个月。
这种智力来源的速度背后的一个非常重要的因素是所有人的智慧。
换句话说,就是通过致远的“号召力”,汇聚了产学研各界的力量。
短时间内,致远“聚集”了10个不同机构的近120人,聚集资金、数据和计算能力。
而且目标非常清晰明确,就是专心做大事——把这个大模型搞出来。
这种智慧的背后,是致远研究院的独特模式——致远模式:
自由探索和目标导向。
自由探索意味着致远研究院可以给科学家最大的权利来决定技术路线和资金的使用。
换句话说,只要你在致远从事项目,就要大胆稳妥,其他任何顾虑都由致远承担。
刚才说的“专心做大事”就是目标导向的核心意思,即同时快速组建跨机构、大规模、高强度的科研团队,快速进步。
也许你会有疑问:
为什么致远研究院做的东西听起来像“大杂烩”?
但事实上并非如此。致远研究院做的不是“N+1”,就是在现有很多研究院的情况下多一个。
更现实一点,应该是“主机频道X”,就是把原来所有的研究优势聚集成一个协作联合体,为下一代人工智能的发展做一个新的体系。
这就是“致远模式”科研组织模式的论证。至于人才培养模式,致远研究院支持的模式是“青年人才带头”。
大方向和重大问题会由顶尖科学家制定,然后致远研究院理事会快速决策,甚至五分钟就能做出决定。
项目启动后,由真正的主角——青年学者主导。在项目的过程中也非常灵活,可以随时“微调”,不会出现“传送门”。
这也是致远研究院能够吸引众多年轻科研人员的原因。毕竟谁会拒绝一个自由强大的研究环境呢?
正如在致远研究院工作的算法工程师曾这样描述:
致远宽容,更开放,不强调单一文化,就像动物园一样。能包容任何一种性格的人,都能在这里找到自己舒服的姿势,做出贡献。
而且在致远研究院取得的成绩不是一时的,而是创造出经得起时间考验的杰作,是属于致远的,是属于年轻人自己的。
张宏江还在“寿宴”现场立下了这样一面旗帜:
致远研究院永远是最年轻的研究院。
最后一个重要的区别是,致远研究院是开源的,开放的。
致远研究院从注册开始就是民办非企业单位,并且会一直坚持这种非盈利的状态。
截至目前,致远研究院包括大模型在内的大部分科研成果已经全面向产学研各界开放。
正如张宏江所说:
未来,大模型将像一个世纪前的电厂一样,形成类似电网的基础设施,对各行业的智能化升级起到重要的推动作用,应用前景非常广阔。
致远的大机型更像Linux,红帽做的商业工作留给其他大机型。
在我们看来,致远研究院要做的就是把自己打造成一个“大模型”。
这个“大模型”就是要聚集中国的人口数据、中国最顶尖的人工智能人才、中国最前沿的技术等红利。
那么致远要形成并找到一个最优的“算法”——科研体系。
……
早在致远研究院成立之初,就提出了一个观点:
世界AI看北京。
如今,三年过去了,致远用创新的科研方法,成功让AI探索进入“北京时间”。
但现在它的愿景应该是从北京走向全国,甚至全世界。
至于“智力源模式”在接下来的过程中是否依然正确、创新、有价值,需要时代的发展给出肯定的答案。
评论前必须登录!
注册