揭秘大模型时代背后,那些平凡的天才们

[知识] 时间:2024-03-28 16:58:44 来源:蓝影头条 作者:焦点 点击:36次
在如今这样一个大时代背景下,揭秘说到“天才”,大模代背的天人们很容易就能想到那些游走在时代前端的后那科技开拓者。

今年7月份,平凡在2023年中国互联网大会上,才们一组中国人工智能产业创新人才竞争力的揭秘数据颇引人注目——百度公司在预训练大模型、深度学习、大模代背的天自然语言处理、后那知识图谱、平凡智能语音、才们计算机视觉、揭秘自动驾驶等七大领域的大模代背的天专利积累和人才储备,都遥遥领先于其他同行。后那

为什么是平凡百度?这个问题,可能只有他们自己才能回答。才们

在中国,几乎人人都在用百度。然而,或许也正是因为人们对百度过于熟悉,所以便轻易地忽视了它背后的“机器”一直在如何运转。

实际上,作为一家产业化公司,百度一直在悄悄地“搞发明”。2022年年底,随着ChatGPT在全球范围内掀起了一场大爆发,一场科技赛程的追赶开始了,等到大家回过神来的时候,百度已迅速拿出了自己已锤炼多年的大模型、高端芯片“昆仑芯”、飞桨深度学习平台、量子、自动驾驶等科技前沿成果。

2023年7月6日,上海世博展览馆,参观者走过百度的展台。(图/视觉中国)

2023年7月6日,上海世博展览馆,参观者走过百度的展台。(图/视觉中国)

据了解,在过去的一年里,百度核心研发费用达到了214.16亿元,占了百度核心收入比例的五分之一。近十年来,百度累计研发投入也是超过了1400亿元。

早在2013年,李彦宏宣布百度将成立专注于Deep Learning(深度学习)的研究院,要做中国人工智能领域的“贝尔实验室”,吸引全球最顶级的人才。多年来,百度高度重视人才培养。2020年,为培养高校AI人才,飞桨启航计划投入总价值5亿元的资金与资源;2021年,飞桨再发布“大航海”计划,3年投入15亿元资金和资源,李彦宏称,要为中国培养500万名AI人才。

如今,随着大模型时代的到来,人们的生活开始慢慢从“数字化”往“数智化”迈进,当越来越多的百度“创造”抵达用户之后,人们不禁疑问,到底是什么样的人,才可以发明出这些了不起的东西?2023年9月12日,百度在北京发布了2023年“百度十大科技前沿发明”,同时也把那些科技幕后的创造者们,推到了台前。

揭秘大模型时代背后,那些平凡的天才们

都是普通人,在做不普通的事

说起新时代的科技发明,似乎并不能像学习一个物理公式那样轻松,也无法像理解爱迪生如何发明了电灯泡那样简单。自从互联网诞生之后,人类从物质的三维世界,迈向了更广阔的维度。

为了更清楚地揭秘现在的科技开发者都在做些什么,百度公司的同学们,向《新周刊》介绍了如今的互联网行业,为什么会被称为“大模型时代”——相较于传统的“操作系统+应用”的运行方式,AI时代的到来,将互联网科技的技术栈,拆分成了现如今的四层架构。

这么说来,或许很容易让人费解,但其实简单地说,就是AI技术在传统的运行方式上,植入了一个智能“插件”,只不过这个“插件”,需要芯片、深度学习框架、预训练大模型,以及各种落地应用来共同运转。

就在这样的行业背景之下,百度近年来自主研发的“飞桨深度学习平台”和“文心大模型”,仿佛一对“组合拳”,连接了整个上下游产业链,并且在国内遥遥领先于其他科研机构。

上海2023世界人工智能大会上,百度展示文心大模型(文心一格,文心一言)的核心技术创新。(图/视觉中国)

上海2023世界人工智能大会上,百度展示文心大模型(文心一格,文心一言)的核心技术创新。(图/视觉中国)

百度知识图谱部的小凡,2011年研究生毕业就加入了百度,目前主要负责大语言模型推理技术及应用。他说与很多科技工作者一样,自己会有一个通用人工智能(AGI)的梦想,而大语言模型将加速它的实现。据他介绍,正如“文心”出自《文心雕龙》的典故,百度对于大模型的开发就好比雕刻,如何让其能像人一样去思考和推理,是他所在团队的主要工作目标。为了达成这样一个目标,他们基于百度超大规模知识图谱,进行大规模的思维数据构建与模型训练,并通过大量的实验印证,以各种形式逐步提升大模型的推理能力。

如今,这项基于思维链的大模型推理技术,在小凡等人的推动下,大大提升了大模型的推理能力,并且面向涉及复杂推理的应用场景,展现出了强大的技术实力和创新性。

此外,与“文心大模型”联系密切的“飞桨深度学习平台”,自从2016年开源以来,目前已凝聚了超过800万名开发者,广泛服务于金融、能源、制造、交通等领域,稳居中国深度学习平台市场综合份额第一。

据百度深度学习技术平台部的华琪介绍,随着大模型时代的到来,算力的需求越发凸显,对深度学习框架的硬件适配技术,也提出了更高的要求。华琪自2020年加入百度后,便开始主要负责飞桨框架的硬件适配工作。如今,飞桨已经和40多家硬件厂商完成适配。

华琪告诉《新周刊》,为了解决AI技术的三要素——“算法、数据、算力”中的算力,芯片的选型和适配是一个非常大的问题。飞桨多硬件分层适配一体化技术,大大降低了适配开发成本,提升了硬件适配效率,加速了人工智能基础设施的建设,有助于未来更多的技术突破。

飞桨深度学习开源框架。

飞桨深度学习开源框架。

“我们做的事谈不上多么神秘莫测,除了我本身就容易被前沿技术吸引之外,更重要的是,我们觉得工作应该是件有意义的事情。”华琪说。不过在笔者看来,他们的确与普通人无异,只是做的事都并不普通。

揭秘大模型时代背后,那些平凡的天才们

专注如一,不设限,

把事情做到极致

科技的发展作用于社会、造福于人,很多时候不可避免地会向着各种不同行业进行延展,比如生物医药、未来教育,以及驾驶出行等,涉及到社会生活中的方方面面。

百度自然语言处理部的张肖男,本科是数学专业,研究生偏重于电子计算机领域,然而当她开始进入到“生物计算大模型”的研发,看到那些小分子化合物和大分子蛋白质,感觉既熟悉又陌生,这就使得她不得不从0开始学习生物医药方面的专业知识。不过张肖男表示,这种从计算机向生物医药的跨学科相对还好些,有些反过来从其他行业跨入计算机行业的同事,就要难受很多。

据张肖男介绍,随着2020年全球新冠疫情的暴发,AI在生命科学领域的应用取得了突破性进展,比如谷歌AlphaFold2的出现,为人工智能技术的落地开辟了新的思路。突如其来的研究课题,落到百度科技研发团队人员的身上,不仅变成了技术攻坚,同时也成了一种社会责任。

“百度最开始在国内做生物医药的时候,由于此前积累很少,所以受到过不少跨行业人士的质疑。但是这两年多来,我们通过不断学习,坚信自己的实验数据,最终取得的成果也逐渐得到了行业的认可。”张肖男说。

文心·生物计算大模型技术。

文心·生物计算大模型技术。

学习是永恒的母题。除了对生物计算大模型的研发,百度投身于高性能自研量子芯片的研发,不断地在寻求新的突破。

百度量子计算研究所的舍骝策告诉《新周刊》,随着信息技术的不断发展,量子计算作为一项前沿科技,一直备受关注。我们社会的生活与生产都需要“算力”,无论是ChatGPT,还是文心大语言模型,背后对算力的需求愈来愈强烈。于是,“后摩尔时代”新的计算范式成为大家努力追寻的方向。受益于量子的特性,高性能量子芯片能够在某些复杂计算任务展现“量子优势”,提供超越于经典计算机的算力。

百度研发的量子芯片。

百度研发的量子芯片。

2014年,舍骝策还在法国攻读博士,当他通过新闻留意到美国的IBM和Google公司已经开始投入量子计算的研发,而彼时国内还没有任何一家企业在做的时候,便萌生了投身量子计算产业的想法。后来,舍骝策毕业归国,经人引荐认识了百度量子计算研究所的所长段润尧。经过几次交流后,舍骝策倍受鼓舞,不甘于停留在学术界的他,意识到让量子计算落地才是自己真正想做的事业。

2018年,舍骝策加入百度。作为“高性能自研量子芯片项目”的核心研发人员,舍骝策瞄准“设计—流片—测控”闭环中的核心技术,在Feature Team的团队氛围之下,攻克了不少量子芯片研发中的短板问题。如今他和团队同学所研发的专利技术,为百度量子计算产业化提供了非常重要的量子硬件基础。

“‘专注如一,不设限,把事情做到极致’是我们的信条。”舍骝策善于观察,他说百度的同事之间,都会互相称呼“同学”。“叫‘同学’是百度的文化之一,其实在我们的团队当中,大家教育背景和专业不尽相同,但是无论来自哪里,当大家聚集在一起时,就都成了一种互相学习的关系。”

不断学习似乎成了百度最流行的文化,正如张肖男所说:“如果站在历史的长河里去看百度的产业布局,我觉得任何时候都无法断言它趋于完整,比如国内的开源生态现在也很繁荣,各自都有各自的优势吧。”在她看来,科研的开发永远没有终点,百度只不过是引领了国内大模型的技术产业生态,而未来是不可预测的,也是充满机会的,这个机会对于每个做科技的公司,以及对于每个做开发的人来说,都是均等的。

揭秘大模型时代背后,那些平凡的天才们

做这行不太容易“犯焦虑”

“做科研开发的人,很容易被视作‘狠人’‘大牛’,更何况百度的价值导向,是一种长期的技术信仰。”柳长春在介绍自己关于“自动驾驶决策系统”的发明专利时说,为了让汽车在不同的路况环境中做到甚至是超越人眼和大脑的判断,需要不断攻克和解决自动驾驶中的基础问题,这其实还是回到了对深度学习技术的应用,在这个过程里,柳长春只能逼着自己往前走,“因为问题都是可视的,一项一项去解决就好了。”

据柳长春回忆,2015年,百度的第一辆无人驾驶车开上北京的五环的消息,轰动了整个社会。作为当时刚从清华大学自动驾驶专业研究生毕业的他,没作多想,便将自己的简历投向了百度。在加入百度之后的六七年当中,他自觉与自动驾驶技术的研发工作,是一种共同成长的关系,有突破的时候,当然也有低谷的时候,不过只要看到项目推进哪怕一点点、问题解决一小个,他都能重新振奋起来,因为他相信“悲观者看到问题,乐观者改变世界”。

百度无人驾驶车的决策数据闭环系统。

百度无人驾驶车的决策数据闭环系统。

毕业于北京大学的史海波,与柳长春几乎是同一时间加入了百度,不过他所参与研究的领域,是公司的看家本领——“百度搜索”。六七年来,为了让搜索引擎变得更高效,早在ChatGPT-4爆发之前,他便一直在机器问答领域不断摸索,如今研发出了“生成式搜索系统”的发明,为百度搜索的迭代做好了充分的准备。

“学术界关注更多的是科学突破,但是在工业界,想的却是把想法变成现实,真正把东西造出来。”史海波说,“当代的年轻人普遍容易焦虑,不过做这一行就不太可能,因为每天都在解决实际问题。”

相比起年轻人,早在2006年入职百度的秦同学,就是“干实事”的最好例子。作为“凤巢”的首席构架师,他通过搜索变现的方式,曾为百度每年带来上百亿元的收入。他也一直从未停止过想象,怎样才能把推荐算法变得更加智能。据他回忆自己曾经看过的一部电影《Her》,里面那个“陪伴式的智能体”,成了他的愿望和目标。

电影《Her》里的“陪伴式智能体”。(图/《Her》)

电影《Her》里的“陪伴式智能体”。(图/《Her》)

直到2019年,秦同学转入推荐策略部后,通过千亿级参数的“文心大语言模型”,他找到了抵达“目标”的关键技术突破口,历时三年终于研发出了“基于用户心智理解的对话式推荐技术”。名字乍一看有些长,但其实不难理解,这是一种从“数字”到“数智”的飞跃。

在秦同学看来,创新的目标是用科技让复杂的世界更简单。在掌握核心技术的百度,一如既往地工作了17年,是他从未后悔过的决定。据他透露,百度内部有一个科技创新最高奖,也是中国互联网行业最高级别的奖,每个奖金是100万美元,而光是他带领的团队,就拿到过六次。

“其实没想那么多,就是做自己最擅长的事,而且百度的企业文化一直是简单可依赖,没有复杂的人际关系,大家自上而下都是懂技术的,所以都在踏踏实实做事情。”秦同学说。

百度量子。

百度量子。

他创新的脚步一直在前行,最近又在推动大模型往个人智能助理的领域发展,这一想法来源于他在生活中观察到的,人们一直期望高效获取信息,获得高情绪价值、教育价值等,在他看来,如果大模型在个人智能助理领域能够成功做到,那么将来就能泛化应用到人们生活的各个领域。

秦同学说:“我们无须过于担心,科技的发展会如何影响人类的生活,其实只要将科技视作一种方法,让社会朝着更良性、更公平的方向发展,一切就都是值得的,也是每个科技研发者共同肩负的责任。”

作者:段志飞

校对:邹蔚昀

排版:小 野

封面:《Her》

(责任编辑:知识)

    相关内容
    精彩推荐
    热门点击
    友情链接