马斯克大模型创始团队曝光!华人占三分之一:清华浙大校友在列

[百科] 时间:2024-04-28 03:38:53 来源:蓝影头条 作者:热点 点击:130次
毫无预警地,马斯模型马斯克刚刚在推特突然宣布——

成立公司xAI,创始目标是团队理解宇宙的真实本质。

更多消息被创始团队成员透露,曝光xAI,华人华大概率也是占分之清锚定大模型领域:

为大型神经网络开发“万物理论”,将成为AI提升到新水平的大校核心攻关点。

一同对外亮相的友列还有创始团队,包括马斯克在内,马斯模型共12人。创始

xAI官网介绍,团队这支由马斯克领导的曝光轻骑兵,组成人员有谷歌学术超过20万引用的华人华大佬,还有ChatGPT的占分之清项目组成员、AlphaStar的大校背后参与者、Transformer-XL的共同作者等。

这些人曾在OpenAI、DeepMind、微软和特斯拉等公司,以及多伦多大学等学术机构任职。

而且,华人在其中占据了4个席位,备受瞩目。

他们每个人的推特后面,都跟着醒目的xAI公司logo图标。

如此阵仗,难怪有网友“惊讶”分享自己的新发现:

哦吼,这是一家员工100%使用推特的AI初创公司哎!

虽然由马斯克带队,但xAI将会是一个独立的公司。

不过,团队还是会和X(Twitter)、特斯拉、SpaceX等马老板旗下的其他公司,展开密切的合作关系。

消息来得太过突然,不仅打了OpenAI、Anthropic等公司一个措手不及,连吃瓜群众都兴奋中带着懵圈。

由于受命于同一个大老板,有推特在职员工都激动凑热闹:

我有一个朋友,他让我帮忙问问,能不能同时在推特和xAI工作啊?(doge)

LinkedIn创始人霍夫曼也发话,他觉得马斯克是很有能力推动AI发展的。

不过,霍夫曼同时还是OpenAI的前董事会成员,以及风头正劲的AI初创公司Inflection AI的联合创始人。

面对此情此景,他不由得还问出了心中疑惑:

咱就是说,当马斯克自己下场,试图加快AI发展的时候,我就有点怀疑他之前闹着要全球AI暂停发展6个月,初衷到底是个啥。

华人占创始团队名单三分之一

xAI简单到不行(只有一页)的官网上,最引人关注的就是列出的12人名单。

量子位还注意到,这12个人中,有4人都是华人面孔。

分别是Yuhuai(Tony) Wu、Greg Yang、Guodong Zhang和Zihang Dai。

吴宇怀Yuhuai(Tony) Wu,斯坦福大学博士后,博士毕业于多伦多大学;

杨格Greg Yang,在哈佛本科毕业后,在微软研究院工作;

张国栋Guodong Zhang,多伦多大学硕博毕业,本科时是浙大的学生;

戴子航Zihang Dai,先后就读于清华大学、CMU,博士毕业后在谷歌研究院上班。

来整体看看xAI官网是怎么介绍这12个人的过往经历的——

整个团队由马斯克本人亲自领导。

其余创始团队成员曾在DeepMind、OpenAI、Googel Research,微软研究院,特斯拉和多伦多大学工作过。

这些人曾在Transformer-XL,Autoformalization,the Memorizing Transformer,Batch Size Scaling,and μTransfer方面,担任团队领导角色或做出过学术贡献。

经他们之手的项目,有AlphaStar,AlphaCode,Inception,Minerva,GPT-3.5和GPT-4等等。

更多消息,官网上也没有表露。

量子位顺藤摸瓜探了探他们入职xAI前的底细,并按照此前经历做了简单的梳理。

(仅含11名创始团队成员,马斯克其人本文不多作详细介绍)。

OpenAI前员工:1人

Kyle Kosic,OpenAI前工程师,研究兴趣是自动化、可扩展性和分布式计算。

再往前看,他曾在一家制造模拟云平台的公司OnScale工作。

3个月前,Kyle还在Linkedin上激情转发ChatGPT Plugin的动态文章。

DeepMind前员工:4人

xAI创始团队中,一共有4人曾是DeepMind的全职员工。

张国栋,前DeepMind研究科学家,xAI四张华人面孔之一。

浙江大学信息工程专业本科毕业后,他在多伦多大学获得博士学位,并且曾在谷歌大脑和微软研究院实习。研究方向主要是ML和AI,目前专注于训练、调优和对齐大型语言模型。

曾在ICML、ICLR和NeurIPS多个计算机国际顶会发表过论文。

Igor Babuschkin,一个在DeepMind和OpenAI反复横跳的人。

2018年起,他在DeepMind工作了3年多,是AlphaStar(DeepMind 星际争霸 AI 模型)登上《Nature》论文的主要作者之一。

而后,他跳槽到OpenAI。

据介绍,这期间,Igor是ChatGPT项目组的成员。

但是去年4月,他又以资深主任工程师的身份回到了DeepMind。

Manuel Kroiss,和上面这位一样,也是前DeepMind AI部门的资深研究员。

今年3月就有消息传出,马斯克把这人挖去了推特,没想到最终的归宿是xAI。

Toby Pohlen,在DeepMind的“练习”时长有6年3个月之久。

在职期间,他开发了AlphaStar参与联赛的评估系统——AlphaStar是DeepMind开发的AI,会玩《星际争霸II》,参加三场比赛的表现都被评为大师级,在官方的人类玩家排名中,排名前99.8%。

Linkedin资料显示,2021年起,Toby的工作就转而面向致力于大型语言模型的服务和评估工具。

微软前员工:1人

杨格,离职前是微软雷蒙德研究院的首席软件工程师。

此前,他还有苹果(2019.4-2021.2)和谷歌(2013.9-2018.10)的就职经历。

他的主要行业经验集中在构建、启动和维护大型分布式系统和基础设施组件,对TensorPrograms和neuralnetworks.有深入研究。

目前,他也是唯一一个已经在推特个人简介上标明“xAI联创”的人。

在 xAI 官宣成立后,杨格表示:

开发大型神经网络的“万物理论”将是将人工智能提升到新水平的核心。另一方面,这种AI将使每个人都能以此前难以想象的方式理解我们的数学宇宙。

Google前员工:3人

12人中,有3人加入xAI前的最后足迹留在了谷歌。

Christian Szegedy,曾在Google Research担任研究科学家。

他发明了最早的目标检测算法之一adversarial examples,主要工作面向深度学习,致力于通过深度学习进行ML、AI和CV。

在Google Shcolar上,这位大佬的总被引数超过了20万。

戴子航,四张华人面孔之一,先后就读于清华大学、CMU。

博士毕业后在谷歌研究院上班。是谷歌前研究科学家。

他的履历还显示,他曾经在百度从事深度学习方面的工作,后来还在图灵奖得主、深度学习三巨头之一Yoshua Bengio领导的AI实验室MILA待过一段时间。

2019 年,CMU的预训练模型工作XLNet中,戴子航与现清华叉院助理教授、国内AI初创公司月之暗面创始人杨植麟并列为共同一作。

吴怀宇,四张华人面孔之一,博士毕业于多伦多大学,后在斯坦福大学攻读博士后。

他的主要研究兴趣是制造可以推理的机器,目标是做个有关自动化的数学家。

值得一提的是,博士就读期间,吴怀宇的指导老师名单上,就有本次创始团队的成员之一Jimmy Ba的名字。

他曾在DeepMind和OpenAI实习,毕业后,加入了谷歌的N2Formal团队。

去年,他参与的3篇论文在计算机国际顶会ICLR 2022发表,8篇论文发表被顶会NeurIPS 2022接收。

特斯拉前员工:1人

Ross Nordeen,特斯拉超级计算和机器学习部门的前技术项目经理。

加入xAI以前,媒体报道Ross已经在去年10月被马斯克“调任”到推特,管理一些招聘和访问事宜。

多伦多大学教职人员:1人

Jimmy Ba,多伦多大学的明星青年副教授,他本人也是在多伦多大学完成了了本硕博的学习,跟随图灵奖得主Geoffrey Hinton拿下博士学位。

Jimmy Ba的研究重点为深度神经网络的高效学习算法的开发,是训练深度学习模型的首选算法之一Adam Optimizer的开发者。

今年年初,他获得了被称为“诺奖风向标”的斯隆研究奖。

有趣的事是,他的推特个人简介上写道:

我所有的帖子都是由 GPT 生成的。

马斯克开搞大模型

OpenAI+DeepMind+微软+谷歌+特斯拉+多伦多大学,可以说,xAI创始团队的AI buff叠满了!

鉴于xAI的团队成员曾参与过的项目,已经有不少网友猜测,xAI的成立就是马斯克进军大模型和AIGC的号角,与OpenAI激烈竞争。

今年年初OpenAI一通连轰带炸后,马斯克就已经嘴炮连连。

一方面是与Yoshua Bengio、Stability AI的CEO、DeepMind研究人员等1000多位大佬联名,要求至少6个月暂停GPT的训练。

另一方面,持续对外发声,说OpenAI已经不Open了,并表示自己会推出一个叫TruthGPT的AI的平台,并声称“这可能是通往安全的最佳途径”。

说起来,xAI是马斯克现在带队的第6家公司,另外5家分别是特斯拉,SpaceX,推特,Neuralink和Boring Co.。

官网上白纸黑字写得明白,xAI是一家独立公司,但会与SpaceX,推特等有深度合作。

那么,这家马斯克一手打造的AI新星,到底是要做什么?

用马斯克的话说,是要理解现实(understand reality),更进一步的,可以通过官网上的另一句话来理解:

“为了理解宇宙的真正本质(understand the true nature of the universe)”。

更多事宜目前并没有公开,xAI卖了个关子,并欢迎大家在当地时间7月14日(本周五)的推特Space聊天中,向团队直接提问。

有心人已经偷偷扒出了xAI的更多信息。

譬如,今年3月9日,马斯克就已经注册成立了xAI这家公司,马斯克自己当董事。

3月初就注册成立了,为啥选择今天官宣?

马斯克见没什么人朝这个方向讨论,自己下场刨了自己埋下的包袱。

原因只有一个,那就是他在玩梗,毕竟“42是宇宙的终极答案”。

说回正题,3月成立时的这个时间点,略显微妙。

已经有网友猜测,4月初马斯克为推特购买的1万个GPU,有没有可能是明修栈道,暗渡陈仓,其实偷偷在为xAI成立后,开发自家的大语言模型做准备?

永远奔赴在AI吃瓜第一线的英伟达AI科学家Jimmy Fan发推分析了一波:

什么对话文本啊、图像啊、长视频啊、推特上有大量的多模态数据。xAI可是唯一一家可以直接合法合理访问这个庞大、每日还在拓展的语料库的AI初创公司啊!!!

额外提一嘴,除了创始12人,xAI官网上还有个人的名字:公司顾问,丹·亨德利克斯(Dan Hendrycks)。

他的另一重身份是国际AI领域非营利组织“人工智能安全中心”(Center for AI Safety)的主任,这个组织就是今年5月30日,发布仅22个单词公开信的那家。

信里是这样说的:

减轻人工智能带来的人类灭绝风险,应该与大流行病和核战争等其他影响社会的大规模风险一同成为全球性的优先事项。

不知道这人的加入,能不能避免马斯克一直对外表示的“AI发展过快带来风险”等问题。

One More Thing

马斯克官宣以后,xAI已经热火朝天开了聊天贴,和网友们聊起来了。

但承载xAI初亮相的推特这头,有一些同样crazy的事情正在发生。

近期的推特不仅陷入了限流争议,还被喂了口诉讼索赔的官司——

马斯克去年收购推特后,辞退了数千名员工。

按道理讲,这些员工应该拿到共计至少5亿美元的遣散费,但推特不仅没有按2019年起公司内部规定给足,最多只给了被辞退人员一个月的遣散费,有的人甚至一分钱都没从推特身上拔下来。

上个月,诉讼通知已经落到推特头上了,公司也没能支付拖欠员工的数百万美元奖金。

推特的说法是,这事儿“告我不合理”。

Emmmm……大概只有和马斯克一起在“理解宇宙的真实本质”后,才能理解推特不根据自家规定支付遣散费的原因吧。

责任编辑:落木

(责任编辑:综合)

    相关内容
    精彩推荐
    热门点击
    友情链接