“如果大模型是答案,能解决的问题是什么?”

[知识] 时间:2024-04-30 03:33:22 来源:蓝影头条 作者:知识 点击:145次

    

“如果大模型是答案,能解决的答案问题是什么?”

文丨贺乾明 邱豪

编辑丨程曼祺

华为、腾讯和阿里来了,问题英特尔、模型高通也来了;特斯拉来了,答案带着它的问题 1:1 人形机器人模型;英伟达没亮相,但它也出现在各个地方,模型在中国竞争者的答案演讲里,在潜在客户的问题询问里。

这算一个 AI 大会的模型常规配置,但 7 月 6 日到 7 月 8 日来上海参加第六届世界人工智能大会(WAIC)的答案近 18 万人里,有珠宝检测机构、问题公安局的模型团队,还有核电公司和医院的答案员工来找机会,甚至有人组织了一些小学生来参观,问题不止一个团。

在增长越来越稀缺、确定性越来越难得的此刻,AI 大模型许诺了一个少有的新可能。各行各业的人士都带着他们的问题和迷惑,聚集到上海浦东,当他们离去时,一些问题并未得到解答。

“如果大模型是答案,那问题是什么?” 这是一位寻找创业机会的参展者来了之后的疑问。他之前在字节跳动工作,现在筹备大模型创业,希望能在这场大会展出的 30 多个大模型上找一些灵感。

逛了一上午后之后,他想到了自己经历的上一轮人工智能热。AlphaGo 在 2017 年击败柯洁,第二年,WAIC 第一次在上海举办。当时会场里展示最多的各种巨型屏幕,呈现摄像头监控下的车流或街区。AI 公司给这类系统取名 “智慧城市”。

自那时起,人工智能的发展就不完全由市场驱动,而是混合着政府的引导与期待。这次的大模型热潮也不例外,开幕式和一些规模较大的论坛都有官员身影,表态要为推动人工智能产业发展提供政策助力。

对比两次浪潮,这位创业者有了更多疑问:“CV(计算机视觉)有安防,大模型会有什么呢?” 他不认为会有多少公司愿意每年花上百万、千万元买一个并不完美的聊天机器人帮自己回答客服问题或做文档提炼和摘要。

他的疑问展现了大模型热潮的另一面:大模型像是雷神之锤,但如果没有适合它的钉子,就难以发挥被期许的巨大商业价值。

各行各业的人都来了,看大模型能怎么帮自己

7 月 6 日上午 9 点后,还没有等到 WAIC 开放展馆,人潮就已占领了上海世博中心和世博展览馆附近的大小咖啡馆,晚到的人只能挤在附近的面馆里讨论 AI 和大模型,以往只有到中午,这里生意才会好起来。

“黄牛” 也在入口附近就位,低声询问来往的人 “预约了没”。按官方要求,不提前预约就无法入场。黄牛们说自己能搞定入场问题,“得花 400 元”。

看展的不只 AI 从业者,展览馆中随处可见工作人员举着牌子带队参观,牌子上写着 “珠宝国检采购团”“上海市公安局虹口分局”“长城汽车采购团” 等。

“如果大模型是答案,能解决的问题是什么?”

在华为办的大模型论坛中,晚到的媒体记者发现预留的媒体座位已被抢占,并不是媒体同行太热情,而是到场的人实在太多了。两位中国核电集团的员工也坐在这里,过去几年他们把人工智能技术用到了维护、检修设备的环节中,现在他们关心大模型:“看能不能找到一些结合点”。

增长推力渐弱的当下,大模型是为数不多的亮点,过去半年的狂热炒作后,一些人担心被 AI 替代、颠覆,另一些人决心在被替代前跳入潮流。不过这种全行业的热情暂时缺乏认知基础,多数人还不理解大模型到底是什么、能做什么。

“大模型就是大算力、占用更大的存储空间吗?” 一位在医院工作的人士逛了一圈腾讯展区后问附近的工作人员。她知道人工智能的视觉能力,已经能帮医生看 CT 图像了,但不太了解大模型能帮助医院做什么,渴望知道更多。

太快形成的太大期待,往往带来了等量的失望。展会现场,很多围在各家展台电脑前体验大模型:“写一个创意咖啡的品牌故事”“写一个小学生的出游计划”。一位参展者瞥见了阿里通义千问展示的 “写情书” 功能,立即吐槽说:“这什么玩意?能帮我干点实际的事吗?”

参观者围在 WPS 展台上体验大模型应用,图片来自 WPS。

参观者围在 WPS 展台上体验大模型应用,图片来自 WPS。

没几家公司谈论再造一个 OpenAI 了

送走几位测试大模型失败的人后,一位互联网公司的参展人员叹了口气:“没办法,技术现在还是不太行。”

刚走的那位拿着一道数学题测试大模型,让它算出 “每个数字都不相同的五位数有多少个”。看到结果后,对方扬了扬手机说,“还是 ChatGPT 靠谱些”。

参会前,展台的这位工作人员看到同行们在几个月里做出了几十个大模型,就已经有了感觉:做出一个大模型似乎没那么有技术壁垒,但要做好很难。WAIC 期间,他抽空体验了同行的大模型后,这一感觉更强烈了:“效果相差不大,都离 ChatGPT 有差距。”

就在半年前,还有不少公司称要做中国的 OpenAI。但这次大会的展台和论坛发言中,已经没多少人提这个目标了。

新的叙事是:行业大模型与 “大模型赋能千行百业”。

华为展出矿山大模型。

华为展出矿山大模型。

华为轮值董事长胡厚崑在 WAIC 开幕式上说,“大模型的目标是应该服务于不同行业的不同应用……才能发挥更大价值。” 腾讯集团高级执行副总裁汤道生在后续发言中也表达了类似观点:“行业大模型是企业拥抱大模型的更优选项。”

腾讯和华为都没有在展台上摆电脑让人体验大模型。紧挨着腾讯展台的阿里巴巴虽然放了十多台电脑在展区中心供人体验,但阿里云的 CTO 周靖人也开始强调做生态,而不是自研的大模型。他在 WAIC 论坛中说:“阿里云将把促进中国大模型生态繁荣作为首要目标……让各行各业享受大模型技术红利。”

风向转变并不是大公司放弃研发更大的模型,而是它们希望先找到一个可行的方式,让这个不算成熟的新技术先发挥价值,创造收入。他们的逻辑是:

通用大模型(类似 ChatGPT 背后的大模型)用起来贵,模型参数普遍千亿起,实际运作起来要花费大量资源,ChatGPT 和 New Bing 一度抽干了微软积累的数十万张 GPU 算力,一般公司根本难以承受。

通用大模型在特定场景效果不好。通用大模型一般基于公开文献与网络信息训练,专业知识与行业数据积累不足,导致回答的精准度不够,“企业一旦向公众提供了错误信息,可能引起严重后果。” 汤道生说。

行业大模型参数更小、部署成本更低,针对性训练后,回答特定问题时效果更好。而且大公司为各行业公司提供训练或部署大模型服务的云端 MaaS(模型即服务),也能帮助它们先卖一些云服务。

体量小些的公司更现实。一位 AI 独角兽公司首席科学家说,他们从 2018 年就开始研究大语言模型,前两年也做出来了写文章的应用,因为没客户买单,公司就一直没有加大投入。ChatGPT 火了后,他们也发布了自研大模型,但暂时不打算训练规模更大的模型,因为客户觉得性价比有限,毕竟训练一个参数千亿的模型要花千万元人民币。

不过即使是理论上更便宜,离落地更近的行业大模型,真要用起来价格依然不菲。《晚点 LatePost》了解到,中国一家备受关注的大模型创业公司的参数 60 亿的大模型,售价为百万元,千亿参数的售价每年上千万元——大多数成本都是芯片算力。

大模型能做什么还不确定,卖装备的很活跃

大模型具体能做什么,能做到什么程度还在探索中,但大部分人的共识是,淘金前先得准备好装备。

今年 WAIC 会场的一个明显变化是国内 AI 芯片公司的展台更大、更接近 C 位,也吸引了更多人关注:燧原科技、天数智芯、瀚博半导体、沐曦集成电路、登临科技等芯片公司的展位贴近腾讯、百度,展台面积也和这些大公司相近。占据全场最大展台的华为,单独拆出了一个昇腾生态展台,昇腾是包含 AI 芯片、MindSpore AI 训练框架和软件服务的华为 AI 计算全套产品。

每家芯片公司的展台都人头攒动,前来咨询的客户想知道这些芯片的性能怎样、具体可以做什么。最常见的一个问题是:可以替代 A100 吗?

中国 AI 芯片公司展台比往年更大。

中国 AI 芯片公司展台比往年更大。

两年多前由英伟达推出的 A100 GPU,现在几乎是训练大模型的标配。当 ChatGPT 横空出世,四处涌现的 AI 初创公司和科技巨头们争相购买 A100。美国政府针对 A100 等 AI 芯片的出口管制更加剧了其在中国的紧缺程度,但同时也让国产芯片公司们看到了替代机会。华为昇腾计算业务总裁张迪煊接受采访时说,“过去是我们找企业,现在是许多企业找过来。”

不同于开发大模型的公司还在尝试各种最终应用场景,芯片公司们展示的东西明确、直观得多:在各芯片展台的显眼位置,往往摆放着各型号芯片,和搭载了其 AI 芯片的服务器,它们看起来是一个个大机箱,其中插着数排 AI 加速卡。各家公司也会用现场计算机展示在自己的芯片支持下, AI 大模型或 AIGC 的应用效果:包括对话机器人、AI 绘画等。

英伟达没在 WAIC 上设展台、没有一场冠名论坛,也没拿任何奖项,在芯片专场论坛中,英伟达只派来一位技术总监,他最后一个上台,排在高通、AMD 和英特尔之后。但几乎每家芯片公司宣传产品时都会对比英伟达 A100 的指标;燧原科技 CEO 赵立冬在同场论坛里演讲时,就以英伟达市值已突破万亿美元开场,以此说明华尔街正在用真金白银押注 AI 计算大机会。

中国政府对扶持 AI 算力的重视也更甚以往:去年大会的芯片专场论坛的领导致辞环节,有一位上海市副市长出席,今年则来了上海市市委常委、浦东新区区委书记,上海市经信委主任,以及工信部科技司的一位副司长。

奋力卖 “装备” 的人除了芯片公司,还有云计算厂商和数据服务公司,以及猎头公司和地方园区。

大多数公司很难买到 GPU 芯片训练大模型,更好的方式是直接租用云厂商供应的算力。微软 Azure、亚马逊 AWS 今年都上了 WAIC 的主论坛。

《晚点 LatePost》了解到,数据采集和标注平台澳鹏今年下了重注,把全年大多数展出预算都放在了 WAIC 上;它的中国同行——股价曾在短短一个月之内上涨超 2 倍的海天瑞声,则是第一次参会,现场的工作人员说,除了接待接连不断的潜在客户,还有 “许多股民来感谢我们”。

创业生态里的各种服务方也在寻找客户。一位参展企业人士说,他一个上午遇到了好几波猎头和地方园区招商人员,接了一沓名片。不管想尝试什么新机会,人才和经营场地,都是一批公司要付出的成本,是另一批公司和地方的新发展机会。

大模型带动通用机器人成热点,无人车、元宇宙退潮

在各种相对抽象的应用和系统解决方案中,机器人是少有的能 “看得见、摸得着” 的应用方向。

大模型热起来的这半年,一个名叫 “具身智能”(Embodied AI)的概念也获得关注。简单来说,具身智能是指人工智能软件与硬件结合起来,去解决现实世界的问题。今年 5 月,英伟达 CEO 黄仁勋说,具身智能会是下一个 AI 浪潮,具身智能的典型代表就是机器人,尤其是能以同一形态产品,完成多种复杂任务的通用机器人。

WAIC 现场,机器狗和人形机器人肉眼可见地多了起来,主办方称有 20 多个,往年则是个位数。

会场中的热闹场景,是一群人围着机器狗 “逗狗”,尝试推倒它、骑它。云深处的机器狗在一次表演爬台阶时踏空摔了下来,马上在围观的人群中激起一阵密集的叹息:“完了、完了……完了”。

人们围观机器狗。来源:视觉中国。

人们围观机器狗。来源:视觉中国。

关于大模型和机器人具体怎么结合,从业者现在莫衷一是。有观众问机器狗公司宇树科技的工作人员:“你们会把大模型用到机器狗上吗?” 工作人员愣了一会儿,说:“还没有发现什么可以做的”。

一家机器人公司创始人告诉《晚点 LatePost》,大模型现阶段在机器人上的明显应用方向,是用自然语言替代代码,直接向机器人输入指令,让机器人有部分 “常识”,能把人想传达的任务分拆成各种机器人子任务;但子任务的执行需要依赖机器人基础能力,如导航、规划、控制等,大模型可能有帮助,但不是替代和颠覆。

相比机器狗公司面对大模型的犹豫,开发人形机器人的公司乐观多了。达闼科技发布了 “RobotGPT 行业大模型”,宣称要 “引领具身智能新时代”。他们运了十几个机器人到现场,让它们摆成一列跳 “千手观音”。

达闼科技的机器人表演 “千手观音”。

达闼科技的机器人表演 “千手观音”。

它在这场 AI 大会上遇到了新对手。展台就在达闼对面的傅利叶智能。这家公司之前做智能复健设备,现在发布了人形机器人,同样宣布要 “引领 AI 进入具身智能时代”。

最抓人眼球的人形机器人是特斯拉的 Optimus。在保护机器人的红线之外,聚集的人群争着钻得近一点再近一点,好拍照记录,仿佛在膜拜一尊神像,尽管这只是一个 1:1 的模型。

参观者挤到特斯拉人形机器人 Optimus 前拍照。

参观者挤到特斯拉人形机器人 Optimus 前拍照。

路过的人常常问工作人员 “它能动吗?” 甚至有人靠上下前后摇动手机,硬是拍出了动感效果。“虽然是模型,但很震撼”,一位现场的年轻人说,他目测这个机器人有 1.9 米高,这也许是黑科技带来的光环,Optimus 的官方身高是 1.72 米。

往年,这样的盛况属于无人车和元宇宙。

2021 年的人工智能大会俨然像是另一场上海车展。自动驾驶公司嬴彻科技、小马智行和图森未来不惜重金将高 4 米、近 10 吨重的卡车实物运到展台。AutoX、上汽、华为车 BU、百度 Apollo、商汤科技,乃至做汽车芯片的芯驰科技,都直接展示了搭载自家技术或产品的汽车。WAIC 还专门设立了一个无人车体验区,会场接驳都用了无人小巴。

到了今年,体验区和无人小巴都不见了。只有上汽智己、集度、特斯拉等少数车企的展位上还有车,两年前的 “卡车三雄”,今年只剩图森未来展示了一个用塑料盒包裹起来的感知套件,其他无人车公司几乎都没来。

图森未来 2021 年展台(上)和 2023 年展台(下)的对比。

图森未来 2021 年展台(上)和 2023 年展台(下)的对比。

大会的智能驾驶论坛被安排到 WAIC 最后一天,云骥智行联合创始人曹光植在参与圆桌讨论时一边鼓励同行共渡难关,一边自嘲:“自动驾驶这么一个阳春白雪的事情,怎么被我们卷成了这样?”

元宇宙也有类似冷遇。去年 WAIC 大会把元宇宙概念嵌进了主题名,“智联万物、元生无界”,Meta 大中华区总裁梁幼莓受邀在开幕式上演讲,主办方还在世博中心、徐汇西岸、张江分会场、东方明珠和武康大楼等地设置了元宇宙打卡点。

一年过去,只剩下为数不多的 XR (扩展现实)企业将元宇宙作为宣传点。在官方设置的 10 个前沿技术中,今年元宇宙相关论坛只有 3 个,是去年的五分之一。从主会场的入口一直走到尽头,才能看到一些元宇宙相关公司的小展位。无论是自动驾驶还是元宇宙,在当下风口过去、融资困难的背景下,企业们大多将有限的预算留给了维持公司经营。

当一种新技术热潮显现,往往有两种演进路径:一是新技术兑现了价值,成为基础设施的一部分,不再被关注,比如互联网、推荐算法。另一个是新技术短期内无法兑现价值,然后被新的热潮抢走资源与风头。现在大模型成为新热点,但过去的一轮轮技术炒作后,局内和局外人都已冷静很多。那些真正想在这个新机会里做些事情的从业者,其实希望大众的热情和期待都更务实一些。

腾讯云副总裁吴运声说,腾讯已经联合金融、文旅、政务、传媒、教育等十多个行业客户,打造超过 50 个行业大模型解决方案。据我们了解,这些方案暂时都没有上线。他说,现在是大模型发展的初级阶段。

朱丽琨对此文亦有贡献。

(责任编辑:休闲)

    相关内容
    精彩推荐
    热门点击
    友情链接