硅谷三巨头大战AI语言模型:今日要闻
在风靡全球的ChatGPT浪潮中,一度被调侃“掉队”的Meta终于要开始反击了。近日,Meta发布了一款新的人工智能大语言模型LLaMA,按照Meta首席执行官扎克伯格的说法,这一模型在生成文本等任务方面有很大的前景。在今年爆火的AIGC领域,微软和谷歌已经牢牢抓住了市场的眼球,如今Meta的加入更是让硅谷AI混战瞬间升温。
(资料图)
重回生成式AI
ChatGPT刚火出圈的时候,被誉为深度学习三巨头之一的图灵奖得主Yann LeCun就曾泼过一盆冷水,称就底层技术而言,ChatGPT并不是多么了不得的创新,它只是一个组合得很好的产品。而Yann LeCun还有另一个关键的身份——Meta首席AI科学家。
即便并不认可ChatGPT的技术创新,但风口的形成意味着Meta并不能继续“躺平”了。根据Meta官网的描述,LLaMA目前包含70亿、130亿、330亿和650亿4种参数规模的模型。在大多数基准测试中都优于GPT3.5的前身GPT3-175B,且LLaMA-65B可与业内最佳的Chinchilla-70B和PaLM-540B竞争。
ChatGPT正是由GPT-3.5架构的大型语言模型(LLM)所支持的,而GPT3.5则是一款基于OpenAI 175B参数基础模型训练的LLM,175B是它从训练数据中所学习、沉淀下来的内容。
扎克伯格称,LLaMA是“目前水平最高的”大型语言模型,目标是帮助研究人员推进他们在人工智能领域的工作,在生成文本、对话、总结书面材料、证明数学定理或预测蛋白质结构等更复杂的任务方面“有很大的前景”。
对于Meta来说,大语言模型并不是一个陌生的赛道。早在去年5月,Meta就曾推出一款面向研究人员的名为OPT-175B的大型语言模型。去年11月,Meta又开发并上线了AI语言大模型Galactica,旨在运用机器学习来“梳理科学信息”。但此后却因散布了大量错误信息,在上线48小时后火速下线。
而ChatGPT的上线时间则为去年11月30日。也是因此,当ChatGPT爆火时,Yann LeCun还曾评论称,人们对于ChatGPT的态度比对Glacatica更宽容。
填补元宇宙缺口?
Meta入局大语言模型之时,ChatGPT席卷全球的风口不容忽视,但另一个隐藏的背景是,Meta雄心勃勃的元宇宙计划正面临搁浅的风险,而ChatGPT正是带来风险的“罪魁祸首”。
本月早些时候,Meta发布了2022财年全年财报。财报数据显示,2022全年Meta总营收为1166亿美元,同比下降1%;,净利润232亿美元,同比下降了41%;。成本则达到877亿美元,增长23%。被寄予厚望的元宇宙业务仍旧是“烧钱”的大头,元宇宙部门RealityLabs全年亏损额达到137亿美元,亏损同比增长了34.57%。
2021年,扎克伯格将赌注押在了元宇宙上,Facebook也一举改名为Meta。但有媒体报道称,Meta每年在元宇宙相关项目上投入100多亿美元,让情况更糟的是,Meta主营的在线广告收入却在下降。
这些也促成了去年底Meta裁员1.1万人的举措。当地时间2月22日,《华盛顿邮报》还报道称,Meta正在酝酿新一轮裁员,或波及数千名员工,裁员计划可能会在未来几个月内逐渐展开。
元宇宙的生意还没理顺,风头就被ChatGPT抢了个精光。也一度有人猜测,ChatGPT会不会步了元宇宙的后尘。对此,安信元宇宙研究院院长焦娟对北京商报记者分析称,目前AIGC的走势确实如同2021年11月开始的元宇宙行情,但结论比较清晰——AIGC目前看大概率不会昙花一现。
在她看来,AIGC并不是一定需要重构一个新的虚拟时空才能落地生根,在移动互联网的高渗透率基础上,它的运行逻辑是用算力与算法,生产出新的应用场景甚至是内容,它的进程指标是“上算”(相较于“上网”的渗透率),而元宇宙确实需要构建出一个新的时空。
另一方面,AIGC是生产力跟其构建出的生产工具如ChatGPT等,目前看其对互联网时代以来的很多“套路”的替代效应会很明显,即消除信息不对称以及冲击围绕信息不对称的变现方式。而产业内特别看中,除了当下已具足技术跟落地环境,更重要的是它背后的大模型这一技术路径,指向的是斜率越来越陡峭的正反馈效应,契合产业最偏好的规模效应。
这或许可以解释Meta转向AIGC的原因。扎克伯格曾在电话会议上表示,今年重点关注的主题有两个,除了效率之外,新产品领域将是AIGC。
北京社科院研究员王鹏认为,总地的来说,人工智能目前基本能够胜任一些简单的或者说是深度的重复劳动工作,但完成创造性的工作还需要进一步训练优化它的算法。如果这一领域能够继续推动的话,从应用角度和研发角度来说,都将成为深度人工智能非常重要的一个突破。
硅谷的AI团战
红杉合伙人Sonya Huang、Pat Grady曾撰文表示,当下行业正处于生成式AI第四波发展浪潮中——杀手级应用涌现阶段。随着各大平台发展成熟,AI模型继续变得更好、更快、更便宜,越来越多的模型免费、开源,应用层面将出现大爆发。
而Meta的正式加入,也意味着硅谷三巨头在AIGC领域开启了正面的交锋。不久前,谷歌刚刚推出了人工智能聊天机器人Bard,对标的竞品正是ChatGPT。此前,ChatGPT的走红被视为对搜索引擎的最大冲击,而谷歌恰恰是这一领域的霸主。
虽然Bard在演示中的意外“翻车”一度带崩了谷歌的股价,但这一动作传递出的信号已经不言而喻。谷歌在广告中表示,Bard使用谷歌的大型语言模型构建,并利用网络信息。谷歌还将其聊天机器人描述为“好奇心的发射台”,称它有助于简化复杂的话题。
作为ChatGPT“背后的人”,微软更是有效利用了这一波红利,宣布推出由ChatGPT支持的最新版本人工智能搜索引擎Bing(必应)和Edge浏览器。
公开信息显示,2019年,微软向OpenAI投资10亿美元,双方达成协议合作开发“通用人工智能”,同时微软获得将OpenAI的部分技术商业化的权限。今年1月,微软又表示,将对OpenAI进行为期数年、价值数以10亿计美元的投资,有知情人士透露,微软曾讨论向OpenAI投资至多100亿美元。
值得一提的是,微软旗下的OpenAI、谷歌旗下的DeepMind以及Meta旗下的FAIR也被公认为全球领先的三大AI实验室。硅谷三巨头在大语言模型上的对战,不是偶然,而是必然。
不过瑞莱智慧高级产品经理张旭东则从发展的角度提出了一些隐忧。在他看来,算法模型有别于原有的信息系统是因为其具备可以代替人做决策的能力,所以欧美人工智能法提案才会把一些影响公共资源分配、个人前途命运的算法认定为高风险人工智能系统,并提出要进行严格的监管。
“我们认为ChatGPT的深化应用也无法避免这个问题,如何避免ChatGPT等模型尽量少出现如《算法霸权》里描述的加剧偏见与不公的情况出现,将是整个行业都需要重点关注和努力解决的问题。”张旭东称。
北京商报记者 杨月涵