40 多个大模型千帆过尽後,最具大语言模型土壤地位的中国科技公司字节跳动,仍然没有公布自研大语言模型的进度表。
所有人都在关心字节跳动开发大语言模型的进展,它却沉默不语,最新消息只是辟谣140万美元天价年薪挖角OpenAI团队研发成员的传闻。但字节跳动对大语言模型如此低调,更显出旗下火山引擎有多张扬。
粗暴的计算题
与所有云端厂商一样, 大语言模型竞争是存在感不强的火山引擎现在最想讲的故事。不久前火山引擎第一场发表会,总裁谭待抛出一番「七成大语言模型使用者都在火山引擎」言论,但因没有同行做过统计,於是不自研大语言模型的火山引擎,突然成为离众人最近的一朵云。
「七成大语言模型客户」这说法像极飞书「先进企业,先用飞书」口号,第一次出现在火山引擎发表会的MiniMax就是後者希望建立的「先进企业」标竿,这拥有三个自研foundation model(基础模型),短短四个月完成Glow──针对大众的AI虚拟社交App──的目标百万用户团队,是业界人士看好中国少数能完成大语言模型甚至AGI的新创之一。
MiniMax显然是七成中最重要的客户,但谭待发言露出明显仓促感:「等MiniMax把大语言模型做好,我们会和他们一起开发对外服务。」换句话说,火山引擎招揽大量大语言模型客户合作的想法很像AWS,尽可能在研究早期拉拢客户,再等着会否出现下一个Stability.ai或Anthropic。
只不过这「七成」中,也不乏崑仑万维这种市场警告多次的「先进企业」。
崑仑万维4月10日宣布推出大语言模型「天工」3.5,喊着「对抗ChatGPT」、「中国第一个真正实现智慧涌现」的国产大语言模型口号,首次直播展示时却发生表格统计这种低阶错误,且一直遭市场怀疑有蹭ChatGPT炒作之嫌,3月和4月连续收到深交所关注函和监管函。但股价近月翻了一倍。
中国大语言模型概念股的早期泡沫随着AI一起出现,东方财富「ChatGPT」区块2月初只有29支股票,短短两个月就超过60支。
「早期」本身就代表不确定性,火山引擎强调的「七成」更像空中楼阁。谭待解释这数字怎麽来的也很简单:「火山引擎的大语言模型客户数为分子,以市面某大语言模型名单当分母,结果就是70%。」
但多少公司转瞬即逝,又有多少能为火山引擎增长背书,现在都没有答案,甚至因火山引擎力推多云架构,是否只要部分使用火山引擎者就算云上部署大语言模型的客户,都不清楚。
火山引擎在急什麽?
即便知道现在做计算题太简单粗暴也为时尚早,火山引擎也要把握空窗期。一方面是竞争越发激烈的云端市场,火山引擎不算老人也不算新人,但想当中国「第四朵云」显然遥遥无期。
中国企业级SaaS市场规模从2018年开始三年近50%增速,火山引擎2020年上场,从SaaS层产品和行销端进入市场,并几年内快速建立形象:
2021年火山引擎第一次发表云端基础、影片及内容行销、数据中台、开发中台、人工智慧等五大类78项服务全系列产品。这年火山引擎地位几乎与抖音、飞书等平行,也是第一次触及IaaS级云端服务。
高升至字节跳动六大BU一年後,2022年火山引擎云端服务涉及领域确定为金融、汽车、消费、文娱、医疗、通讯传媒六大行业,基於云端底座推出一系列产品解决方案, 企业上云与智慧行销为核心方向。
也是2022年开始,火山引擎开始细化「影音云、内容云」等SaaS产品,并用「火种计画」、「灯塔计画」等招揽新长尾使用者。但这场围绕SaaS的快速布局,艾瑞谘询报告显示,中国SaaS市场规模增速2021年就降至不到40%,隔年进一步跌到9.5%。
虽然中国IaaS+PaaS市场增速近年同步放缓,但2022上半年仍维持超过30%增速,代表中国云端市场仍以IaaS+PaaS为主。SaaS先行,IaaS+PaaS跟进策略切入云端市场的火山引擎,三年过去却没有预期增长快速。
IDC的2022下半年中国云端市场调查,阿里云、腾讯云、华为云、中国电信及AWS合计在中国IaaS及IaaS+PaaS市占率里就占约73%,火山引擎只是藏在不到三成的「Others」内。
中国核心云端商,阿里云有最完整产品布局,且占据中小企业云端市场;华为云的政界领域优势明显;腾讯云背後有微信靠山,且火山引擎最擅长的影音解决方案领域,2021年就涵盖中国90%此类用户。
三年後,火山引擎的模样仍不够清楚。
而火山引擎的定位问题在整个字节跳动ToB策略上弹跳,ToB业务几乎都是从服务字节跳动本身业务开始讲故事,如飞书:
也如火山引擎:
这故事前期逻辑顺畅,字节跳动的效率标签也够有说服力,但字节跳动本身属性及业务形态自然为火山引擎预设了框架,而现在框架变成桎梏。火山引擎早期选择SaaS层服务避开基础设施苦战,是出发时优势,云端原生技术及数据驱动的技术路线也经字节跳动大量验证──以前是头条,现在是抖音。
但这引发火山引擎更大焦虑:困境背後是字节跳动这家公司的变化,越来越像完全由抖音驱动的网路公司。这深刻塑造火山引擎业务,是成就也是限制。
仅四年就突破6亿日活跃用户的抖音今天是字节跳动几乎所有新业务(直播、电商、本地生活等)的起点,同样影响火山引擎产品运算方向,如侧重行销能力的汽车云,应付影音化需求的SaaS产品视频云,强调内容创作到行销及经营全流程的内容云等。
但火山引擎从抖音出发的产品策略并没有太多优势。
「除非火山引擎有跨越时代的云端技术,且恰好有很多公司需要,不然我们不会破坏现在稳定的云端架构。」某国企技术部经理去年对媒体表示。他看衰火山引擎的原因就是网路属性太强,这回答恰好打中字节跳动ToB业务错位的痛点。
火山引擎目前主要客户仍来自网路业,无论最近推动的内容云或视频云,或字节跳动推崇的A / B测试DataTester,本质上火山引擎服务完全针对网路企业云端服务,是基於字节跳动的网路公司背景,但云端市场有更多传产客户。更泥泞的云端服务场景,如生产时只要求效率,没有太多网路公司视角的技术驱动精英逻辑,只有务实、谨慎和巨大转移成本。
对更「传统」的云端需求来说,火山引擎的效率标签没那麽重要,甚至字节跳动都是没有太多参考价值的公司──跳出纯网路公司框架,火山引擎才能解放,许多同行都能证明。对手纷纷以各种云端业务以外集团业务深入敌阵,火山引擎的ToB领域却缺少後发者的着力点。
当火山沿用字节跳动一切toB业务逻辑:体内孵化验证,然後推向市场,却发现放眼望去,字节跳动ToC业务,教育版图短期难扩,游戏业务进展不顺,TikTok云端限制重重,除火山引擎外的五个BU死了四个,还是抖音独大。
景况似乎陷入死循环,与依赖抖音取得云端计算的优势相比,今日火山引擎显然更期待大语言模型的彻底改革。但就像缺席发表会的字节跳动大语言模型,中国早进入AI大战,字节跳动却迟未推出明确的大语言模型技术和商业模式。
过去字节跳动以扁平化组织和快速反应着称,现在看来动作迟缓到难以想像。因字节跳动已彻底不同:两年前业务线BU化改革後,字节形成不再扁平的结构,在中国各新业务增长困境下,逐渐演化成以大抖音为超级核心的单脚模式,无论重点开拓的本地生活战线,还是并购的外部团队,以及遇到困境的现有业务,寻找解套方法时,都只能靠抖音有高大壁垒的成熟业务,和流量为核心的既有资源。
待在堡垒继续挖宝的诱惑有多大,快速行动抓住充满挑战的新机遇的动力就有多低。看着微软Azure和OpenAI相互成全、阿里云和百度云争相用自家大语言模型吸引新客户,火山引擎哪怕仓促,也要用简单粗暴的计算题定位自己,透过「催熟」外部代表性路线来刷存在感,因它知道只能靠自己抓住机会了──别人的延迟满足,就是自己的时不再来。…