通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  少尉

注册:2015-11-142
跳转到指定楼层
1#
发表于 2024-12-26 09:04:04 |只看该作者 |倒序浏览

倒是没想到,12月过半,各家大模型厂商和在冲刺KPI似的,好消息一波接着一波。

前脚大模型六小虎之一的智谱刚完成新一轮30亿的融资;后脚字节跳动发布豆包视觉理解模型、快手可灵1.6正式上线。

如果说2023年是大模型元年,那2024年就是AI的应用年。

从深度推理成为主流、AI Agent成新风口,多模态模型竞相出现,AI产品迭代速度之快,以至于我们常常忽略,从爆发至今,国内AI领域的发展其实还不到2年。

AI一年,人间十年。

但这个被视为互联网变革级别的产品,却至今都还没迎来爆发时刻。



算力不是护城河

直到今年上半年,国内市场聊大模型发展,最核心的决定要素和关注焦点还是在算力。百模大战如火如荼的那一年,想通过卷参数来迅速占领市场份额,曾是如今走在前列的几个大模型的来时之路。

但从今年开始,关于国内外大模型卷不动了的声音越来越大,特别是下半年以来,我们已经很少听到哪个大厂又推出了什么大模型,这并非意味着百模大战就要迎来终局,而是各家大厂正清楚地意识到,随着整个行业的快速迭代,仅靠算力和参数规模的提升已经难以真正超越同行。

再加上大模型的训练和运营需要大量的算力和资金投入,且这种投入需要持续进行,这对现阶段还难以走通商业模式的大模型厂商来说,显然是一大挑战。



以字节为例,据证券时报报道,仅2024年,字节在AI上的投入就达到800亿元,几乎达到了BAT三家资本开支的总和。最新消息显示,其2025年资本开支将达到惊人的1600亿元,其中约900亿人民币将用于AI算力的采购。

就连ChatGPT也一直被算力紧缺所困扰。澎湃新闻曾报道,微软用几亿美元,耗费上万张英伟达A100芯片打造超算平台,只为给ChatGPT和新版必应提供更好的算力。不仅如此,微软还在Azure的60多个数据中心部署了几十万张GPU,用于ChatGPT的推理。



实际上,从长远角度来看,算力并不能构成真正的护城河,它更多地体现为硬件层面的核心竞争力。众所周知,谁的算力更强,训练语料更丰富,谁的模型表现就更好。算力依赖于GPU性能和数据中心建设,训练语料依赖于公开的数据集。但归根结底,两者都取决于经济实力。

早在去年,谷歌内部讨论如何应对 ChatGPT时,就有工程师表示:“我们没有护城河,OpenAI 也没有。”他认为,即使谷歌全力投入,可能也赢不了这场 AI 竞赛。不仅谷歌赢不了,OpenAI 也赢不了。



图源:全球知名半导体行业研究咨询机构SemiAnalysis


其中他指出,开源AI模型发展之迅速,使其很难形成强技术壁垒,即使现阶段其大模型的数据质量仍然稍有优势,但差距正在惊人地迅速缩小。特别是开源社区的创新和快速迭代能力,使得Google和OpenAI难以保持技术优势。

目前AI行业想要获得领先优势和垄断利润,极其困难。

这也是目前国内大模型的现状,各公司的模型有强有弱,但是核心功能普遍同质化,替代品很多。模型之间的差异性目前看来并不具有决定性。

某厂商推出的新功能,其他厂商可能很快就能赶上。Kimi最初虽然自己没有内部数据,靠的也是调别人的搜索结果,但靠着长文本,也成功进入了国内AI大模型的第一梯队,但如今长文本已然成为大多数AI搜索产品的基本能力。

而值得注意的一点是,训练材料容易来着同一个池子,大家都能用。文小言跑的是百度的数据,Kimi也能获取。这就会导致个别大模型在算力和训练语料上的竞争优势也在减弱。

《大模型落地与前沿趋势研究报告》就直接表示,互联网时代应用有很多关键要素可以构建护城河,包括数据飞轮、网络效应、迁移成本、规模效应、用户心智等,但已经不再适用大模型的业务模式。

目前为止大模型的业务模式仍没有清晰护城河。

AI应用想要跳出包围圈

下半年开始,AI领域的关键词开始从“模型层”落到“应用层”。

华尔街明星基金经理Cathie Wood曾表示,基础设施建设的阶段,硬件厂商往往表现出更大的增长空间,但一旦这个阶段完成,市场的关注点就会转向软件,转向应用。

过去一年,国内各家大模型厂商在通用场景的模型能力其实是缺乏辨识度的,虽然细分技术方向众多,例如Kimi早期的长文本,AI搜索产品主打的深度推理、近期开始起风的多模态,包括最近热门的视觉大模型。

但同质化严重早已是AI产品们头顶高悬的达摩克里斯之剑。



12月18日,豆包视觉理解模型正式发布,主要聚焦在图片内容识别能力、理解和推理能力以及视觉描述与创作能力上,媒体声量轰轰烈烈,但事实上就在两天前,Kimi 才刚刚发布了Kimi 视觉思考版,针对的还是基础科学领域的图片理解、推理能力。

正如上文所述,既然技术上没有护城河,那如果从应用场景角度进攻,能否找到破圈点呢?

大模型始终是个底座,想要真正看到爆发点,是要让AI真正和普通人强相关,此前就有业内人士指出,未来能否出现杀手级别的应用,将会是各家决出胜负的关键。

正如李彦宏多次强调,“没有(AI)应用,基础模型一文不值。”

杀手级应用的出现会带动技术在更多领域的应用和拓展,形成新的应用场景和商业模式。例如,3G网络的发展中,iPhone作为杀手级应用,不仅推动了智能手机的普及,还催生了移动互联网的各种应用和服务。

那AI应用能不能催生出下一个iPhone时代,至少2024年,我们还看不到火花。



直到现在,网上关于不同AI应用在聊天、文生图、图生视频上的使用体验的测评还是很多,你几乎很难在第一时间告诉别人,同类型的AI产品中,哪个才是最好的。

即使作为普通用户确实会觉得AI搜索产品的兴起对原有的搜索体系的冲击非常强,但目前来看,还没有一家公司在市场感知和搜索量方面展现出压倒性的优势,形成类似“不懂就百度一下”或“遇事不决小红书”的强势心智占领。

尽管AIGC技术在某些领域取得了进展,近期快手就联手贾樟柯、李少红等国内知名影视工作者,与AIGC创作者合作,用可灵生成电影短片;在独立游戏领域AIGC也已得到广泛应用,部分大型游戏公司正开始逐步推进工业化的AIGC美术流程。



但整体上AIGC仍处于发展阶段,生成内容的质量、稳定性和可控性等方面仍存在不足,再加上AIGC的应用场景相对有限,且多为辅助性工具,未能形成独立且广泛的应用场景,难以满足大规模用户的需求。

而即使落到硬件端,以手机大模型为例,也不免出现同质化的情况。

目前,AI手机在实际的AI体验上,主要变化还是在语音交互、图像处理和通话增强。

为了实现所谓的AI手机,几乎所有头部手机厂商都在对语音交互进行升级,号称要将之前的语音助手打造成更智能的AI Agent,除了智能对话之外,信息检索、文本创作、文生图这些已经是豆包、Kimi等AI助手的基本操作的功能,也成为了AI手机的噱头之一。

但正如创新工场联合CEO汪华所言,现在整个 AI 才出来一年半的时间,大家就指望 AI 的产品形态就被探索出来,再快,也快不到这个地步。真正做应用,从明年初才有最基本的基础。

商业化着急不得

事实上,AI应用之所以受到如此重视,一个重要原因是市场亟需看到AI技术能转化为可落地的商业模式。

随着大量资金涌入AI领域,投资者对AI项目的回报要求越来越高。他们希望AI企业能够尽快实现技术的商业化应用,以实现投资的增值。

今年9月,红杉资本合伙人Pat Grady才指出,红杉资本在人工智能领域的投资重心正在向应用程序开发倾斜。他表示,红杉资本预计未来数十亿美元级的人工智能公司大多数将来源于应用层,而非传统的基础模型构建。这一转变预示着,未来我们也将看到更多技术创新与实际应用结合的AI应用。



值得注意的是,据智能涌现独家消息,有知情人士透露,虽然豆包的用户规模在过去几个月有所增长,但和行业里所有AI对话形态的产品一样,其在使用时长、打开频次及商业化潜力上仍不够理想。

文章指出,字节管理层判断AI对话类产品可能只是AI产品的“中间态”,长期更理想的产品形式,大概率需要更视觉化的用户体验、更低的用户使用门槛。因此,字节已经提升了即梦的产品优先级,尝试用新的路径打造AI时代的“抖音”。

该消息暂未得到字节回应。

众所周知,在AI产品的开发应用上,字节并没有先发优势。2023年8月,豆包正式推出,这距离百度在3月发布文心一言,已过去近半年。

但靠着实打实的钞能力,豆包APP 11月份的月活已经达到近6千万,保持 10% 以上的增速。目前,在国内AI原生应用(APP)中,豆包早就是遥遥领先的第一名,排在其后面的是1299万月活的文小言,1282万月活的Kimi。(数据来源:AI产品榜)



截至今年10月,国内AI原生应用(APP)中,豆包以1.08亿的累计下载量位居第一,第二名是累计下载量为2260万次的文小言。

而在今年2月,豆包的访问量也才173万。短短三个季度,MAU就翻了近35倍,作为目前国内用户最多的ToC AI产品,豆包的用户增长空间应该是更大,而非不够理想。

如果仅从盈利模式来看,AI搜索类产品能触及的模式无非就是付费订阅和广告。前者的市场在国内一直以来就是出了名的难走通,为强行增加adload显然也会极大的打击到用户的使用体验。想靠对话类AI产品来赚钱确实有一定压力。

文章指出,豆包的对话轮次、时长等关键指标仍然不够理想。但事实上,不管是AI搜索还是其更高形态的AI Agent,这种工具类提效产品对大众消费市场来说本就不算刚需。

一定意义上来说,AI搜索类产品作为生成式大模型在C端落地后最拿得出手的产品,其更大的作用是样本收集场景,而不是赚钱的场景。

对字节来说,在对话类产品中去强化自身语料、文生图训练的能力,形成生态链,为后续以更加体系化的方式为字节的AI生态打开更大的商业空间才更具生命力。



只要有活跃的用户、有可持续的使用价值,AI对话类产品的重要性就仍然存在。而事实上,纵观目前其他对话类产品,字节的友商们也没那么着急去把对话类AI当作商业化的重要组成。

此前百度副总裁、移动生态商业体系负责人陈一凡在谈及生成式AI的商业场景时就曾表示:“我们没有那么着急地要把所有流量在一时间都释放出来,我们希望真正满足用户的需求,所以我们的机制也会升级,会把整个问答的内容质量和整个智能体对话的质量作为排序里的重点,只有先满足用户需求,才能更好地满足商业需求。”。

回顾上一代移动互联网级别的创新,从2008年APP Store的推出为移动应用提供了平台,直到2012年手机操作系统生态圈全面发展,智能手机规模化应用才真正爆发。

移动互联网这条路走了5年,而如今AI技术 只用了不到2年,就已经让我们看到了质的飞跃。或许2025年,我们就能看到下一个iPhone时代拐点的到来。

参考资料:《大模型落地与前沿趋势研究报告》量子位智库《AI 没有护城河》科技爱好者周刊《对话汪华:现在的模型,还是支撑不了,大体量的免费商业模式》AI产品榜《豆包视觉理解模型正式发布,价格狂砍 85%》有新Newin


来源:36kr

举报本楼

本帖有 2 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-12-27 09:30 , Processed in 0.211120 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部