P4君 云深知网络
谷歌Gemini的推出
激起的不仅是AI大模型的浪
从光模块到交换机行业集体兴奋了
同期推出的还有最新自研芯片TPU v5p
躲在英伟达背后的全球第二大AI芯片巨头!
v5p单芯片不如H100但主打性价比和更强组网能力谷歌自研的OCS与TPU间相互成就
SIGCOMM:谷歌OCS光交换大功告成
TPU架构是标准深度学习ASIC
内置100G速率的ICI接口
从芯片到单板4颗芯片必须上液冷技术
从单板到RackRack内部互联采用Copper
但是Rack之间长距就要用Optical
轮到OCS登场 每个Rack是4x4x4
通过XYZ共48个OCS相连
从Rack到集群
8Rack x 8Group x 644096颗芯片共享256T HBM
液冷之后还需要有专门的CDU单元
换逻辑框图
来看一下OCS的光连接
从这张图可以看到
为什么癌股有几个票很强劲
Major focus on deployability and serviceability谷歌在实践上也是屁股决定脑袋
选择以太放弃IB时说因为有供应风险
但OCS无法普及不也是没有serviceability
早在Cloud 3.0时代
Amin就认为谷歌进入无人区
无所谓十字路口无所谓越过山丘从OCS到Gemini谷歌已经遥遥领先
|