公司资讯

谷歌向微软英特尔全面宣战：首款自研Arm CPU最强大模型公测AI视频对垒Sor

发布时间：2024-04-11 12:36人气：

　　谷歌向微软英特尔全面宣战：首款自研Arm CPU最强大模型公测AI视频对垒Sora昨晚的Google Cloud Next 2024大会上，谷歌接连放出一堆模型和产品王炸：Gemini 1.5 Pro公开可用、上线音频处理能力；代码模型CodeGemma上新，首款自研Arm处理器Axion正式向微软和亚马逊宣战……这次，谷歌要以量取胜。

　　此外，谷歌的AI超算平台也进行了一系列重大升级——最强TPU v5p上线、升级软件存储，以及更灵活的消费模式，都让谷歌云在AI领域的竞争力进一步提升。

　　从OpenAI跳槽的研究员Logan Kilpatrick，也在第一时间转发了Gemini 1.5 Pro的消息。看得出来，他已经是一名真真正正的谷歌员工了

　　但无论如何，它让对大量数据进行本机多模态推理成为可能。从此，多海量的数据，都可以进行全面、多角度的分析。

　　自然而然地，我们可以正式用Gemini 1.5 Pro开发新的用例了。比如AI驱动的客户服务智能体和在线学术导师，分析复杂的金融文件，发现文档中的遗漏，查询整个代码库，或者自然语言数据集。

　　比如，软件供应商思爱普用它来为客户提供与业务相关的AI解决方案；日本广播公司TBS用它实现了大型媒体档案的自动元数据标注，极大提高了资料搜索的效率；初创公司Replit，则用它更高效、更快、更准确地生成半岛体育官网、解释和转换代码。

　　只用文本提示，Imagen就能创作出实时的动态图像，帧率为每秒24帧，分辨率达到360x640像素，持续时间为4秒。

　　最新发布轻量级代码生成模型CodeGemma，采用的是与Gemma系列相同的架构，并进一步在超过5000亿个代码Token上进行了训练。

　　CodeGemma 7B的预训练版本（PT）和指令微调版本（IT）在理解自然语言方面表现出色，具有出众的数学推理能力，并且在代码生成能力上与其他开源模型不相上下。

　　CodeGemma 2B则是一个SOTA的代码补全模型，可以进行快速的代码填充和开放式生成。

　　CodeGemma的训练数据包括了来自网络文档、数学和代码的5000亿个Token（主要是英文）。

　　2B规模的模型完全使用代码进行训练，而7B规模的模型则采用了80%编程代码外加20%自然语言的方式。

　　为了确保数据的质量，谷歌对数据集进行了去重和过滤，移除了可能影响评估的代码样本和一些个人或敏感信息。

　　此外，谷歌还对CodeGemma模型的预训练采用了一种改进的中间填空（Fill-in-the-Middle, FIM）方法，以此来提升了模型的训练效果。

　　通过让模型接触各种数学问题，可以提升它在逻辑推理和解决问题方面的能力，这对编写代码来说是非常重要的。

　　为此，谷歌选用了多个主流的数学数据集进行监督微调，包括：MATH、GSM8k、MathQA，以及合成数学数据。

　　在代码方面，谷歌采用了合成代码指令的方法来创建数据集，用于后续的监督微调（SFT）和基于人类反馈的强化学习（RLHF）之中。

　　如表2所示，CodeGemma 2B在代码补全场景下展现出了卓越的性能，尤其是在低延迟的表现上。

　　进一步地，如表5所示，CodeGemma在数学推理方面，相比同等规模的模型有着更出色的表现。

　　如图4所示，在进行代码补全任务时，比如函数补全半岛体育官网、注释文档字符串生成或者导入模块建议，应当按照一定的格式来设计输入提示。

　　据称这款CPU处理器Axion，将提供比英特尔CPU更好的性能和能源的效率，其中性能提高50%半岛体育官网，能源效率提高60%。

　　新CPU Axion，显然是谷歌跟随亚马逊AWS和微软Azure的动作——它也想自研处理器了。

　　Axion将帮助谷歌提高通用工作负载的性能，比如开源数据库、Web和应用程序服务器、内存缓存、数据分析引擎、媒体处理和AI训练。

　　由此，谷歌在开发新的计算资源方面，又向前迈进了一步。在今年晚些时候，Axion就可用于云服务了。

　　对于AI军备竞赛来说，像Axion这样的CPU至关重要，因为它能提升训练AI模型所需的算力。

　　众所周知，购买AI芯片的成本惊人，英伟达的Backwell芯片，预计售价在3万美元到4万美元之间。

　　不仅如此，原本在使用Arm的客户，无需重新架构或者重写应用程序就可以轻松地迁移到Axion上来。

　　在此次Google Cloud Next 2024年会上，谷歌宣布：对自家超算平台进行大规模升级！

　　升级列表中的第一位，就是谷歌云的张量处理单元TPU v5p了。如今，该定制芯片全面向云客户开放。

　　作为下一代加速器，TPU v5p专门用于训练一些最大、最苛刻的生成式AI模型。其中，单个TPU v5p pod包含8,960个芯片，是TPU v4 pod芯片数量的两倍之多。

　　另外，谷歌云还将和英伟达合作加速AI开发——推出配备H100的全新A3 Mega VM虚拟机，单芯片搭载高达800亿个晶体管。

　　而且谷歌云还会将英伟达最新核弹Blackwell整合进产品中，增强对高性能计算和AI工作负载的支持，尤其是以B200和GB200提供支持的虚拟机形式。

　　虽然现在万亿参数的模型还不多（少量几个选手是SambaNova和谷歌的Switch Transformer），但英伟达和Cerebras都在冲万亿参数模型硬件了。

　　在软件方面，谷歌云推出了JetStream，这是一款针对LLM的吞吐量和内存优化了的推理引擎。

　　这个新工具可以提高开源模型的单位美元性能，并与JAX和PyTorch/XLA框架兼容，从而降本增效。

　　此外，谷歌的存储解决方案也在不断升级——不仅加速了AI训练和微调，优化了GPU和TPU的使用，还提高了能效和成本效益。

　　此次，谷歌推出的Hyperdisk ML，显著缩短了模型加载时间，提高了吞吐量，并对AI推理和服务工作负载进行了优化。

　　不仅支持每个存储卷承载2,500个实例，而且还提供了高达1.2TiB/s的数据吞吐量，性能直接超越微软和AWS。

　　已发布的Cloud Storage FUSE，可将基础模型的训练吞吐量提高2.9倍，性能提高2.2倍。

　　高性能并行文件系统Parallelstore可将训练速度提高到3.9倍，并将训练吞吐量提高到3.7倍。

　　而专为AI模型量身定制的Filestore系统，允许在集群中的所有GPU和TPU之间同时访问数据，将训练时间缩短56%。

　　总之，此次谷歌超算的大规模更新表明，谷歌在努力为客户带来实际的商业利益，创建无缝集成、高效可扩展的AI训练和推理环境。

分享到：

上一篇：半岛体育大模型时代如何闯出一条中国式自主发展之路？

下一篇：什么才是AIGC营销赚（省）钱的关键？

咨询热线：

谷歌向微软英特尔全面宣战：首款自研Arm CPU最强大模型公测AI视频对垒Sor

微信号：WX8888888微信二维码