新闻中心

全球最强大模型易主GPT-4被超越丨看天下

发布时间：2024-04-12 05:03人气：

　　全球最强大模型易主GPT-4被超越丨看天下人工智能初创公司Anthropic4日发布Claude 3 新模型家族。该公司声称，Claude 3“已经实现了接近人类的理解能力”——在推理、数学、编码、多语言理解和视觉方面，全面超越GPT-4在内的所有大模型。

全球最强大模型易主GPT-4被超越丨看天下(图1)

　　以Claude 3 Opus为例，它在多项AI系统常用评估标准，包括本科级别专业知识（MMLU）、研究生级别专家推理（GPQA）、基础数学（GSM8K），均取得领先业界LLM的性能。

全球最强大模型易主GPT-4被超越丨看天下(图2)

　　此外，拒绝回答人类问题方面，Claude 3的进步不止一点点，拒绝回答的可能性显著降低。三款模型都在10%左右，Claude 3 Opus更是达到8%左右。

　　同时，跟Claude 2.1相比，Opus在复杂的开放性问题上，准确度直接翻倍提升，错误答案大大减少。

　　它就会给出正确的回答：Kindle最初的代号是“菲奥娜”，参考了尼尔-斯蒂芬森的《钻石时代》一书中的人物FionaHackworth半岛·体育网页版入口。

　　在响应时间上，Claude 3大幅缩短，做到近乎实时。官方介绍，即将发布的Haiku能够在3秒内阅读并理解带有图表的长度约10k token的arXiv论文。而Sonnet能够在智能水平更高的基础上，速度比Claude 2和Claude 2.1快2倍，尤其擅长知识检索或自动化销售等需快速响应的任务。Opus的智能水平最高，但速度不减，与Claude 2和Claude 2.1近似。

全球最强大模型易主GPT-4被超越丨看天下(图3)

　　除了“跑分”战胜了GPT-4，在具体模型能力方面半岛·体育网页版入口，Claude 3 和 GPT-4 的差别到底在哪呢？

　　首先是多模态理解与处理能力，Claude 3能够处理和理解图像和视频帧输入，从而解决超出简单文本理解的复杂多模态推理挑战。

　　在长文本处理方面，Claude 3 模型支持至少1M个 token的上下文，而目前在生产中仅提供最多200ktoken的上下文。在长文档理解、跨文档分析、金融数据分析等方面提供了更详细和可操作的用例。这一点在处理大规模文本数据时，相对于GPT-4可能更有优势，尤其是在需要综合分析和提取大量信息的场景中。

　　此外，Claude 3的多语言能力也被Anthropic认为是一大亮点。Claude 3 Opus在多语言数学（MGSM）基准测试中达到了超过90%的0-shot成绩，并在8种语言中实现了超过90% 的准确率，包括法语、俄语、简体中文、西班牙语、孟加拉语、泰语、德语和日语。

　　Anthropic在Claude 3系列模型中首次放出了多模态能力，用户可以上传各类非结构化数据如照片、图表等供AI分析。这三个模型均支持200K token的长上下文窗口，并向特定客户开放超过100万token的上下文输入能力。

　　Claude发布前月余，业界一直有传闻认为，OpenAI将在Claude 3发布之际，迅速跟进发布最新的GPT-4.5（5），或是秘密研发的 Q* 模型。

　　不过就在2月29日，特斯拉CEO马斯克突然对OpenAI提起诉讼，指控OpenAI首席执行官奥特曼为了追求商业利益半岛·体育网页版入口，违背了OpenAI“确保AI造福人类” 的非盈利性初衷。马斯克要求法院强制OpenAI回归开源，并阻止公司及其创始人以及微软等背后支持者从中获利。

　　所以，在网友们不停跑去奥特曼社交平台留言，喊他“快点开发GPT-5”时，奥特曼或许正焦头烂额应对马斯克呢。

分享到：

上一篇：半岛体育官网屯昌文化旅游产业蓬勃发展媒体实地探访见证成果

下一篇：推荐新闻 - IT新闻 - 博客园

咨询热线：

全球最强大模型易主GPT-4被超越丨看天下

微信号：WX8888888微信二维码