您好,欢迎观临半岛体育官网!

咨询热线:

040-88888888

全球最强大模型易主GPT-4被超越丨看天下

发布时间:2024-04-12 05:03人气:

  全球最强大模型易主GPT-4被超越丨看天下人工智能初创公司Anthropic4日发布Claude 3 新模型家族。该公司声称,Claude 3“已经实现了接近人类的理解能力”——在推理、数学、编码、多语言理解和视觉方面,全面超越GPT-4在内的所有大模型。

全球最强大模型易主GPT-4被超越丨看天下(图1)

  以Claude 3 Opus为例,它在多项AI系统常用评估标准,包括本科级别专业知识(MMLU)、研究生级别专家推理(GPQA)、基础数学(GSM8K),均取得领先业界LLM的性能。

全球最强大模型易主GPT-4被超越丨看天下(图2)

  此外,拒绝回答人类问题方面,Claude 3的进步不止一点点,拒绝回答的可能性显著降低。三款模型都在10%左右,Claude 3 Opus更是达到8%左右。

  同时,跟Claude 2.1相比,Opus在复杂的开放性问题上,准确度直接翻倍提升,错误答案大大减少。

  它就会给出正确的回答:Kindle最初的代号是“菲奥娜”,参考了尼尔-斯蒂芬森的《钻石时代》一书中的人物FionaHackworth半岛·体育网页版入口

  在响应时间上,Claude 3大幅缩短,做到近乎实时。官方介绍,即将发布的Haiku能够在3秒内阅读并理解带有图表的长度约10k token的arXiv论文。而Sonnet能够在智能水平更高的基础上,速度比Claude 2和Claude 2.1快2倍,尤其擅长知识检索或自动化销售等需快速响应的任务。Opus的智能水平最高,但速度不减,与Claude 2和Claude 2.1近似。

全球最强大模型易主GPT-4被超越丨看天下(图3)

  除了“跑分”战胜了GPT-4,在具体模型能力方面半岛·体育网页版入口,Claude 3 和 GPT-4 的差别到底在哪呢?

  首先是多模态理解与处理能力,Claude 3能够处理和理解图像和视频帧输入,从而解决超出简单文本理解的复杂多模态推理挑战。

  在长文本处理方面,Claude 3 模型支持至少1M个 token的上下文,而目前在生产中仅提供最多200ktoken的上下文。在长文档理解、跨文档分析、金融数据分析等方面提供了更详细和可操作的用例。这一点在处理大规模文本数据时,相对于GPT-4可能更有优势,尤其是在需要综合分析和提取大量信息的场景中。

  此外,Claude 3的多语言能力也被Anthropic认为是一大亮点。Claude 3 Opus在多语言数学(MGSM)基准测试中达到了超过90%的0-shot成绩,并在8种语言中实现了超过90% 的准确率,包括法语、俄语、简体中文、西班牙语、孟加拉语、泰语、德语和日语。

  Anthropic在Claude 3系列模型中首次放出了多模态能力,用户可以上传各类非结构化数据如照片、图表等供AI分析。这三个模型均支持200K token的长上下文窗口,并向特定客户开放超过100万token的上下文输入能力。

  Claude发布前月余,业界一直有传闻认为,OpenAI将在Claude 3发布之际,迅速跟进发布最新的GPT-4.5(5),或是秘密研发的 Q* 模型。

  不过就在2月29日,特斯拉CEO马斯克突然对OpenAI提起诉讼,指控OpenAI首席执行官奥特曼为了追求商业利益半岛·体育网页版入口,违背了OpenAI“确保AI造福人类” 的非盈利性初衷。马斯克要求法院强制OpenAI回归开源,并阻止公司及其创始人以及微软等背后支持者从中获利。

  所以,在网友们不停跑去奥特曼社交平台留言,喊他“快点开发GPT-5”时,奥特曼或许正焦头烂额应对马斯克呢。


040-88888888