您好,欢迎观临半岛体育官网!

咨询热线:

040-88888888

半岛体育苹果放大招!新模型Ferret-UI将颠覆AI交互?

发布时间:2024-04-11 16:46人气:

  半岛体育苹果放大招!新模型Ferret-UI将颠覆AI交互?【ITBEAR科技资讯】4月11日消息,苹果近日发布了最新的多模态大语言模型Ferret-UI,该模型专为理解和与移动UI屏幕交互而设计。Ferret-UI在所有基本UI任务上的表现均超越了GPT-4V,显示出了卓越的理解和交互能力。

半岛体育苹果放大招!新模型Ferret-UI将颠覆AI交互?(图1)

  据ITBEAR科技资讯了解,Ferret-UI作为一种新的多模态大型语言模型(MLLM),具备指向、定位和推理等多重功能,能够有效理解和交互移动UI屏幕上的信息。它通过灵活的输入格式和基础任务,在移动用户界面屏幕上执行各种引用任务。Ferret-UI的一个显著特点是“任何分辨率”技术,通过放大细节来解决UI屏幕中小型对象的识别问题,从而提升了对UI元素的理解精度。

半岛体育苹果放大招!新模型Ferret-UI将颠覆AI交互?(图2)

  此外,Ferret-UI不仅能够在详细描述和感知对话中讨论视觉元素,还能在交互对话中提出目标导向的动作,并通过函数推理来推断屏幕的整体功能。研究人员为了增强模型的推理能力,特别编译了用于高级任务的数据集,包括详细描述、感知/交互对话和函数推理等方面的数据。

  在基础任务性能的比较上,Ferret-UI展现出了对UI屏幕的出色理解能力以及执行开放式指令的能力。这项技术的掌握使得AI能够像人类一样进行交互,预示着苹果未来可能将改变MLLM的游戏规则。

  通过独特的模型架构和数据集训练方法,Ferret-UI实现了对移动UI屏幕的深入理解和有效交互,为用户带来了更为智能和便捷的操作体验。这一技术的突破,无疑将推动科技行业向更智能化、人性化的方向发展。

  【ITBEAR科技资讯】4月11日消息,Meta Platforms于近日发布了其专为AI工作负载设计的定制芯片系列——训练与推理加速器项目(MTIA)的最新版本。据Meta官方介绍,新一代MTIA相较于初代,在性能上有了显著的提升,这种提升特别有助于加强内容排名和推荐广告模型的效果。新

  【ITBEAR科技资讯】4月10日消息半岛体育,谷歌公司近日发布了CodeGemma先进大语言模型(LLMs),旨在为全球开发人员提供高质量的代码辅助工具,专注于生成代码、理解和追踪指令等功能。CodeGemma作为Gemma模型的开放访问系列,针对代码开发场景进行了优化和微调。该套件包含三种不

  【ITBEAR科技资讯】4月10日消息,近日,知名科技媒体theinformation透露,Meta公司正计划在下周预告两款新的Llama 3 AI模型,此举旨在为今年夏季推出的“完整形态”Llama 3做铺垫。在本周二于伦敦举办的一场活动中,Meta公司确认将在下个月之前发布与Llama 3相关的模型

  【ITBEAR科技资讯】4月10日消息,近日,人工智能领域的两大巨头OpenAI和Meta宣布,他们即将推出全新的人工智能模型半岛体育,这些模型不仅将具备强大的推理和规划能力,更被认为是实现超人认知的关键步骤。这些新型模型的问世,无疑将为生成式人工智能应用注入强大的动力。OpenA

  【ITBEAR科技资讯】4月10日消息,近日,Arm公司CEO雷内·哈斯发出警告,指出随着人工智能技术的不断进步,如果我们不致力于提高能效,AI数据中心的电力消耗将会急剧攀升。据哈斯透露,目前美国AI数据中心的耗电量已经占到了整个电网的4%,然而,这一比例预计到2030年可

  【ITBEAR科技资讯】4月10日消息,墨芯人工智能公司,这家以稀疏计算技术为专攻的创新型企业,近日连续完成了A+轮和B轮各数亿元的融资。这次融资的成功,无疑为墨芯注入了强大的动力,标志着市场对其独特技术和商业模式的高度认可。墨芯人工智能以其差异化的稀疏计算技术

  【ITBEAR科技资讯】4月10日消息,随着科技的不断发展,办公方式也在逐步变革。过去,文档、电子表格和幻灯片等传统办公工具一直占据着主导地位,然而现在,谷歌却带来了一款全新的应用程序——Vids,旨在让用户制作协作可共享的视频变得更加轻松便捷。Vids是一款融合了

  【ITBEAR科技资讯】4月10日消息,前阿里首席AI科学家贾扬清近日在推特上向大家介绍了一款名为Elmo的插件。此款插件能在短短10秒内总结Google Next主题演讲,将其精炼为一句话概括、摘要以及主要观点。Elmo是由贾扬清去年创立的AI公司Lepton AI精心打造的。据贾扬清透露

  【ITBEAR科技资讯】4月10日消息,OpenAI今日声明,已向开发者广泛开放了其全新的GPT-4 Turbo with Vision模型,这一模型在继承了GPT-4 Turbo系列的特点的同时,首次引入了视觉理解能力半岛体育。这一视觉增强的GPT-4 Turbo模型,不仅维持了原系列128,000个token的窗口大小和截止

  【ITBEAR科技资讯】4月9日消息,最新数据显示,全球独角兽企业数量再创新高,达到接近1500家。这些企业中,金融科技、软件服务和人工智能等领域的独角兽企业占据了三分之一的比例,显示了这些领域的强劲发展态势。中国作为全球独角兽企业的重要阵地之一,共拥有340家独

  【ITBEAR科技资讯】4月9日消息,尽管OpenAI创始人Sam Altman已经多次透露了与GPT-5相关的消息,但与OpenAI创始人的野心相比,眼下最棘手的问题是ChatGPT的一群忠实用户们正在发现GPT-4正在变得越来越「懒」。所谓的「变懒」指的是ChatGPT的个人用户体验。近期,在OpenAI

  【ITBEAR科技资讯】4月9日消息,近年来,模型规模不断扩大,一种普遍的信念是“力大砖飞”。尽管OpenAI没有公布Sora的训练细节,但在其技术报告中提到了:最大的模型Sora能够生成一分钟高保真视频,这表明扩大视频生成模型是构建通用世界模拟器的有前景途径。然而,谷歌

  【ITBEAR科技资讯】4月9日消息,联发科在今日盛大举行的生成式 AI 论坛中,正式发布了其全新的生成式AI服务平台——MediaTek DaVinci,该平台亦被亲切地称为“联发科技达哥”。自其问世以来,已吸引了超过40家厂商踊跃加入其生态系统,共同探索AI技术的新边界。MediaTek

  【ITBEAR科技资讯】4月9日消息,清明节前,电商平台迎来了一股独特的潮流,一位名为庞立的人工智能专业研究生在这个时机注册了一家店铺,专门提供AI“复活”服务。据庞立透露,今年大型模型应用与数字人训练平台技术都有所升级,结合最近AI“复活”话题的火爆,他决定进

  【ITBEAR科技资讯】4月9日消息,联发科近日推出了全新的生成式AI服务平台——MediaTek DaVinci,该平台也被业界亲切地称为“联发科技达哥”。据悉,该平台自推出以来,已成功吸引了20余家高科技厂商、10余家消费品牌、6家金融业机构、3家电信企业以及5家传统产业企业加

  本网站LOGO小熊标志受版权保护,版权登记号:鲁作登字-2015-F-025467,未经ITBEAR官方许可,严禁使用。


040-88888888