物联网软件开发公司

物联网软件开发价格 让AI像东说念主类一样操作电脑! Anthropic上新Claude 3.5 Sonnet模子新才调

发布日期:2024-10-29 04:22    点击次数:162

左证Anthropic先容,升级版Claude3.5Sonnet取得了一项改变性的新妙技:或者像东说念主类一样操作电脑。同期,升级版Claude3.5Sonnet模子各项才调均超越之前版块,尤其在代码方面取得了尽头显贵的越过,进一步寂静其行业当先地位。

新款Claude3.5Haiku则在好多评估中与Anthropic之前最大的型号Claude3Opus的性能相匹配,其本钱和速率与上一代Haiku相似。

升级后的Claude3.5Sonnet当今可供所灵验户使用。从今天运行,开采者不错在AnthropicAPI、AmazonBedrock和GoogleCloud的VertexAI上使用预计机测试版进行构建。新的Claude3.5Haiku将于本月晚些时候发布。

升级版Claude3.5Sonnet:超强编码才调,公测“预计机使用”功能

据先容,升级版Claude3.5Sonnet在业界基准测试中发挥超卓,在SWE-benchVerified编码测试的得分由33%跃升至49%,超越总共刻下公开可用的模子。在TAU-bench(评估模子活泼垄断器用和API空洞才调的基准测试)中,其零卖界限得分从62.6%提高到69.2%,航空界限从36.0%提高到46.0%。性能全面升迁的同期,Claude3.5Sonnet的本钱与之前版块保抓一致。

另外,Anthropic早期的客户响应标明,升级后的Claude3.5Sonnet代表了东说念主工智能编码的要紧飞跃。GitLab测试了DevSecOps任务的模子,发现它提供了更强的推理才调(跨用例高达10%),莫得加多延长,使其成为撑抓多圭表软件开采过程的理思礼聘。

同期,Anthropic在Claude3.5Sonnet公测版中引入了一项冲破性的新功能:预计机使用。通过API接入,开采东说念主员不错交流Claude使用预计机,就像东说念主们看屏幕、挪动光标、单击按钮和输入文本一样。

Anthropic示意,Claude3.5Sonnet是第一个在公测中提供“预计机使用”的AI模子。该功能现阶段是实践性的,瞻望跟着时刻的推移,这种才调会马上提高。

Anthropic先容,在“预计机使用”才调上,莫得制作特定的器用来匡助Claude完成个东说念主任务,而是教它一般的预计机妙技,让它或者使用为东说念主类打算的各式模范器用和软件圭表。开采东说念主员不错使用这个新兴功能来自动化重迭经过,构建和测试软件,并推论盘问等灵通式任务。

Anthropic构建了一个API,允许Claude感知预计机界面并与之交互。开采东说念主员不错集成此API,物联网软件开发价格使Claude或者将提示(举例,“使用我的预计机和在线数据填写此表单”)转化为预计机号召(举例,查抄电子表格;挪动光标掀开web浏览器;导航到联系网页;使用这些网页中的数据填写表单等等)。

[扫码下载app,中过数字彩1千万以上的专家都在这儿!]

app

后果方面,在评估东说念主工智能模子像东说念主一样使用预计机的才调的OSWorld上,Claude3.5Sonnet在屏幕截图(screenshot-only)类别中的得分为14.9%,显著高于次佳东说念主工智能系统的7.8%。当提供更多圭表来完成任务时,Claude的得分为22.0%。

不外Anthropic也强调,Claude3.5Sonnet刻下使用预计机的才调并不齐全。东说念主们绝不忙绿地推论的一些操作——转动、拖动、缩放——刻下给齐Claude带来了挑战,饱读动开采东说念主员从低风险任务运行探索。

据悉,Asana、Canva、Cognition、DoorDash、Replit和浏览器公司照旧运行探索这些功能,推论需要几十个以至几百个圭表才能完成的任务。举例,Replit正在使用Claude3.5Sonnet的“预计机使用”和UI导航功能来开采一个关节功能,该功能在为ReplitAgent产物构建应用圭表时对其进行评估。

底下是Claude最新演示的AI操作电脑的视频截图

在这个演示中,Claude浏览了不同的标签页,集会了所需信息,并填写了一个表单,总共电脑操作均由Claude生成。

Claude3.5Haiku:最快速模子

新推出的Claude3.5Haiku是Anthropic下一代速率最快的模子。在与Claude3Haiku相似的本钱和相似的速率下,Claude3.5Haiku在每个妙技集上齐有所提高,以至在好多智能基准上卓越了Anthropic上一代最大的型号Claude3Opus。

Claude3.5Haiku在编码任务上发挥得尤为出色。举例,它在SWEbenchVerified上的得分为40.6%,卓越初代版Claude3.5Sonnet和GPT-4o。

凭借低延长、纠正的提示免除和更准确的器用使用,Claude3.5Haiku相当合适面向用户的产物、特意的子代理任务,以及从多半数据(如购买历史、订价或库存记载)中生成个性化体验。

Anthropic先容,Claude3.5Haiku将于本月晚些时候提供,并随后提供图像输入才调。

Anthropic是由前OpenAI职工创立的公司,亚马逊是Anthropic的伏击投资者。本年3月,亚马逊文书已完成对Anthropic的40亿好意思元投资,以潜入激动生成式AI工夫的发展。

Anthropic于2023年3月发布了Claude3系列模子Claude3Haiku、Claude3Sonnet、Claude3Opus物联网软件开发价格,尔后便按照各型号进行才调升级迭代。本年6月,Anthropic发布最宏大模子Claude3.5Sonnet,领有比较前代模子2倍的推理速率和1/5的调用本钱。(果青)



上一篇:物联网软件开发价格 突发 |蓝罐曲奇因罪状宣传及交易谩骂,败诉抵偿 业内东说念主士:产物力是第孤独分,快消品市集期待良性竞争
下一篇:物联网软件开发资讯 52岁退休金3800进款20万,生病入院没亲东说念主护理:我不离异罗致单过