前言
真是科幻般的进展,新版 Claude 3.5 Sonnet 在深夜上线,已经能够像人类一样操作计算机!它能够查看屏幕、移动光标、点击按钮、输入文本,甚至能够查找代码错误、自动收集信息并填写表格。随着AI推理能力已达瓶颈,AI 操作电脑将成为下一个突破点!
Anthropic 推出了两款新的 AI 模型,推出全新功能
新模型性能
Claude 3.5 Sonnet 相较于前代产品实现了全面改进,尤其在编码方面取得了显著进步,巩固了其在该领域的领先地位。
在SWE-bench Verified编码测试的得分由33% 跃升至 49% ,超越所有目前公开可用的模型。
在多次评估中,Claude 3.5 Haiku 的性能与我们之前的旗舰型号 Claude 3 Opus 相当,且价格相同,速度与上一代 Haiku 相近。
计算机使用
我们还将推出一项突破性的全新功能:计算机使用。
从今天起,开发人员可以通过 API 控制 Claude 以人类的方式操作计算机——查看屏幕、移动光标、点击按钮和输入文本。Claude 3.5 Sonnet 是首个提供计算机使用功能的前沿 AI 模型,目前正处于公开测试阶段。尽管该功能仍处于试验阶段,偶尔会显得繁琐且容易出错,我们提前发布此功能以征求开发人员的反馈,并预计随着时间的推移,该功能将迅速得到改进。
Asana、Canva、Cognition、DoorDash、Replit 和 The Browser Company 已经开始探索这些新可能性,执行需要数十步甚至数百步才能完成的任务。例如,Replit 正在利用 Claude 3.5 Sonnet 的计算机使用和 UI 导航功能,开发一项关键功能,用于在为其 Replit Agent 产品构建应用程序时进行评估。
Amazon Bedrock 上新 Claude 3.5 Sonnet
Anthropic最新推出的 Claude 3.5 Sonnet 模型在 Amazon Bedrock 正式上线
Claude 3.5 Sonnet 新增的“计算机使用”功能现已在Amazon Bedrock上线公测版,赋予使用者引导模型模拟人类行为进行屏幕观察、鼠标移动、点击以及文本输入等操作的能力。由于这项技术仍处于早期阶段,建议用户从尝试低风险任务开始,逐步探索这项强大的新功能。
Claude 3.5 Sonnet 现已在美国西部(俄勒冈州)地区的Amazon Bedrock中上线。
公司介绍
工四科技 是一家前沿技术公司,提供云计算、大数据、信息安全和人工智能解决方案。我们致力于利用创新技术助力企业数字化转型,推动业务增长。我们的业务范围包括:
-
云服务:作为 AWS 和 Akamai 合作伙伴,提供全面的云计算和企业上云解决方案,帮助企业实现高效的云端部署和管理,满足各种规模的业务需求。 -
安全防护:通过安全托管应对未知的网络威胁,通过SOC安全运营中心提供一个全面的网络安全解决方案,集成了资产管理、入侵检测、调查响应、风险防范等多项功能,旨在为企业提供全方位的网络安全保护和管理服务。 -
RPA(机器人流程自动化):通过自动化技术,提高业务流程效率,降低运营成本。 -
PWA(渐进式 Web 应用):开发跨平台的 Web 应用,为用户提供接近原生应用的体验。 -
短信服务:提供全球短信,语音短信,满足企业通信需求