Sora给科技圈带来的冲击还未平静,Claude 3又来了。
近日,被称之为是OpenAI最强竞争对手的AI初创公司Anthropic发布了其最新大模型系列Claude 3。该系列包含三个模型,能力由强至弱分别是Claude 3 Opus(著作)、Claude 3 Sonnet(十四行诗) 和Claude 3 Haiku(俳句)。
Anthropic发布的跑分显示,Opus在多项基准测试中得分都超过了OpenAI和谷歌的大模型,拥有接近人类本科生水平的知识,“在数学、编程、多语言理解、视觉等多个维度树立了新的行业基准”。
据Anthropic官方发布的跑分结果显示,Claude 3 Opus在本科级别专业知识(MMLU)、研究生级别专家推理(GPQA)、基础数学(GSM8K)等领域都处于行业领先水平。
事实真的如此吗?在Claude 3发布后,开源大模型生态社区OpenCSG创始人陈冉进行了试用和测评,在用他的一套方法测试了Opus的逻辑推理、代码等能力后,他认为,Claude 3的整体性能相比OpenAI大模型平均提升了50%以上,包括“幻觉”、正确率和非正确率方面的表现等。
在陈冉看来,此次Anthropic的发布策略很好,一次性推出三个不同性能的大模型,最出色的大模型打分都比OpenAI大模型高,较小的模型打分也不低,而在成本上相对轻量的两个模型会比OpenAI大模型便宜。
Anthropic此次发布的Claude 3 Opus、Claude 3 Sonnet和Claude 3 Haiku分别针对不同的性能需求和成本效益。据介绍,Claude 3 Opus是最智能的模型,可以处理复杂的分析、具有多个步骤的较长任务以及高阶数学和编码任务;Claude 3 Sonnet是性能和速度的最佳组合,可实现高效、大体量的任务;Claude 3 Haiku是最快且最具成本效益的模型,可以执行轻量级操作,具有行业领先的速度。
值得一提的是,此次发布的Claude 3系列模型都支持200k的上下文窗口,Anthropic还特别表示,在这个基础上,所有三个模型都能够接受超过100万tokens的输入,会提供给有特定需要的客户。
对大模型来说,上下文窗口的文本长度越大,意味着其能更好地理解长篇文章或对话。此前,上海人工智能实验室领军科学家林达华表示,有了长语境交互,大模型能够读几百页的财报,将里面一些非常细致的信息精准提取出来形成摘要,或者听一场几个小时的会议转录,并将会议的关键信息摘取出来,对于大模型的落地很有用。
能否与OpenAI一较高下
对于Claude3这次的超越,在惊叹其表现之余,业界没有太多的意外,Anthropic过去一直被视为OpenAI最大的竞争对手之一。
Anthropic的核心团队来自OpenAI,其创始人达里奥·阿莫迪(Dario Amodei)曾是OpenAI的研究副总裁,也是一位与高效利他主义社区有联系的研究员,因对OpenAI的未来方向有一些分歧而离开,并在2021年成立了Anthropic,计划以可信、安全可控的方式发展AI。
Anthropic是目前除了OpenAI之外最被看好的大模型初创公司之一。在过去一年里,Anthropic狂揽约73亿美元的投资,其中,亚马逊、谷歌作为最主要的投资者分别投资了40亿美元和20亿美元,韩国SK电信投资了约1亿美元。就在上个月,Anthropic再次获得7.5亿美元的投资,这笔投资来自于硅谷风投机构Menlo Ventures。
在未来与OpenAI的竞争中,陈冉认为Anthropic的胜面不小。一方面,其团队在算法上与OpenAI几乎没有差距,且Anthropic背后有亚马逊、谷歌这样的靠山,算力方面也并不缺;另一方面,作为背后投资者亚马逊拥有许多生态和场景,相应也能提供很多高质量的数据。陈冉认为,现在大模型竞争最关键的是数据,数据的质量越高越能训练好模型。
对于Anthropic未来是否能和OpenAI一较高下,天使投资人、资深人工智能专家郭涛认为这主要取决于几方面的因素。一方面,持续的研发和创新是保持竞争力的关键。如果Anthropic能够持续推出先进的技术和改进,它有可能在市场上与OpenAI竞争。另一方面,AI大模型的成功不仅取决于核心技术,还取决于能够建立广泛的生态系统和合作伙伴关系。郭涛认为,OpenAI在这方面有着较强的影响力和网络效应。此外,如何在商业模式和市场策略上进行创新和调整,也是决定未来竞争格局的重要因素。
据《第一财经日报》 刘晓洁/文