第A08版:科创 上一版   
下一篇

国产大模型掀起长文本竞赛

青岛财经日报/首页新闻讯 近日,国内多家企业相继宣布开放其AI大模型的长文本处理功能,开启国内技术竞赛新篇章。

AI大模型创业公司北京月之暗面科技有限公司(以下简称“月之暗面”)旗下Kimi产品200万字长文本处理功能的推出引起了广泛关注,阿里巴巴通义千问、百度文心一言以及360智脑随后跟进,展示了中国AI技术的迅速进步和巨大潜力。

Sora风头未过,Kimi又登场。

3月18日,月之暗面宣布其对话式AI助手产品Kimi智能助手已支持200万字的无损上下文输入。在去年10月发布时,Kimi可支持的无损上下文输入长度为20万字。

与此同时,月之暗面还为Kimi智能助手提供了更多数据源。月之暗面工程副总裁许欣然表示,当面对一个问题时,Kimi智能助手会尝试从不同的方向搜索并据此做出回答。在回答速度上也有提升。基于Infra层的优化,Kimi智能助手生成速度较去年10月份提升了三倍。

目前,Kimi智能助手已上线了网页版、安卓、iOS、小程序应用。据SimilarWeb数据显示,Kimi智能助手网页版于今年2月的访问量为291.9万人次,比上月增长104.99%。

提升上下文长度也存在一些技术路线,如基于检索增强的RAG(检索增强生成)、滑动窗口,但是这些方法在提升上下文长度的同时往往也会带来诸如智能水平下降、成本提升等负面效果。

至于月之暗面的解决办法,月之暗面创始人杨植麟此前曾表示主要在两方面,一是创新网络结构,二是进行工程优化。许欣然进一步表示,上下文长度的无损提升需要在数据、Infra、模型训练、产品等层面协同合作才能实现,此次团队从模型预训练到对齐、推理环节均进行了原生的重新设计和开发。

超长文本输入能做什么

支持200万字超长无损输入,这意味着大模型能做什么?月之暗面表示,过去要10000小时才能成为专家的领域,现在只需要10分钟,Kimi就能接近任何一个新领域的初级专家水平。用户可以跟Kimi探讨专业领域的问题,让Kimi帮助自己练习专业技能,或者启发新的想法。

比如,用户可上传一份近百万字中医诊疗手册,Kimi可以针对用户问题,给出诊疗建议。

杨植麟表示,通往通用人工智能,无损的长上下文将会是一个很关键的基础技术。历史上所有的模型架构演进,本质上都是在提升有效的、无损的上下文长度。上下文长度可能存在摩尔定律,但需要同时优化长度和无损压缩水平两个指标,才是有意义的规模化。

互联网大厂布局长文本领域

Kimi爆火后,国内互联网大厂也在长文本领域快速布局。

3月22日,阿里的通义千问官宣升级,向所有人免费开放1000万字的长文档处理功能。用户可通过通义千问网站和APP快速读研报、分析财报、读科研论文、研判案情、读医疗报告、解读法律条文、分析考试成绩、总结深度文章。

360紧随其后,其宣布360智脑正式内测500万字长文本处理功能,即将入驻360AI浏览器。

另据报道,百度在下个月将对文心一言进行升级,届时也将开放长文本能力,文本范围在200万至500万字。目前,文心一言的文本最高上限在3.2万字。

业内人士表示,长文本能力目前在训练和效果上仍存在一些难点,比如如何避免遗漏细节。事实上,文本长度也可以通过RoPE(旋转式位置编码)等算法技术去拓展,但是此时会严重丢失细节,这就导致输出效果不准确。因此,核心标准是看输出结果的精准性和连贯性,并不是文本长度越长越好。

此外,算力挑战是长文本需面对的首要问题。华西证券认为,国内长文本带动大厂长文本能力迅速迭代,一方面将会缩小国内外大语言模型的代差,另一方面将会进一步加大对底层算力的需求,算力需求爆发引发国内异构算力的构建,会带来AI行业的又一次变革,AI模型、语料库、算力租赁、算力运维、国产算力等将会继续受益。

版权所有(c)青岛出版集团 COPYRIGHTS @2010 ALL RIGHTS RESERVED备案号:鲁ICP备10001583-1号
中国互联网举报中心