对话夸克技术负责人:夸克大模型拿下双榜背后,四大优势、四项能力推进搜索革新

作者| ZeR0

编辑|沙漠阴影

智慧11月27日报道,11月22日,夸克大模型公布了针对搜索、生产力工具和资产管理助手的技术布局。夸克科技负责人蒋对Zhidx等媒体表示,夸克大模型是面向搜索、生产力工具、资产管理助手的应用大模型。在搜索应用中,将通过对图文的多模态理解、专业知识的生成和交互方式的创新,进一步拓宽应用场景,提升用户体验。

日前,阿里巴巴智能信息事业群发布了拥有千亿参数的全栈自研夸克模型,将应用于通用搜索、医疗健康、教育学习、职场办公等诸多场景。夸克的千亿级参数模型在C-Eval和CMMLU两大权威榜单上均高居榜首,在法律、医学、问答领域的性能评测中也获得了一等奖。

据介绍,凭借在搜索业务和智能技术方面的长期积累,以及数据、平台和知识增强方面的优势,夸克大模型可以大幅提升知识的正确性。在医疗健康领域,夸克大模型已经能够将问答内容的错觉率降低到5%,处于行业领先水平。

一、拆解夸克模型的四大优势,知识的正确性是落地的关键

冠军姜分享到,夸克是集搜索、使用、存储于一体的智能信息产品。在Quark的现有客户中,25岁以下的年轻用户占了一半。夸克大模型将是持续推动夸克App产品体验创新,走向新一代搜索的技术基础。

在搜索方面,夸克准备推出一些具体的产品,包括推出大量的AIGC内容,并在搜索的后环节规划新的智能技术产品创新和转型;云盘方面,夸克网盘相册可以用自然语言检索;工具方面,扫描和数据生成会用到夸克大模型的能力。

基于搜索业务的基础和智能技术的积累,蒋冠军认为夸克模型有四大优势:

1、最全面的通用知识数据和行业知识数据,以及知识理解和评价体系;

2.得益于搜索技术体系的积累,具备千亿级参数平台的模型训练能力;

3.具有长期智能产品经验的智能技术生产和运输团队;

4、具备全行业知识增强技术体系和能力。

▲夸克科技负责人蒋冠军

蒋冠军说,现在不仅很难获得这么多的中文数据和知识,而且网页中有大量的垃圾数据,大部分质量很低,成本和价格都很高。

在他看来,面向未来,解决大模型的应用问题,关键是解决知识正确性问题。夸克大模型通过模型预训练、人类比对、模型改进、知识增强等技术手段的结合,不断提高知识正确性,将一般知识错误率降低到15%以下。在医疗健康领域,夸克已经能够将问答内容的错觉率降低到5%,处于行业领先水平。

在教育领域,夸克优先生产优质教育内容,围绕生产内容和用户具体场景进行对话和互动产品创新。

二、千亿级大模型多性能超过GPT-4,四大能力提升用户效率

夸克大模型现阶段已经基本完成了整个迭代,有一个参数级别为1000亿的大模型,有能力在一些夸克端场景提供服务。

据介绍,夸克大模型的整体水平超越GPT-3.5,在多语言翻译、代码编写、安全合规、内容创作等方面均处于国内行业顶尖水平。具有良好的语义理解、知识掌握和应用、逻辑推理能力。其千亿规模模型先后登顶两大权威评测榜单C-Eval和CMMLU,多项性能优于GPT-4。在最新的数百亿参数测试集中,夸克在法律、医疗、问答等多个领域都排名第一

在多模态方面,夸克大模型支持相册搜索、AI相机场景下的文档搜索、图片生成图片、图片生成文字等。在教育、医疗等垂直领域,夸克在对话和解决问题上有了新的突破。

冠军姜从落地的角度总结了夸克模型有四种能力:知识、对话、创造、安全

1。知识能力:广泛的知识覆盖、信息收集和多语言支持,支持外部专业知识的增强,增强跨领域知识和语言理解;

2。对话能力:具有较强的语境理解、语境推理、关键信息保留和记忆能力,更好地适应变化的语境,理解用户意图和需求,确保对话回复准确、合理、连贯;

3。创作能力:根据主题或关键词生成连贯、有逻辑、有深度的文字内容的能力,支持续写、打磨、模仿、修改等多种写作需求;

4。安全能力:具有良好的世界观和价值观,能够对明显的虚假信息进行准确的识别、正确的回答或给予合理的引导,这得益于quark在搜索场景中长期的测试中积累的丰富经验和能力。

其中,知识和创造的能力与夸克产品强相关,比如搜索引擎,这是知识能力;工作学习中的公文写作或作文写作,是典型创造能力的延伸;对话能力主要是知识和创造能力在实际应用中的体现。

此外,夸克大模还擅长英语能力。比如在解决英语问题的时候,它不仅能给出准确的答案,还能告诉用户题目考查了哪些英语知识点,最后如何得到这个答案,对于提高教育产品的体验非常有帮助。

第三,搜索引擎天然兼容大模型,夸克大模型有领先的中文能力

鉴于AIGC技术和搜索产品在大模型领域的协同发展,清华大学新闻学院教授、博士生导师沈洋团队对所有大模型做了人文社科测评,看到了夸克大模型在四个方面的能力:1)聊天能力;2)组合创新;3)继续多轮对话;4)不同风格的内容创作。

在他看来,依托搜索平台,夸克大模型拥有各类优质数据,在中国语境下,模型能力处于行业领先水平。

沈阳教授认为,搜索引擎和大模型的结合是天然的匹配,主要有三个逻辑:1。数据量大,自然有各种网上公开的数据;2.在内容安全方面久经考验;3.搜索引擎用户提供了大量的查询需求,这些查询需求是与用户点击返回的结果的一种交互。大模型可以转换这些交互,并聚合和整合搜索结果。

根据沈洋教授的判断,5到10年后,将没有搜索引擎的概念,只有大模型的概念。如果用户有什么问题,就会习惯问大模型,不再使用搜索引擎。

最后,他总结了国内大模式需要改进的三点:

一是融合文字、图片、视频,实现多模态,从图片识别到图片创作完全打通;

第二,继续扩大在交互速度上的优势;

再次,要实现搜索引擎和大模型的深度融合,特别是要把做搜索引擎的优势充分内化到大模型的研发中,中国要走出自己的大模型发展之路。

结论:一个好的大型模型产品应该是知识和创意的结合[/s2/]

利用基于大模型的AIGC技术推动搜索创新已经成为搜索产品进化的行业共识。据介绍,夸克大模型将全面升级夸克在搜索、使用、存储方面的智能体验,帮助用户进一步提升效率。

谈到搜索产品的进化,蒋冠军认为,理论上只要大模型足够强大,打字或者语音交互都很方便,不需要搜索或者电商,但是大模型本身的技术能力还没有达到这样的水平,所以会和搜索引擎共存;进一步来说,搜索功能将逐渐被大模型的功能所取代。第一,大模型会辅助搜索,逐渐成为大模型的核心,搜索帮助完成产品创新。

在他看来,好用的大模型产品和创新产品,要把知识和创意结合起来,这样才有更大的空空间;具有一定规模和生命力的大型模型产品和应用阶段尚未到来。

未经允许不得转载:科技让生活更美好 » 对话夸克技术负责人:夸克大模型拿下双榜背后,四大优势、四项能力推进搜索革新