科大讯飞发布首个支持长文本、长图文、长语音的大模型

安徽省资讯 (2127) 发布于:2024-04-26 15:24:31 更新于:2024-04-26 16:30:15 来自:科大讯飞
项目申报

4月26日,讯飞星火V3.5春季上新,科大讯飞董事长刘庆峰发布讯飞星火大模型一系列新功能:

支持长文本、长图文、长语音的大模型正式上新,首发星火图文识别大模型,快速识别和学习多类型海量知识,行业场景下的回答更专业、更精准。

星火合同助手首次上线,审核规避合同风险、提炼总结关键要素、一键起草合同文件。星火智能评标助手升级,投标文件解析更高效,让评标更便捷、更高效、更准确。

“多情感超拟人合成”和“一句话声音复刻”首发,实现更生动、更具个性化的表达,带来更有温度的人工智能体验。

星火智能体平台全新发布,解决大模型企业落地最后一公里,为员工打造专属助理,为企业解放生产力。

此外,讯飞AI学习机、星火智慧黑板、星火科研助手也进行了升级。

刘庆峰介绍:“星火APP在安卓上的下载量已经达到9600多万次,在国内工具类通用大模型APP中排名第一。”在1月30日讯飞星火V3.5发布后,新增了55万实名认证的开发者,其中一半以上是来自企业。

400多年前,英国哲学家弗兰西斯·培根说:“知识就是力量,但更重要的是运用知识的技能。”400多年后的今天,讯飞星火正在成为每个人获取知识、学习知识的“超级助手”,成为解放生产力、释放想象力的“超级杠杆”。

春季上新,次第花开,刘庆峰最后透露:今年6月27日,讯飞星火V4.0将正式发布。

以下为科大讯飞董事长刘庆峰发布实录:

讯飞星火APP安卓下载量超9600万次

国内工具类通用大模型APP排名第一

大家好!在这个春意盎然、万物勃发的季节,我们讯飞星火春季上新了。

自从今年1月30日星火V3.5发布以来,作为首个全国产算力训练的完全自主知识产权的大模型,讯飞星火受到了各行业伙伴和广大开发者的广泛欢迎。

特别是在一些关键行业和重大战略领域,星火大模型“云、边、端”的整体解决方案正在赋能汽车、家电、运营商等越来越多的行业。

科大讯飞发布首个支持长文本、长图文、长语音的大模型

在过去三个月不到的时间里,我们已经新增了55万实名认证的开发者,这其中一半以上来自企业。

科大讯飞发布首个支持长文本、长图文、长语音的大模型

从星火APP的应用上也再次看到,使用的最高峰不是周末,而是工作日,使用的最高峰时间是在工作日上午9:30和下午3:30,也就是说,绝大部分用户是用讯飞星火来解决和工作相关的问题的。

科大讯飞发布首个支持长文本、长图文、长语音的大模型

截止到今天,星火APP在安卓上的下载量已经达到9600多万次,在国内所有工具类通用大模型APP中,我们是排名第一的。

科大讯飞发布首个支持长文本、长图文、长语音的大模型

我们一直在践行用大模型、用通用人工智能解放生产力、释放想象力的目标。

一段时间以来,我们的开发者和用户都高度关注知识的获取和学习的问题。这个过程中,我们不仅要解决长文本的问题,能够把各种信息来源的海量文本快速学习,能够进行问答,特别重要的还有在各种企业和专业行业应用的准确率的问题,尤其是在金融、汽车、政务等等非常关键的领域,我们希望它的回答要足够准确。

垂直领域的知识问答

星火总体水平超GPT-4 Turbo

目前星火大模型通用长文本能力,包括长文档信息抽取、长文档知识问答、长文档归纳总结、长文档文本生成等,总体已经达到GPT-4 Turbo今年4月最新长文本版本的97%的水平,而在多个垂直领域的知识问答任务上,星火大模型长文本总体水平已经超过GPT-4 Turbo。

科大讯飞发布首个支持长文本、长图文、长语音的大模型

科大讯飞发布首个支持长文本、长图文、长语音的大模型

另外,还有一个非常重要的问题,当我们的文本越来越长,到了几十万字甚至上千万字的时候,效率是一个非常关键的问题,因为,长文本在后台消耗的运算资源非常大。

这一次,我们不仅把大模型在多个领域做到业界最优,还进行了非常重要的“剪枝”和“蒸馏”,从而推出了业界最高性能的13B,也就是130亿的模型来处理长文本。在效果损失仅3%以内的情况下,使得我们在文档上传解析、知识问答的首响时间以及文字生成上都获得极大的效率提升,在保障长文本效果的情况下,无论是10K、64K、128K token,还是更长的文本,星火大模型的上述性能都是业界最优的。

科大讯飞发布首个支持长文本、长图文、长语音的大模型

下面,我们把《星火相传》这本书送到讯飞星火大模型中,看看它是如何快速学习理解和回答关键问题的。这本书向我们呈现了一个实验室的研究成果,怎么经过多年探索和研究,最终在市场上试点,并变成海量用户使用的产品这样一个过程,它对于我们现在的源头技术创新、产学研合作都具有非常重要的启发意义。

下面,让我们再次有请大家的老朋友、科大讯飞研究院院长刘聪博士来给大家演示。

首发讯飞星火图文识别大模型

覆盖31个场景、18种版面要素

另外,在知识的获取和学习过程中,我们还看到,往往广大用户能够拿到的资料,并不是在网上现成的海量的长文本,而是随手可见的报刊书籍上的内容,能不能用手机一拍就成为用户的后台知识来源?能不能把参加各种学术研讨会上拍到的PPT、上课时老师黑板上的板书以及各种同学笔记,大家分享过来,都能成为后台知识获取和学习的内容?

科大讯飞发布首个支持长文本、长图文、长语音的大模型

经过多年积累,科大讯飞屡次在国际图文识别、公式识别大赛中获得第一名。在这基础上,这次,我们首次推出讯飞星火图文识别大模型。图文识别大模型可以处理非常复杂的版面分析,可以结合篇章的语义和文字的理解能力进一步提升,而且可以覆盖更多专用领域的特殊的专业符号。

科大讯飞发布首个支持长文本、长图文、长语音的大模型

比如说,我们的图文识别现在已经覆盖了31个最常见的典型场景,像教育类的书刊、学术论文、专利、报纸、海报、产品白皮书、甚至PPT和菜单等等都已经进行了覆盖,从而使得它的理解能力和易用性大幅提升。

科大讯飞发布首个支持长文本、长图文、长语音的大模型

而且,对于上述场景中最常见的18种版面要素可以进行非常快速的识别和处理。例如页眉、页脚、标题、栏目、段落、表格、插图等等要素,甚至还包括比较难、但很实用的公式、印章、二维码、手写材料等。

科大讯飞发布首个支持长文本、长图文、长语音的大模型

可以看到,我们的图文识别大模型,无论是在国际公开的权威英文测试集,还是在科研、金融以及企业产品技术文档等等的识别效果都是业界最领先的。

科大讯飞发布首个支持长文本、长图文、长语音的大模型

星火智能评标升级

助力评标更高效更准确

基于长文本、长图文的能力,是科大讯飞在知识获取和学习上非常重要的代表行业的进步。

在招投标领域,智能评标助手全面升级,星火大模型优秀的文本理解、逻辑推理和数学能力,再加上本次升级的多模态知识获取和学习能力,将进一步提升对招投标文件解析的效率、最终评标结果呈现的准确率和可靠性,以及来源佐证的丰富性。我们和国家能源物资公司在企业采购场景合作的智能无人评审系统在国资委网站上已经被作为典型案例推荐。

这一次,基于讯飞星火大模型的知识获取和学习能力提升,我们给大家带来一个福利。这就是星火合同助手。你去装修房子、租赁房屋、买卖商品以及各种生活中可能会出现的纠纷,都可以用星火合同助手来更好地保护自己,来更好地防范风险。

我相信,大家在使用过程中,都会真正看到大模型给我们每个人在工作和生活中所带来的便捷和细心的保护。

首个支持“长文本、长图文、长语音”大模型

正式上新

除了随时随地用手机拍摄就能够获取到的各种各样的图片书籍等资料之外,还有很多场景需求。有些时候,我们需要从长时间的录音、会谈以及采访中获得资料内容,我们希望将网上看到的各种发布会、各种培训教育视频作为知识获取的来源。

讯飞星火也提供了这样一种能力,把领先的语音识别和翻译技术结合起来,不仅仅是对中文、也对英文等等这些资料,(讯飞星火)都能够跟纯文字一样进行快速地获取和学习。

今天,我们首个支持长文本、长图文、长语音的大模型正式上新。

科大讯飞发布首个支持长文本、长图文、长语音的大模型

讯飞星火持续赋能教育

讯飞AI学习机&星火智慧黑板再升级

当然,大模型赋能行业,一个全社会都高度关注的领域就是教育。今年召开的世界数字教育大会上,大模型已经成为全球在教育领域的高度共识。如何培养通用人工智能时代的人才?如何根据能力素质模型实现人机协同、更好地发展我们每个人的想象力和创造力?这已成为所有教育专家的共识。

这一次,我们又用新上线的长文本、长图文、长语音的知识获取和学习能力,进一步升级了在教育场景的应用。

讯飞AI学习机不仅使我们对作文的批改、对数学等理科的批改更加精准,让智能化辅学更有针对性、更高效,而且还结合了长文本、长图文等能力升级了百科问答功能。讯飞星火大模型理解并融合了大量图书知识,面对孩子的奇思妙问,即使问题再复杂,爱因斯坦和他的“大咖”虚拟人朋友们都能回答,让孩子们在趣味互动中学知识、长见识。这个功能还有一个特别重要的价值就是,能够进一提升孩子们主动提问的意愿和能力。

科大讯飞发布首个支持长文本、长图文、长语音的大模型

星火智慧黑板也再次升级。首先是星火实录,搭载长文本和长语音能力,可以让转写效果得以提升的同时,提升篇章梳理能力。

其次是星火教师助手。以往更多的是围绕单元教学或者课时教学,按课标和教材生成相关内容,这次融入长文本能力后,我们可以把各种优质教辅内容融入,老师在备课过程中,看到好的教辅教参的内容,马上就可以导入,进一步丰富备课资源,提升备课效率。

本次星火大模型的升级还赋能了星火科研助手,可以把论文问答、综述生成、实验解读等等的效果进一步提升,而且它获取的来源不仅是海内外的各种报刊、学术文章,还包括更丰富的各种各样的照片、录音等学术资料。

科大讯飞发布首个支持长文本、长图文、长语音的大模型

首发多情感超拟人合成

一句话完成声音复刻

讯飞星火APP上有一个非常受大家欢迎、也特别有意思的功能,就是超拟人对话。

你可以跟它随时随地聊天,它像真人一样有各种各样的感情、有生动的口语表达,还有笑声、有语气、有情调等等。

这段时间以来,很多人对比了我们的技术和OpenAI的Whisper,包括微软最新发布的语音。我可以非常自豪地告诉大家,我们的语音技术一直都是行业领先!大家如果拿星火APP跟微软对比,无论从语音的可懂度、流畅度还是表现力,我们都是超越他的。

当然,我们的技术也要不断提升,也还有很多待完善的地方。

过去三个月,根据用户各种各样的反馈和建议,我们进一步提升了情绪表达的可感知度,高兴、抱歉、安慰、撒娇、困惑等等这些语气表达,比原来更加生动,也可以满足我们用户在各种场景下自我减压、释放需求,以及用星火来给周边的朋友和亲人们带来帮助。

科大讯飞发布首个支持长文本、长图文、长语音的大模型

当然,说到超拟人对话,一个绕不过去的话题就是一直以来大家对我们提出来的“个性化合成”:能不能模仿我们家的聪明可爱的小朋友每天给爷爷奶奶读书读报?能不能在我们出差的时候模仿我们的声音给孩子讲故事?

实际上,科大讯飞这个技术一直都是业界领先的,而且,我们早就推向市场:

我们当年模仿志玲姐姐的声音,需要到台湾录一个礼拜的声音,后来模仿郭德纲需要一天的声音,再往后用一个小时的声音,再后来5分钟的声音,现在一句话就能模仿。当然,我们也会提供工具,如果你愿意录更多的声音,就可以模仿得更惟妙惟肖。

科大讯飞发布首个支持长文本、长图文、长语音的大模型

技术在不断进步,我们希望在安全可控的前提下,能够带给社会更有温度的人工智能体验,能够真的帮助到那些特别需要帮助的人,今天这个世界更需要有温度的科技。

讯飞星火智能体平台

敏捷触达大模型企业落地的最后一公里

我们说,讯飞星火的使命是“解放生产力、释放想象力”。解放生产力非常重要的主体就是我们各类企业,企业在知识获取和学习中,如何把智能体更快地构建?如何更好地使用大模型的这些能力?

这一次,我们推出来全新的智能体构建的平台:讯飞星火智能体平台。

企业的智能体构建有几个非常重要的环节:首先,是如何针对输入,往往可能就是一句话的输入,能够精准解析出这句话所对应的相关任务;然后,要能够把这个任务所对应的、需要的工具给它找到、调用起来;然后,还要把这个工具所需要的内外部知识信源给它打通;最终,根据相关的每一个任务的执行结果,汇总出最后的答案。这样一个完整的过程,才能够最终完成智能体的构建。

科大讯飞发布首个支持长文本、长图文、长语音的大模型

在这些基础上,当构建了企业智能体的时候,还有一个非常重要的工具,就是能不能让人工也参与进来,形成人机协同下的智能体构建,从而使得构建出来的智能体工具更高效、更可靠、更加的人机协同下的持续发展。

我觉得,这是未来的主流,线上线下结合、虚拟现实结合、人和机器结合。这一次,我们要通过技术进步,解决企业知识学习和获取的最后一公里问题。让每一个人都拥有属于自己的智能体助手,解放每个人的生产力,释放出更多精力做更有想象力、更代表未来的工作。

以上,就是我们讯飞星火V3.5春季上新的全部内容,感谢大家观看。

同时,也敬请期待,今年6月27日,讯飞星火V4.0版正式发布。

THE END

温馨提示:

本站部分信息来源于互联网,如有侵权请联系删除。
新媒体服务