讯飞星火V4.0发布,整体超越GPT-4 Turbo,8个国际权威测试集测评第一

国内资讯 安徽省资讯 (2774) 发布于:2024-06-28 08:52:26 更新于:2024-06-28 08:52:26 来自:中安在线
项目申报

6月27日,科大讯飞在北京发布讯飞星火大模型V4.0及相关落地应用。讯飞星火V4.0七大核心能力全面提升,整体超越GPT-4 Turbo,在8个国际主流测试集中排名第一,国内大模型全面领先。

讯飞星火在8个测试集中排名第一

据了解,自2023年9月全面开放以来,讯飞星火APP在安卓公开市场累计下载量达1.31亿次,在国内工具类通用大模型App中排名第一,并围绕写作、编程、工作、学习等涌现出一批用户喜爱的热门助手。

现场基于全国首个国产万卡算力集群“飞星一号”,讯飞星火大模型V4.0正式发布。讯飞星火V4.0七大核心能力全面升级,全面对标GPT-4 Turbo,并实现在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面的整体超越。

讯飞星火V4.0助力行业媒体

讯飞星火V4.0在图文识别能力上进一步升级,在科研、金融、医疗、司法、办公等场景的应用效果已领先GPT-4o。此外,星火长文本能力也全新升级,并针对长文档知识问答的幻觉问题,业界首发溯源功能。

外部权威测试集也体现出讯飞星火V4.0的领先性。在国内外12项大模型主流测试集中,讯飞星火在8个测试集中排名第一,超越GPT-4 Turbo等国际大模型,国内大模型全面领先。

发布74个语种/方言免切换对话

近期科大讯飞作为第一完成单位的《多语种智能语音关键技术及产业化》项目,获得国家科学技术进步奖一等奖。发布会现场,星火语音大模型迎来新突破。

面向万物互联时代,本次星火语音大模型发布国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。其中,37个语种识别效果领先OpenAI whisper-V3,37个方言识别效果平均提升30%。现场,科大讯飞演示了讯飞输入法混合方言和外语的语音输入效果,能让输入效率大大提高。

讯飞同传系统

科大讯飞还发布了软硬件一体化讯飞同传系统,可支持大会同传、会议同传、展厅同传、旅游同传等多场景使用。针对强干扰场景下的语音识别难题,科大讯飞突破了多人混叠场景下的极复杂场景语音转写,即使在三人混叠说话场景也能实现86%的语音识别准确率。

大模型正在推动人机交互变革,语音领域的所有应用都值得被重构。在大模型加持下,星火汽车智能座舱全新升级,不但具备了多语种多方言的“自由交互”,还具备多情感多模态的超拟人交互,让人车交互更有温度。当前,讯飞语音交互产品国内市占率稳居第一,同时广泛出口到世界各地。星火大模型为一汽、奇瑞、广汽、江淮、长城等车企的众多车型,赋予了高度智能的交互体验。

为了让大模型更好落地,科大讯飞还打造了云边端一体化和软硬件一体化的解决方案,赋能家电、运营商、机器人等更多行业场景。面向具身智能和人形机器人企业需求,本次科大讯飞正式发布机器人超脑平台2.0,业内首个支持多模态交互。目前,超400家机器人企业已经采用讯飞机器人超脑平台。

此外,讯飞星火大模型带来行业赋能的同时,也在助力开发者生态蓬勃发展。自今年1月30日讯飞星火V3.5发布以来,短短5个月,星火开发者生态加速增长,开发者数从598万增长到702万,新增超104万;海外开发者数超40万;大模型开发者达57万。越来越多开发者正加入星火生态,释放更多刚需场景的应用价值。

THE END

温馨提示:

本站部分信息来源于互联网,如有侵权请联系删除。
新媒体服务