讯飞星火认知大模型面世,科大讯飞针对通用AI提出7大维度481项评测体系

2023-05-06 19:31:54 来源: DeepTech深科技

5月6日,在讯飞星火认知大模型成果发布会上,科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型,现场实测大模型七大核心能力,并发布教育、办公、汽车、数字员工四大行业应用成果。在发布会现场,刘聪以语音输入的方式,和讯飞星火认知大模型进行实时互动。据了解,该大模型具备文本生成、语言理解、知识问答、逻辑推理以及数学计算等能力。刘庆峰表示,认知大模型已经成为通用人工智能的曙光,科大讯飞有信心实现“智能涌现”。他说:“当前讯飞星火认知大模型已经在文本生成、知识问答、数学能力三大能力上已超ChatGPT。”后续,科大讯飞还将联合开发者推动大模型的应用落地。

赶超GPT要有科学的方法和体系:提出通用人工智能七大维度481项评测体系

2022年11月30日自ChatGPT发布以来,认知大模型的技术正在持续进化,这让人工智能在全球掀起了全新的热潮。在多个领域中,认知智能都表现出强大的能力,这也让认知大模型成为通用人工智能的“曙光”,它出现的历史意义不亚于PC或者互联网的诞生。


(资料图)

刘庆峰表示,通过分析ChatGPT关注的48个主要任务方向和讯飞开放平台上400多万开发者团队的需求,科大讯飞认为通用人工智能应当具备七大维度能力:包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等。

认知大模型的“智能涌现”也将带来解决人类刚需的全新机遇。比如,改变信息分发获取模式、革新内容生产模式、全自然交互式完成任务、实现专家级的虚拟助手、颠覆传统手工编程方式、以及成为科研工作的加速器等。

面向全新的AI机遇,科大讯飞已为认知大模型的“智能涌现”做好了核心技术的储备。

2011年,科大讯飞承建了语音及语言信息处理国家工程实验室,“(当时)我们提出让机器像人一样能听会说,(而)这一次认知大模型本质上是一次对话式的通用智慧的涌现,语音和语言的核心能力是一个基础条件。”刘庆峰说。

2014年,科大讯飞推出“讯飞超脑计划”,其中明确提出:让机器像人一样能理解会思考。2022年,该计划被升级为“讯飞超脑2030计划”,提出让懂知识、善学习、能进化的通用人工智能技术成为每个人未来发展的重要机会,让机器人走进家庭。

“在国家平台和讯飞超脑计划的支撑下,过去几年我们在认知智能领域取得了一系列全球领先的成果。”2017年,科大讯飞承建认知智能国家重点实验室,也就是从这一年起,科大讯飞不仅让机器在全球首次通过了国家职业医师资格考试、超过了96.3%参加考试的医生,并且在SQuAD机器阅读理解中全球首次超过人类平均水平,刚刚过去的2022年在OpenBookQA 科学知识推理中,单模型也超过人类平均水平。

刘庆峰透露,2022年12月15日,科大讯飞正式启动“1+N”认知大模型专项攻关,其中“1”就是指通用认知智能大模型,“N”就是大模型在教育、办公、汽车、人机交互等各个领域的落地。作为人工智能“国家队”之一,刘庆峰表示:“我们要向OpenAI致敬和学习,同时也要快速追赶并努力超越,而这需要一套科学系统的评测体系。”

为此,科大讯飞通过认知智能全国重点实验室牵头设计了通用认知大模型评测体系,并与中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同探讨形成了覆盖7大类481个细分任务类型。在科学的评测体系中,推动大模型的发展。

刘庆峰强调,“看一个大模型系统到底好不好,首先要看它是不是能解决刚需、是不是真的有用,而不是一个简单的单点测试。”

讯飞星火认知大模型现场语音输入流畅,多维实测“秀肌肉”

“你为什么叫星火?”科大讯飞研究院院长刘聪直接语音输入,讯飞星火认知大模型又快又好地给出了语音转文字的回答。

它说:“今天是科大讯飞星火认知大模型的发布会,线下和线上观看发布会的朋友们一直以来对科大讯飞都非常关心和支持,非常感谢大家,请帮我写一篇欢迎词。”

星火大模型编故事的能力也很出彩。在现场演示的刘聪输入以下内容:“孙悟空和奥特曼也偷偷潜入了会场,他们都争着想做讯飞星火认知大模型的代言人,还为此吵了一架,请根据上述信息创作一个故事。”星火大模型随即脑洞大开,一段生动的故事就娓娓道来。

此外,它还能写邮件、做方案、写新闻通稿等,也能生成英文宣传、修改英语语法错误等。

为了测试该大模型的语言理解能力,刘聪现场问道:“俗话说男子汉大丈夫宁死不屈,但是俗话又说男子汉大丈夫要能屈能伸,请问这两句话怎么理解?”并问道:“如果一个小伙子跟女朋友吵架了,他应该宁死不屈还是能屈能伸呢?”

结果,星火大模型可以很好地理解特定句子和场景的含义,并能随着问题题干的变化,灵活调整自己的答案。此外它还具备“情感分析”能力,能展现出跟人类共情的潜力。

在数学能力上,讯飞星火大模型展现出“学霸”气质。除了常规计算、几何、情景应用等,刘聪在现场还抛出了复杂的计算题:“花坛里有三种花,一共88朵,其中月季花的数量是菊花的4倍,牡丹花的数量是菊花的5倍少2朵,那么请问花坛里一共有多少朵牡丹花?”

星火大模型很快准确给出了答案,并给出了解题步骤。刘庆峰表示,数理能力一定程度代表了一个大模型的聪明程度。此外,刘聪还展示了大模型面向泛领域开放式知识问答,它具备很好的通识知识,能够对生活常识、科学知识、工作技巧,以及医学知识等应对自如。同时,星火大模型也具备逻辑推理能力与编写代码的能力。

刘庆峰表示,虽然目前大模型技术还有待攻克的缺陷,比如新知识难以及时更新、事实类问答容易“张冠李戴”,史实、传统典籍等容易“编造情节”等,但这些问题会在今年做出明显的改进。

同时他还公布了2023年内大模型技术持续升级的三个关键节点:6月9日,将突破开放式问答、多轮对话能力明显提升、数学能力再升级;8月15日,代码能力升级以及多模态交互能力提升,希望能帮助到更多的合作伙伴及开发者团队;10月24日,将实现通用模型对标ChatGPT,中文超越ChatGPT的当前版本,英文能做到相当水平,并在教育、医疗等领域做到业界领先。

讯飞星火认知大模型落地四大行业应用,赋能教育、办公、汽车、数字员工

讯飞星火认知大模型技术正逐渐为更多行业赋能。围绕星火认知大模型“1+N”架构中“N”个领域的内容,科大讯飞还发布了大模型在教育、办公、汽车、数字员工等多个方向的行业应用成果。

“大模型+AI学习机”,让AI 像老师一样批改作文,像口语老师一样实景对话。在作文批改上,搭载认知大模型的科大讯飞AI学习机T20系列可实现中英文作文类人批改。相比于传统学习机只能针对字词标点纠错、识别句式修辞错误这些基础批改,讯飞AI学习机实现了围绕写作要求、分析全篇结构和文采的深度高阶批改。像老师一样层层批改点评,让作文批改更高效。它还可以实现写作思路启发,利用AI润色技术生成片段优化参考和写作建议提升,让孩子在启发中精准提升。在口语对话方面,讯飞AI学习机精通中英双语,不仅发音纯正、表达地道,孩子直接说中文也能翻译成英文并教孩子朗读,还能对孩子的发音进行评分。陪伴式对话练习,让孩子更愿意开口说,告别哑巴英语,提升口语表达能力。

刘庆峰相信,这两项功能的升级将会促进语言学习再上一个全新的台阶。

“大模型+智能办公本”,则能根据手写要点自动生成会议纪要,助力办公效能进一步提升。面对口语稿阅读困难、纪要整理耗费精力、已有素材难成稿、长篇章难抓要点等痛点,搭载大模型技术的讯飞智能办公本升级了会议纪要、语篇规整两大功能。在会议纪要方面,将语音实时转写与墨水屏纸感书写相结合,并且可以对会议记录内容形成一份精简的会议纪要,有助于快速回溯会议内容。在语篇规整方面,可以去除语音转写文稿中的口语化词汇、过滤冗余词汇,对文本进行润色等,轻松将一篇语音转写文稿规整成书面化内容,阅读效率提升50%。

“大模型+讯飞听见”,可以实现一段录音就能一键成稿,甚至一分钟输出流畅会议文案。输入音频录音后,除了能够实现语音转文字外,讯飞听见通过AI分析文字内容,可以一键生成包括全文摘要、工作待办、工作计划、新闻稿件、宣传文案、多语种翻译等多种文本,还可以根据原文件内容,进行AI对话并对原文内容进行提问追溯。此外还有讯飞智能录音笔、讯飞智能麦克风等办公产品的相关功能也在持续更新中,智慧办公将迈入全新阶段。

“大模型+智能座舱”,则能实现车内跨业务、跨场景人车自由交流。目前,科大讯飞已为数千个车型提供业界领先的智能语音交互服务,提供多轮、多人、多区域、多模态的语音交互,累计服务用户已经超过4610万。而本次的认知大模型技术会让车载人机交互再上一个新的台阶,实现更自由、更拟人化的沟通。

“大模型+数字员工”,基于自然语言生成业务流程和 RPA,帮助企业员工完成大量重复性工作。以公司招聘事项为例,输入指令后,系统即可自动按照事先设计的RPA脚本,操作计算机中的相应软件,实现业务流程的自动化操作并输出结果,还能进行数据分析,大幅减轻一线工作人员的压力。另外,科大讯飞推出的虚拟人智能交互机,消费者通过对话直接说出需求,数字员工即可为消费者推荐相关产品,从咨询到购买的全过程能实现24小时不打烊的服务,首批服务将在10家讯飞官方直营店率先上线。

除了上述领域外,讯飞星火认知大模型还将赋能包括医疗、城市、政法、工业等在内的更多行业,以满足更多专业领域的需求。

开放合作,共建人工智能“星火”生态

“科大讯飞一直认为,人工智能的发展绝不是单个企业和单个科研机构的事情,而是需要大家合作共赢的。”刘庆峰说。

讯飞开放平台新增星火认知大模型,将赋能开发者打造更具价值的AI应用。目前,讯飞开放平台已经开放了560项AI能力,并聚集了超过500万生态合作伙伴。刘庆峰宣布,首批来自36个行业的3000余家企业开发者将接入星火大模型,联合各行业合作伙伴共建大模型“星火”生态。与生态伙伴一起,燎原新一轮产业变革。

为全面深度赋能开放平台合作伙伴,科大讯飞启动“2023 科大讯飞AI星火营生态计划”,面向千行百业的开发者,提供技术赋能、方案打造、赛事运营、商业运作、创业扶持等多维度资源,推动大模型的应用落地。“今天在我们发布会的同时,苏州、武汉、青岛、太原四座城市将会率先启动星火营计划,我们期待与开发者一起用星火燎原产业生态。”刘庆峰说。

据了解,此次发布会还设有7个分论坛,从办公、座舱、医疗、金融,到面向儿童的阿尔法蛋,以及到智慧营销和算力平台方面的共7个专题。刘庆峰介绍,算力方面科大讯飞将联手华为,“使我们未来认知大模型的持续进化,要在我们自主可控的平台上,不断地提升。” 面向未来,科大讯飞将秉持源头创新、自主可控、信息安全、人文伦理的原则,在保护伦理和安全的前提下健康发展。另据悉,即日起,讯飞星火认知大模型已正式对行业合作伙伴和开放平台开发者开放预约。访问讯飞开放平台官网,进入星火大模型即可体验。

责任编辑:

标签:

相关热词搜索:

[责任编辑:]

相关阅读

最近更新