当下,人工智能技术正从计算智能和感知智能阶段,向更高层次的认知智能阶段演进。在这一新阶段,人工智能系统不仅能完成运算和感知任务,更将具备深层次理解、推理、规划和决策的能力,有望在复杂多变的真实环境中发挥更加出色的认知表现。
随着多模态学习、知识融合、认知规划等前沿技术的不断创新,认知智能正在为人工智能系统赋能全新的认知能力。它们将不再被束缚于结构化数据范畴,而是能够灵活处理真实世界中存在的数据稀缺、分布不均、多样性及不确定性等挑战。凭借对环境和信息的深入理解,认知智能将使人工智能真正步入面向真实场景服务的新时代。
近日,由赛迪顾问发布的《中国认知智能产品及服务市场研究报告》深入分析了中国认知智能产品及服务市场的现状和发展趋势。在2023年,这一新兴市场规模已经超过53亿元,同比激增109%。认知智能正在多个行业领域加速落地,推动人工智能技术从虚拟走向现实,为提升生产效率、优化决策和改善人机交互体验贡献重要力量。
报告全文如下:
一、定义
认知智能是一种模拟人类认知机制的人工智能技术,旨在赋予机器与人类相似的思维逻辑和认知能力。通过精心设计的算法来模仿人脑处理信息的方式,认知智能使得机器能够独立地执行感知、理解、推理、规划、决策等复杂任务。在现实世界中,数据通常受限于资源、分布的不均匀性、多样性及不确定性等挑战。认知智能通过多模态学习、知识数据融合、认知规划和情感计算等方法,能够有效地处理这些挑战,展现出对真实世界数据的深层次理解和智能反应。这种智能不仅仅是数据处理的能力,更是一种对复杂环境下不断变化的信息进行有效解读和应用的能力。
本报告研究范围为认知智能产品及服务,主要指基于认知智能算法,可面向行业实际应用场景交付的人工智能软件或相关技术应用服务。从产业结构来看,认知智能产品及服务涉及范围主要包括算法与技术层面以及行业应用层面。
二、发展背景
从人工智能的阶段演化来看,人工智能目前已由计算智能、感知智能进入认知智能阶段。在计算智能阶段,通过算力和存储的加持,机器能模拟人类的计算和记忆能力,完成人类难以完成的复杂运算,并在速度和准确率方面超越人类;在感知智能阶段,算力、算法和数据发展更加成熟,人工智能算法开始与各类传感器深度融合,催生出计算机视觉、语音识别、自然语言处理等应用。在这一阶段,机器可以通过训练的方式从海量数据中归纳出蕴藏的规律,进而模拟人类的感知能力;而认知智能则侧重于面对真实世界情形下数据资源有限、数据分布偏态、数据模态多样及信息不确定性等特点,基于多模态学习、知识数据融合、认知规划、情感计算等方法,实现理解、推理、规划、决策和创造等认知能力。可以看出,认知智能与前两个阶段最主要的差别在于其更强调对真实世界数据的理解和推理能力。在计算智能和感知智能阶段,机器主要通过模拟人类的计算和感知能力来完成任务,但在认知智能阶段,机器需要更深入地理解和处理真实世界中存在的各种复杂情况。
从认知智能的技术实现来看,为了使机器具备认知能力,需要综合发展多模态学习、知识数据融合、认知规划、情感计算等技术:(1)多模态学习是一种旨在处理和理解多种模态的数据的人工智能方法,通过挖掘来自文本、图像、视频、音频等多种不同模态数据种的信息,并且实现各个模态的信息的交流和转换,进而提高机器对复杂场景的认知能力,可应用于多种视频片段检索、图像描述生成、情感分析等多种任务。通过多模态学习可有效提高信息认知维度。(2)知识是认知的基础,数据是人工智能的重要“原料”,加强知识与数据融合运用可提升机器的基本认知能力。一方面,知识蕴含领域背景与专业技能,可以提供逻辑结构和规则方法,将其以特定方式表示,可为后续推理提供依据,知识可以是显式的,如专家知识库、本体论等,也可以是隐式的,如模型中的参数和权重等。另一方面,通过对大量数据的学习和训练,来提取规律和模式,从而实现智能化的任务处理。知识表示与推理是认知智能的基本手段,合理的表示方式与推理逻辑可优化认知能力。认知智能中知识数据融合、知识表示和知识推理,可以解决知识建模、跨领域模型迁移和模型可解释性等方面问题。(3)认知规划和智能决策是认知智能的核心环节之一,它可以帮助机器更好地理解和分解复杂认知问题,确定最优化的行动计划以达到预期的成果,从而做出更准确的决策。认知规划与决策对处理复杂问题至关重要。复杂的问题通常包括多个相关的目标、多个决策因素和多个变量之间的相互作用。规划可以帮助机器分析和理解这些关系,并确定如何最优地解决问题。通过规划与决策,机器可以逐步分解复杂问题为更小的、可管理的问题,并为每个子问题制定具体的步骤和策略。规划与决策也可以帮助管理复杂问题中的不确定性。在处理复杂问题时,机器常常需要面对许多不确定的因素,规划可以协助评估这些因素,并逐步调整行动计划,以应对各种不确定性。同时,它也可以减少认知负荷,将复杂问题分解成为更小的问题,并根据具体任务所需的资源及限制,得出最优决策。(4)情感计算优化智能交互体验。情绪是一系列主观认知经验的高度概括,由多种感觉、思想和行为等产生的生理心理状态。从认知神经科学角度来看,情绪也属于经典认知的一种。情感计算可赋予机器像人一样的观察理解和生成情感特征的能力,有了情感,机器可以像人类一样表达各种感受,或者对内部和外部刺激做出相应的反应,最终使得机器像人一样进行自然亲近和生动交互。
从最新的AI发展情况来看,近年来,大模型通过在大规模数据集上进行掩码预训练,完成对复杂数据模式和语言结构的捕捉,从而具备较好的语言理解和组织能力,也具备了一定程度的认知理解能力。同时,随着计算能力的提升和数据量的增加,大模型的规模和性能也在不断提高。虽然大模型在通用任务上取得了一定的进展,但是在直接切入垂直行业服务企业客户时会遇到如下的问题:
其一,方法论:在方法论上,大模型主要采用语言学预训练方式,对数据进行遮罩使得模型学会补全能力,进而对数据进行表征。但这种方式对垂直行业的数据缺乏深层次“理解”。以智能制造场景为例,大模型缺乏对于工艺流程、工业参数、工业机理等行业知识的深刻理解,进而导致输出结果更侧重统计规律,缺乏专业性、精准度和可解释性;
其二,数据依赖:大模型的训练依赖于大量领域训练数据,但在实际应用中,垂直行业领域的企业客户可能仅有少量领域数据或者领域数据不开放,此时大模型无法通过预训练的方式将领域样本有效编码进模型。以智能制造表面缺陷检测场景为例,该领域有缺陷的样本数据往往比较稀少,如果依然采用大模型的方式对缺陷样本训练,则会因样本稀少而得不到充分训练,进而无法对其有效识别;
其三,“幻觉”问题:大模型的输出结果存在一定随机性,这种随机性集中表现在大模型的“幻觉”问题上,即模型在生成文本时产生不准确、不相关或完全虚构的信息。 这种现象在大语言模型中尤为常见。此时,尽管生成内容不符合逻辑,但是生成的文本是连贯和流畅的,极易导致垂直行业企业客户“真假难辨”,无法直接使用。仍以智能制造场景为例,当输入一张钢铁表面有划痕的图片时,大模型可能会输出“这张图片表面有些灰尘,但是没有明显缺陷”等误导性结果。同时,大模型本身缺乏对其输出结果置信度的评估。这对于需要确定性输出的行业(例如制造业等)无法直接使用。
此外,大模型在实际应用时还会面临资源消耗大、定制化需求难以满足等问题。而基于多模态学习、知识数据融合、认知规划等理论和方法研发的认知智能算法平台可以有效提升模型的领域专业性与可解释性,保障模型输出结果可靠且稳定,同时对于用户的数据要求低,可根据用户的少量偏态样本数据进行相应的模型适配与精调,得到更精准、更专业的输出结果。
从国内发展情况来看,我国人工智能整体发展水平与发达国家相比仍存在差距,缺少基础性的重大原创成果,对人工智能内核机理探索深度不够,尤其是在基础理论、核心算法、重大产品与系统、软件与接口等方面存在较大差距,为此,国务院印发《新一代人工智能发展规划》,围绕增加人工智能创新的源头供给,强调建立新一代人工智能基础理论体系,推动人工智能与神经科学、认知科学、量子科学、心理学、数学、经济学、社会学等相关基础学科的交叉融合,加强引领人工智能算法、模型发展的数学基础理论研究。到2025年,初步建立新一代人工智能理论与技术体系,突破具有自主学习能力的人工智能,在智能制造、智能医疗、智慧城市、智能农业、国防建设等领域得到广泛应用。
从地方支持力度来看,近年来不少省市开始围绕新阶段的人工智能发展出台支持性政策,推进人工智能认知能力的提升。如北京印发《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》,支持数据与知识深度联合学习、高维空间多模态语义对其、大规模认知与推理、可控内容生成、高效低成本训练与推理等关键算法研发;安徽印发《安徽省通用人工智能创新发展三年行动计划(2023—2025年)》,指出要加快实施国家级和省级科技攻关项目,面向多语种、跨领域任务,持续研制更大规模参数的认知智能大模型、通用语音大模型以及基于文本图像、语音的多模态大模型;上海印发《上海人工智能示范应用清单(2023)》,提出要在大型区域场景中,综合运用智能感知、认知、决策技术,提供车路协同、智慧交管、停车资源管理、指挥调度等一体化解决方案,提升城市级交通智慧化运行管理。
从行业需求来看,传统的人工智能模型的决策推理能力需要以海量的行业特征数据作为支撑,其决策推理能力的实现来源于从输入变量到结果变量之间的统计相关性,底层运行机理并不具备类似人类的推理思考能力,严格意义上讲,此类能力应归为“伪认知”。同时,现实中能提供海量训练数据的行业只占少数,因此基于海量历史数据的认知能力训练也不具备跨行业的普适性。随着数字化转型的深入推进以及未来“人工智能+”行动的逐步落地,预计越来越多的行业将对机器的认知能力提出更高的要求,基于领域知识以及小样本偏态数据的认知智能算法及相关产品将成为其迈进认知智能阶段的主要方式。
三、市场发展现状
(一)市场规模
当前,认知智能正处于基础研究与推广应用的交叠发展阶段,市场参与者正积极探索和验证认知智能产品或服务的落地模式,推动中国认知智能产品及服务市场的快速发展。2023年,中国认知智能产品及服务市场规模达53.6亿元,同比增长109.4%。
(二)市场结构
从市场结构来看,中国认知智能产品及服务市场可分为认知智能平台和认知智能技术服务两个方面。其中,认知智能平台集成了认知智能相关算法和技术模块,可通过本地部署、API接入等方式支撑用户为实现认知智能所需的底层计算与处理需求;认知智能技术服务主要为面向用户提供的通用型认知智能应用服务或定制化的行业认知智能解决方案。现阶段,大多数厂商正通过技术服务的形式实现认知智能技术的落地,部分厂商也会通过平台为用户提供支撑。2023年,中国认知智能平台市场规模达10.9亿元,认知智能技术服务市场规模达42.7亿元。
四、市场竞争格局分析
(一)整体竞争格局
目前,中国认知智能产品及服务市场入局者主要分为两类:一类是“巨头”型厂商,如百度、科大讯飞、阿里巴巴等,此类厂商在此前的感知智能领域探索较为深入,目前正通过大模型切入认知智能领域。另一类是创新型厂商,此类厂商专注于认知智能算法研发和技术创新,或针对某些特定行业提供解决方案,技术实力不容小觑。2023年,在中国认知智能产品及服务市场中,百度、科大讯飞等巨头型厂商凭借自身研发实力和丰富的市场渠道,占据市场领先位置。华院计算、暗物智能等厂商专注于认知智能算法研究,聚焦于通过小样本量数据和行业知识体系来实现模型的高鲁棒性,也呈现出不俗的市场表现。
(二)细分市场竞争格局
1、认知智能平台
从认知智能平台市场来看,华院计算以认知计算算法研发为核心发展路线,推出认知智能引擎平台为用户赋能,目前处于细分市场的领导者地位。中科闻歌由中科院自动化所孵化而来,打造了认知与决策智能基础平台DIOS,目前位居细分市场第二。
2、认知智能技术服务
认知智能技术服务市场参与者较多,竞争更为激烈。一方面,百度、科大讯飞、阿里巴巴等巨头企业凭借在技术、品牌和渠道等方面的优势,牢牢占据技术服务市场的第一梯队。智谱AI、中科闻歌、竹间智能、华院计算等创新型厂商,则瞄准若干典型的垂直行业,围绕特定的行业用户提供认知智能服务和解决方案,并进一步向更广泛的领域推广,发展势头强劲。
五、典型案例分析
(一)百度大脑助力某旅行平台提升图像审核质效
国内某旅行平台业务中会产生大量的用户评论信息,一些不法分子通过生产发布违规图片,污染网络公共环境,内容安全也是一个亟待解决的问题。以往的人工审核不仅耗时费力,成本高昂,效率低下,而且判断标准难以统一。所以高效、便捷、准确的智能内容审核过滤系统,也是该旅游平台一直都存在的业务诉求。
百度大脑为该旅行平台提供图像审核服务。从平台用户上传图片到最后的平台展示,要经历诸多环节:所有图片首先要经过百度大脑图像审核这一关,所有的涉敏信息以及违规图片大都卡在这一环节,正常的图片会直接跳到展示的关口,违规图片会直接屏蔽。少数一些AI判断为待确认的图片则流入到人工审核的阶段,由人工判断后再做进一步的展示或屏蔽。百度大脑图像审核服务,将重复性工作化繁为简,为后续的人工处理铺平道路,提高工作效率的同时还能有效规避掉风险。利用百度大脑图像审核,及时落实相关政策法规和量化审核标准的工作也变得简单,可以最大化的提升平台内容管理效率。
(二)华院计算助力某钢材集团实现连铸质量预判及切割优化
国内某钢材集团在生产过程中暴露出两方面问题,一是缺乏有效的质量控制系统,难以及时发现和解决生产质量问题;二是缺乏科学的切割优化模型,难以提高成材率和降低成本。
为此,华院计算基于认知智能引擎为该钢材集团提供连铸质量预判及切割优化平台。一方面,华院计算基于自研认知智能引擎以及结合BOD推理引擎进行数据+知识的融合,同时采用机理建模、认知规划、知识图搜索以及小样本异常值检测等算法技术,对生产过程中出现的异常事件或过程数据偏离品质管理基准时,自动判定出现的生产状况下的质量异常,并对品质异常自动进行记录,给出可能的处置决定,同时基于质量异常进行自动分析,找出产生质量异常的直接原因和间接原因。另一方面,华院计算在通过实时获取切割计划信息的基础上,通过建立模型的方式来实现板坯的优化切割功能,求出实际运行下废坯数最少、切割报废量最小、铸造的成品率最大的效果。通过对板坯的生产数据进行数学建模,采用运筹优化的技术来优化板坯切割长度,达到板坯最优化切割的效果,并根据现场情况进行过程判坯A、B、C、D等级,用于内部排查板坯质量问题;同时,基于神经网络+专家知识进行缺陷判定、实现自动预测铸坯内部和表面缺陷,形成缺陷地图。最终,华院计算基于该集团的业务知识和小样本量数据,对连铸产线完成了数字化质量管控的监控部署,可实现品质异常判定功能,判定准确率超98%,同时也提高了集团的板坯收得率。
(三)暗物智能为某区纪委提供谈话场所合规监测系统
当前,纪委监委部门在留置场所普遍存在三大痛点问题:一是规范监督难,缺少有效的技术手段对谈话室异常事件(物品、行为、语言等)进行监督和预警;二是异常追溯难,谈话过程产生大量录像文件,关键内容难以定位,常规手段查找费时费力;三是谈话记录难,人工记录很难完整呈现谈话全内容。
为此,广东省某区纪委委托暗物智能打造了基于小数据范式的高准确率、低成本的谈话场所合规监测系统。系统基于特色认知异常检测技术,实现了谈话异常监管、智能笔录制作等核心功能,形成全流程辅助安全谈话行为监管机制。该系统技术亮点在于数据需求少、算力要求少、泛化能力强。系统可以实时获取视频信息及异常告警信息,异常告警类别涵盖了谈话人员监管、谈话环境监管、违规物品监管、谈话行为监管、谈话时间监管等类。同时,系统谈话笔录提供了谈话模板、语音识别、角色分离、笔录编辑等功能,能帮助相关人员实现科学管理。
六、发展趋势
(一)市场规模预测
1、整体市场预测
未来三年,随着认知智能技术的进一步发展和成熟,越来越多的行业和用户将着手推进认知智能能力的部署和强化,预计中国认知智能产品及服务市场将继续保持快速增长态势,但随着市场规模的不断提升,规模增速将出现一定回落。到2026年,中国认知智能产品及服务市场将达202.7亿元,三年复合增长率将达到55%左右的水平。
2、细分市场预测
2024-2026年,随着认知智能优势的逐步显现,企业用户将对认知智能技术的接纳程度会更高,将在认知智能平台本地化部署或能力接入方面加大投入。到2026年,中国认知智能平台市场规模将达45.9亿元,三年复合增长率在61%左右,高于市场整体水平。而认知智能技术服务市场以行业应用场景的升级和改造为驱动,未来仍将占据较大份额,预计到2026年市场规模可达162.8亿元。
(二)市场趋势判断
认知智能技术将继续优化升级。近年来,随着ChatGPT的兴起,大模型和生成式人工智能技术走入大众视野,无疑对认知智能技术起到了强有力的推动作用,让认知智能从理论向现实迈出了里程碑式的一步。未来,认知智能模型将深度融合认知科学、脑科学、心理学等多学科研究成果,从而更好地模拟人类的感知、思考、理解和推理能力,理解数据之间的关系和逻辑,进而更加适应复杂多变的环境。同时,可解释性也将是认知智能技术进一步优化的方向,涵盖算法透明性和简单性、表达的可解构性、模型的可担责性及因果分析和推理,将使得人工智能决策更加透明,也有助于公众更加理解和接受AI技术。
认知智能技术的行业应用将更加广泛深入。与传统的“机器学习+海量数据”的“野蛮”训练方式不同,认知智能主张行业知识、行业数据与认知算法的深度融合,依托三大要素让机器实现自主的识别、推理和决策能力,强调输入变量与输出变量的逻辑学关系而非统计学关系,能实现更高的精确度和更强的鲁棒性。在此前提下,预计未来将有越来越多的具备鲜明经验属性、但可训练数据量小的行业投入到认知智能怀抱,推进工序流程、监测监管等环节的进一步优化。届时,认知智能产品及服务市场规模也将释放出更大的发展空间。
认知智能未来亟需解决若干关键问题。一是数据隐私和安全问题,随着认知智能应用的增多,不可预见的数据隐私和安全问题有可能显现,从而限制用户对认知智能技术的信任度;二是技术瓶颈问题,尽管技术仍在不断进步,但在某些领域仍存在技术瓶颈,如大模型对话系统的理解和生成能力、模型的解释性等问题,此类问题未妥善解决则会影响到后期的推广与普及;三是人才短缺问题,认知智能更需要跨学科、跨领域的复合型人才,如计算机科学家、数据科学家、认知科学家、神经科学家、心理学家等,一旦人才供应不足则极有可能制约行业的有序发展;四是伦理和法律问题,人工智能技术的发展引发的伦理和法律问题已经开始显现,如算法歧视、责任归属等,未来需要制定相应的政策和法规来规范行业发展。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )