智能建筑正逐步成为现代基础设施的核心,广泛集成了互联的物联网设备、自动化控制系统以及自适应环境响应机制。然而,随着其复杂性的不断提高及对异构数据流依赖程度的加深,安全性和隐私保护面临前所未有的挑战。
针对这一问题,近期发表一项题为《6G互联智能建筑中可信AI与联邦学习的入侵检测》的研究,提出了一种面向可持续性、以隐私保护和可解释性为核心的去中心化入侵检测系统(IDS),基于联邦学习(FL)框架和可信人工智能技术。
将可信AI嵌入智能建筑环境:从6G需求出发
该系统通过引入可信人工智能技术,致力于在日益复杂的网络威胁环境中保护智能建筑的运行安全,同时满足即将到来的6G网络对于极低延迟、高可持续性和零接触管理的严苛要求。
联邦学习如何革新入侵检测机制?
传统的入侵检测系统(IDS)主要依赖中心化的机器学习模式,需将敏感数据上传至外部服务器进行训练和分析。这种方式不仅增加了隐私泄露风险,也难以满足对实时性的高要求。而联邦学习则提供了去中心化的训练范式,允许各智能节点在本地保留原始数据,仅上传模型更新,从而在保障隐私的前提下实现全局协同学习。这一“隐私优先”的设计理念对于涉及用户行为和关键基础设施控制的场景尤为重要。
该研究提出的 FL-IDS 系统集成了两个卷积神经网络(CNN),分别用于分析网络流量和物联网传感器数据。模型更新而非原始数据被发送至联邦服务器进行聚合,有效避免了数据外泄的风险,同时保留了快速响应能力,适用于对时间敏感的智能环境。
数据工程与系统架构:支撑高效实时检测
系统的数据工程流程尤为关键。研究人员采用 ToN-IoT 数据集——一个融合网络、操作系统与遥测数据的综合模拟基准——构建了一个“零接触”系统,实现了数据清洗、采样及图像转换的自动化处理流程。传感数据被转化为 RGB 图像输入至 CNN 模型中,从而在最小计算负载下实现高效分析。这种图像化表示方式不仅优化了数据压缩效果,还与6G智能系统对能效的要求高度契合。
值得信赖且可持续的入侵检测系统设计
研究着重强调系统的三大设计原则:可持续性、适应性与可信度。通过高效的数据预处理流程,将原始 60 GB 的交通数据压缩为仅 2 MB 的图像数据,大幅降低了存储与计算负担,适用于资源受限的边缘计算场景。同时,采用基于时间窗口的数据聚合策略进一步提升了模型的训练效率与样本代表性。
系统的可信度建立在多层次的人工智能框架之上。CNN 模型可识别时间编码的网络行为图像,结合 Grad-CAM(梯度加权类激活映射)实现可解释性分析,生成特征热图以揭示模型判断依据。这种可解释性对于以人为核心的建筑环境至关重要,可有效降低误报对用户安全与舒适度的影响。
为应对联邦学习环境中可能存在的安全威胁,系统引入了安全聚合机制。包括梯度限幅(clipping)与归零等策略在内的防护措施,能够缓解由恶意参与者发起的模型投毒攻击。在高达 20% 客户端注入有害数据的实验条件下,系统依然维持了较低的误报率和漏报率,展现出极强的鲁棒性。
此外,系统具备零接触的自动化机器学习运维(MLOps)能力,涵盖数据预处理、模型训练与更新全过程,无需人工干预,有助于实现智能基础设施的实时动态安全管理。
去中心化优势显著:FL-IDS性能优于集中式方案?
通过精度、召回率和混淆矩阵等指标,研究团队系统地对比了联邦模型与传统集中式模型的性能。在独立同分布(IID)环境中,FL-IDS 在威胁检测准确率与召回率方面均超过99%,误报率仅为 3.24%,漏报率则低至 0.47%,表现优异。
在不同类型的物联网设备中,车库门和运动光传感器的数据表现尤为精准,而天气和恒温器传感器误报率略高,提示在实际部署中仍需针对特定设备进行进一步校准。值得强调的是,即使在非独立同分布(non-IID)的客户端环境中——这是现实建筑中常见的情况,因各建筑配置及传感器布局差异显著——系统依然能够保持高效检测性能。
研究还设计了三种数据分布实验,包括理想的 IID 场景和模拟针对性攻击的数据不均匀分布,结果表明,虽然收敛速度存在差异,但最终模型性能始终保持稳定,展示了出色的适应性和弹性。
在模拟中毒攻击的测试中,安全聚合机制同样发挥关键作用。通过限幅与归零策略组合,不仅有效抵御了恶意更新,还能够识别被感染的客户端,增强系统的可追溯性与整体安全性。
以下为该论文的摘要与结论,更多详情可查看原文:https://www.mdpi.com/1999-5903/17/5/191
摘要
智能建筑应用需要强大的安全措施来确保系统功能、隐私和安全。为此,本研究提出了一种由两个卷积神经网络 (CNN) 模型组成的联邦学习入侵检测系统 (FL-IDS),用于同时检测网络和物联网设备攻击。跨多个协作智能建筑进行协同训练,无需直接共享数据即可开发模型,从而从设计上确保隐私。
此外,该方法的设计考虑了三个关键原则:可持续性、适应性和可信度。所提出的数据预处理和工程系统显著减少了 CNN 需要处理的数据量,有助于限制处理负载和相关能耗,从而实现更可持续的人工智能 (AI) 技术。此外,数据工程流程(包括采样、特征提取和数据图像转换)的设计考虑了其适应性,能够集成新的传感器数据并无缝融入零接触系统,并遵循机器学习操作 (MLOps) 的原则。所设计的 CNN 可用于研究人工智能推理,并实现可解释人工智能 (XAI) 技术,例如本文分析的相关图。使用 ToN-IoT 数据集,结果表明,所提出的 FL-IDS 的性能可与集中式系统相媲美。为了解决 FL 的特定漏洞,我们引入了一种安全且强大的聚合方法,使系统能够抵御来自高达 20% 参与客户端的投毒攻击。
……
结论
本研究介绍了一种分布式人工智能解决方案的开发,该解决方案利用逻辑推理 (FL) 技术,注重可持续性,并实现零接触管理,同时提供“可信人工智能”框架。对该方法的性能评估指出了以下关键见解。
关于“数据预处理和工程”,该方案只需极少的设置,并通过自主清理和转换数据显著减少了人工干预的需求。除了改进的工作流程外,该方法还通过有效地减少数据量实现了项目的可持续性目标。时间采样和跨三个颜色通道的图像转换等技术被用于增强数据压缩。该流程设计为通用流程,并已有效应用于网络和传感器数据。其多功能性表明其在未来项目中也有可能应用于其他类型的数据,从而凸显了其普遍的实用性。
关于人工智能的可信度,该架构确保了逻辑推理 (FL) 的安全客户端-服务器连接,以保障数据的完整性和机密性。它还采用安全的聚合方法来抵御潜在的恶意客户端干扰。此外,它还运用Grad-CAM等可拓展人工智能(XAI)技术,让用户深入了解AI的决策过程,从而增强用户对解决方案的信任。
对所提出的FL-IDS进行性能分析,结果显著:在网络数据上,实现了高准确率和召回率,同时最大程度地降低了假阳性率(FPR;约3%)和假阴性率(FNR;约0.5%)。虽然传感器性能存在差异,有些传感器取得了完美的结果,而有些则表现出较高的FPR,但整体效果值得关注。该框架的多功能性体现在对网络和传感器数据的统一处理上,这在支持各种数据的同时显著减少了数据量。此外,所实施的可拓展人工智能(XAI)技术未来可用于分析某些传感器高FPR的原因。
本研究证明了基于FL的智能建筑可持续自动化入侵检测系统的可行性。所提出的解决方案通过创新数据预处理和维护可信的AI框架来实现这一目标。
这项工作为在智能建筑场景中可持续且值得信赖的人工智能的应用提供了诸多创新,同时也为未来的研究开辟了道路。其中最关键的一点在于使用 ToN-IoT 数据集。该数据集在智能建筑入侵检测领域提供网络和遥测数据方面具有宝贵的资源;然而,该数据集是模拟的,攻击对网络和遥测数据的影响之间没有明确的关联。
未来的研究方向概述如下。需要在实际场景中应用相同的方法,以进一步测试解决方案,并深入了解设备的资源消耗以及 FL-IDS 在实际场景中的检测能力。此外,收集包含关联网络和物联网数据的实际数据集,将使统一的分类策略成为一种可行的选择,这与本文提出的物联网数据二分类和网络数据多分类不同。未来研究中将开展的其他分析包括但不限于探索不同的采样窗口大小、数据平衡技术、可扩展人工智能 (XAI) 技术和深度神经网络 (DNN) 架构。
资料来源:MDPI
- 押注Open RAN成效不佳 富士通网络业务销售额持续下降
- 中国联通高管调整:杨庆友转任人力资源部总经理 贾志强接任市场部总经理
- 如何选择适合的智能家居通信协议:Zigbee、Z-Wave 还是 Matter?
- 亨通光电2024年营收同比增长25.96% 净利润同比增长28.57%
- 亨通光电2024年营收599.84亿元,光通信产品收入65.62亿元
- GEBT 2025:共赴低碳智慧建筑的未来之约
- 中天科技2024年营收480.55亿元,光通信产品收入80.94亿元
- 拓维信息2024年净亏损约1亿 Q1净利润6535万元
- 普天科技2024年营收49.7亿元 同比下降8.98%
- 大唐电信2024年营收9.42亿元 同比下降8.05%
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。