法律科技深度融合:技术创新与生态建设双管齐下

以5G、物联网、工业互联网、卫星互联网为代表的通信网络基础设施,以人工智能、云计算、区块链等为代表的新技术基础设施,和以数据中心、智能计算中心为代表的算力基础设施,正在成为“新基建”的信息基础设施。这些新一代信息技术与各行各业的融合,又在进一步形成“新基建”的融合基础设施,例如智能交通、智慧能源等。而由科学技术与信息技术所驱动的法律行业数字化转型,法律行业与科技的融合与碰撞,即法律科技正在搭建起法治中国的新一代基础设施。

北京华宇信息技术有限公司在法律科技领域已深耕20年,一直致力于利用科技创新,推动法律行业各个环节的效率提升,并推动法律科技生态的建设。为构筑产、学、研、用一体化的创新法律科技生态,华宇已连续两年举办法律科技大会,9月13日举办的2020法律科技大会以“创新法律科技、助力法治中国”为主题,探讨法律科技的发展方向和未来机遇,致力于与合作伙伴一起,以科技与法律的不断融合为法治中国建设持续提供助力,让每一个人、每一个组织、每一个场景都能够享受到科技带来的便捷。

华宇十大创新技术,为法律科技注入智慧动力

作为法律科技的倡导者和推动者,华宇近年来持续发力技术领域,重点突破了面向法律行业的多项技术瓶颈,通过法律AI平台将数据、知识和通用AI能力转化法律应用场景上的智能服务,为法律行业提供技术能力支撑,形成了专属的法律科技十大核心技术。

法律知识图谱技术:基于中国裁判文书网实时更新的文本,针对高达9000多万篇文书,华宇利用自然语言处理、知识图谱等技术将法律知识点构建成完整的法律知识中心,使机器认知法律概念、模拟法律推理,知识中心涵盖法律要素(知识)数量超过1.9万项,实现了对公、检、法、司、仲裁等多个行业100多类文书进行信息项提取。

基于法律行业的OCR文字识别技术:华宇基于AI深度学习算法,利用图像分析、字符识别等技术,对材料中的图片内容分析处理。通用印刷体文字、手写文字、卡证表格特殊格式的文字识别,支持识别的材料种类6700余类;ICR技术可有效地对材料中红章、手印、二维码、头像等20余类关键目标进行检测提取;边缘检测法、虚拟化检测法、图像增强等技术可优化处理材料的黑边、空白页、像素低、噪点等问题,综合识别准确率不低于98%。

基于特征的图像视频识别技术:华宇视频行为分析技术,基于改进后的人体姿态检测网络(OpenPose)与改进后的时空图卷积神经网络,对人体的18或25个关节点信息运作进行识别;并结合目标检测策略(基于改进后的Yolo v3架构)完成特定目标的检测、特定场景异常行为检测与预警等12类行为检测。实现了庭审视频巡查、讯问行为监控、监所视频行为监控等功能,对未穿法袍、迟到、离席、人数不足等20-30种庭审违规内容巡查,识别准确率在97%以上;能够对下蹲、坐着、站立、举手、打电话、抽烟、冲突、摔倒等监所、讯问危险动作和异常行为的识别预警,准确率达到85%以上。

多场景多语种司法语音识别技术:华宇基于NLP技术,加强对法律行业相关语音识别,重点解决了热词问题,攻克了人名、地名的准确识别,1小时音频在10分钟左右转写完成,在司法特定普通话场景识别上准确率高达98%以上;同时支持四川、河南等20多个省的方言口音,对藏语、维语等少数民族语音识别率为85%以上。

面向行业的多元审判虚拟现实技术:华宇利用虚拟现实技术,将线下法庭搬到线上,基于深度学习的轻量级分割模型,让线上虚拟法庭可以完成庭审视频中人体图像与背景的分割,人像准确识别达97%,并虚拟化呈现国徽、法庭、席位人员名称,构建出严肃、认真的线上庭审环境,同时结合远程视频会议加入多方当事人,满足多种环境下虚拟法庭的需求。

海量多元异构法律数据深度融合与管理技术:该技术可自动化数据资源的采、存、管、通,实现了从数据集成调度、存储监控,到数据资源目标管理、元数据管理、主数据管理、再到数据质量管理、数据安全管理、平台运维管理的数据全生命周期管理。并基于融合规则的自动化数据融合技术,提升了适应复杂数据融合场景的融合规则准确性,以及增量数据融合技术和亿级以上数据量级的融合性能。在司法领域实现了多源数据中人-案-物主数据实体的深度关联融合与关联关系构建,提升了数据利用价值。

PB级数据高性能高可靠存储计算技术:基于MPP+Hadoop混合技术架构,华宇实现了结构化数据、文件数据、日志数据、互联网数据、音视频等各类型数据的高性能、高可靠存储和计算;实时的数据存储计算组件,可支撑高并发流式数据实时存储和计算;支持从GB到PB级数据量快速查询与分析;高可扩展性,可灵活增加集群节点数量,线性提高系统处理能力;并支持存储计算组件的统一可视化运维管理。

潜在与隐形法律实体关系智能发现技术:基于法律知识图谱,华宇在海量的数据中逐步挖掘潜在的与隐形的法律实体关系,包括全量的“人-案-律师-企业-法官-法院……”等的关联关系,逐步构建完整的证据链条、实体画像等,让虚假诉讼智能发现、证据智能审查等机器智能变成可能。通过机器智能辅助审查,自动拆分待审事实,提取待审证据,法官审查时间降低60%。

面向司法审判闭环的个性化知识智能辅助技术:基于法律知识图谱,实现面向用户的基于案情的个性化司法知识辅助推荐(法律智库),覆盖案件审理全过程,包括案例推荐、法条推荐等10多个辅助应用。基于该技术,在刑事案件办理中根据案情进行智能化量刑分析,实现了对400多万公开刑事裁判文书全面挖掘分析,推送具有类似量刑情节的量刑结果和真实案例,并提供分析报告。目前,华宇基于知识图谱的量刑建议在最常见的10种刑事案件量刑分析准确率高达90%。

基于跨专业语言表达的法律思维智能交互技术:司法领域不同的人员和群体的表达方式不同,可能会造成表达措辞不一致。基于法律知识图谱的司法语言自动理解解决了该问题,为文书智能生成、智能问答、诉讼材料智能生成等智能应用逐步专业化提供了支撑。

截至目前,华宇2018年推出的法律人工智能平台,已经为法律行业提供110+业务应用场景的203个智能点支持,应用于全国24个省、自治区、直辖市的1000余家客户单位。2020年的疫情期间,华宇推出的云间互联网视频一体化法律服务平台,已助力全国法院累计开庭次数超过36W+,开庭时长超过35W+小时,开通服务的包括最高人民法院及31个省(自治区、直辖市)2517家法院13844间法庭(数据截止到9月)。

法律与科技深度融合:产品的广度与深度要兼具

法律与科技的融合需要相当长时间的积累,不可能一蹴而就。真正有价值的法律科技解决方案,不仅需要有针对法律行业的创新技术作为支撑,还需要在法律场景的广度与深度上深入钻研,才能让科技与法律更适配。

法律科技深度融合:技术创新与生态建设双管齐下

产品覆盖面广

在立法、守法、执法、司法四大体系中,每一个环节的业务场景都涉及多区域、多部门、多角色,以及不同阶段、不同状态等,需要法律科技产品全方位考虑,才能满足各部门的诉求。以司法环节为例,华宇深入了解上下游相关部门的特殊需求,形成了不同场景的个性化方案。

针对法院行业,华宇打造了“人民法院大数据管理和服务平台”,全面覆盖了全国3500多家的法院,服务全国12万名法官。针对地方级法院,华宇联合北京法院打造了“睿法官”,利用人工智能模拟真正的法官思考,代替法官完成一系列伴随式、精准式司法审判事务性工作,让法官将更多的时间精力投入到司法审判工作。同时,华宇还以信息技术助力北京互联网法院,将互联网、云计算、大数据、人工智能与司法审判、诉讼服务体系深度融合,为当事人带来智能高效的诉讼体验。

针对检务工作,华宇基于大数据和AI技术研发了智能办案辅助系统,在北京、贵州、浙江、湖北、广东等地得到了很好的应用;其自主研发的智能证据审查技术,可有效辅助检察官通过技术手段审查证据。针对司法行政,华宇深度参与司法部“数字法治、智慧司法”信息化新体系的研究与制定,以智慧调解大数据应用率先打造“数字法治、智慧司法”的第一个示范性业务升级模板。

除此之外,华宇还与北大英华,以及百度、阿里、腾讯等公司合作,将在司法领域打造的产品和解决方案,向立法、执法、守法、监察等法律相关领域延伸。希望可以打造一个贯通和连接立法、司法、执法和守法各个机关、人员和活动的法律科技网络,为新一代法律服务提供基础技术支撑。

产品深耕精研

法律相关科技产品不仅需要全覆盖应用场景,更需要持续迭代产品性能,相关产品需要随着法律业务与场景不断变化而更新。例如,作为智慧法院核心产品的华宇审判系统,目前已更新至基于AI的第三代智慧审判系统,产品功能与技术架构得到全面升级。

功能上,华宇新一代智慧审判系统从信息填写驱动转变为卷宗驱动,通过电子卷宗的自动信息提取和回填,实现无纸化办案。同时,系统的一站式文书中心,实现文书全流程集中管理,加入了区块链技术,从源头保障案件信息更加安全。针对不同案件领域,该系统提供了专业化办案平台及专门的辅助工具,为案件办理提质增效贡献科技力量。

架构上,系统以前台+中台+后台的分层架构模式建设,前台构建各角色专属业务平台,中台采用微服务架构设计,满足法院案件增长需求,后台集成法律人工智能平台,提供智能分析运算,用科技助力审判各个环节提升审理效率。

华宇产品的深耕在华宇输入法上也有体现,一方面积极响应国家信息技术应用创新,另一方面华宇拼音输入法持续打磨,经过二十年的发展历程于2020年8月全新改版,新版的华宇输入法更加符合用户使用习惯,大大提升输入速度,完美适配Windows系统,贴合发法律机关、政务办公等应用场景。

法律科技健康发展,需要加强生态建设

法律科技是新基建的重要组成部分,其健康稳健发展离不开生态的建设。华宇认为法律科技生态建设,首先需要搭建一个一体化法律服务平台,然后围绕该平台从“产学研用”展开创新,加强法律科技人才培养,进而形成开放、合作共赢的生态。

华宇的一体化法律服务平台,深度融合5G、AI、大数据、互联网、区块链等技术,连接立法、司法、执法、守法全领域、全场景的法律科技网络。其核心的法律人工智能平台由华宇智链(华宇区块链平台)与睿元(华宇大数据管理平台)、睿核(华宇人工智能认知平台)、智核(华宇人工智能感知平台)所构成。同时,基于区块链的可信数据及可信计算环境,连通了公检法司、政法委及外部协作权威机构,形成了连接2G、2B、2C的各个场景、覆盖全行业的司法高可信业务协同生态体系,为法律科技生态建设奠定基础。

法律科技深度融合:技术创新与生态建设双管齐下

华宇一体化法律服务平台

加强人才培养方面,华宇通过一系列新的人才机制和培养计划,形成了以CTO孙明东、副总经理米坤、华宇元典总经理邹劭坤、研究院副院长沈来信等为代表的法律科技专家团队,发展至今华宇已经拥有超7000名具备法律知识背景的员工。华宇还与各大高校合作扩大人才培养,例如华宇与清华大学、北京大学、中国政法大学等全国十几所高校进行了深度合作,例如与清华大学合作成立法律大数据研究中心,与北京大学合作成立法律人工智能实验室,以及与政法大学、人民大学、四川大学、东南大学、大连理工和北京交通大学开展课题研究等。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )