导读:知识图谱是一系列展示知识发展过程和结构关系的不同图形,利用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和展示知识及其相互关系。 本文主要分析什么是知识图谱,知识图谱的现状与发展。

2012年,推出了一款名为Graph(知识图谱)的产品,它源自谷歌,主要用于提高搜索引擎的质量,改善用户搜索体验。

2020年,知识图谱从一个分支产品变成了构建大规模知识的杀手级应用,在搜索、自然语言处理、智能助手、电子商务等领域发挥着重要作用。

8年来,随着大数据时代的到来和人工智能技术的飞速进步,知识图谱变得越来越基础和重要。

那么,知识图谱到底是什么?

知识图谱是一系列展示知识发展过程和结构关系的不同图形,利用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和展示知识及其相互关系。

知识图谱可以将互联网的信息表达成更接近人类认知世界的形式,同时提供更好的组织、管理和理解互联网海量信息的能力。 知识图谱为互联网的语义搜索带来了生机,在智能问答方面也展现出了强大的威力。 成为互联网知识驱动的智能应用的基础设施。 知识图谱与大数据、深度学习一起成为互联网和人工智能发展的核心驱动力之一。 【1】

文字表述看似深奥,但实际上,我们在日常生活中时常感受到知识图谱技术带来的便利。

图1

图 2

比如你在百度里搜索刘德华的个人信息,就会有图1和图2两种显示形式,从内容上看,两者显示的信息相差不大,但是图2看起来更直觉的。 尤其是随着正文内容的增多,图2所示形式的优势会更加突出。 放在大数据的互联网平台上,图2的表达方式显然更容易处理和处理,但是互联网等数据平台收集的信息大多是如图1所示的碎片化信息,所以图2中的文本内容图1转化为图2的过程涉及到前面提到的知识图谱技术。

图 3

再比如图3,我们经常会看到某个人或事件的关键词呈现。 事实上,这种呈现形式也是机器利用知识图谱技术,对网友评论等碎片化信息进行梳理和处理后形成的。

2020年知识图谱技术发展现状

根据《2020年人工智能中国专利技术分析报告》统计,知识图谱技术专利申请量整体呈稳步上升趋势。 2012年以来,我国知识图谱技术领域专利申请增速明显加快。 从图4可以看出,申请量在2019年达到顶峰,全年共申请相关专利4966件。 据不完全统计,2020年初至2020年10月底,该领域专利申请量已达1942件,知识图谱技术正成为各权利人在人工智能行业获得竞争力的有力武器. 【2】

图4:我国知识图谱领域专利申请年度趋势(2020年统计数据截至2020年10月末,因滞后性披露统计数据不完整)

为了更好地了解知识图谱领域专利申请人(或企业)的情况,笔者通过北京知识产权公共信息服务平台搜索知识图谱领域专利申请情况。 搜索结果如图5所示,通过搜索发现在知识图谱领域,腾讯科技(深圳)有限公司、北京百度网通科技有限公司、平安科技(深圳)有限公司、北京明略软件系统有限公司和百度在线网络技术(北京)有限公司分列前五。 其中,腾讯科技以550件专利排名第一,百度网通以346件专利排名第二,平安科技以182件专利排名第三,北京明略以110件专利排名第四,百度以110件专利排名第二。 92项专利排名第五。

图5 检索日期:2021-02-22

同时,笔者还在国家知识产权局专利检索分析网站上检索了知识图谱领域的相关专利。 检索结果如图6所示,与使用北京信息服务平台的检索结果相比,排名前五的专利申请人相差不大,分别是百度网通、平安科技、腾讯科技、海南大学和北京明略。 但在专利申请数量上存在一些差异。 百度网通以237件专利申请排名第一,平安科技以136件专利申请排名第二,腾讯科技以116件专利申请排名第三,海南大学以64件专利申请量排名第四,北京明略以59件专利排名第五应用程序。

图6 检索日期:2021-02-22

从图7可以看出,在2020年知识图谱领域专利申请量国内省市排名中,北京和广东是主要的申请地区。 其中,北京以31%的专利申请量排名第一,广东以24%的专利申请量排名第二,浙江以11%的专利申请量排名第三。

图7:2020年中国各省市知识图谱领域专利申请占比

使用工具: 智慧芽专利数据库 智慧芽英策

从图8可以看出,2020年申请的知识图谱领域专利IPC主要集中在G06和H04,其中以21%的比例排名第一,G06K9以17的比例排名第二%; G06N3以14%的占比位居第二,排名第三。

图8:2020年知识图谱领域专利申请IPC技术分支占比

使用工具:智慧芽专利数据库、智慧芽英策

从图9可以发现,人工智能、知识图谱、特征向量、机器学习、深度学习等关键词成为2020年知识图谱领域专利申请中的创新词云。

图9:2020年知识图谱领域专利创新词云

使用工具:智慧芽专利数据库、智慧芽英策

据中软网不完全统计,我国拥有知识图谱产品或解决方案的主流企业约有38家。 其中,金融领域约占65%,公共服务和政务领域约占26%,能源和工业领域约占26%。 该领域约占26%,是企业进入最多的三个领域。

图10:行业应用知识图谱企业分布

中国软件网编图

从图10可以看出,很多企业利用知识图谱技术涉足金融、公共服务和政务、医疗医药、能源、工商业等多个领域。 例如,腾讯云利用知识图谱技术发展物联网,应用于医疗设备、交通车辆GPS等。阿里云利用知识图谱技术支撑电力领域的作业流程。 华为云利用知识图谱技术助力油气勘探开发。 涉足政务、能源、工商业。 北京海智网居信息技术有限公司利用知识图谱技术实现在公安领域的实践。

人工智能技术的图片_联通智能人工服务_红米note智能人工语音

那么知识图谱在实际工作中是如何在不同领域发挥作用的呢? 笔者咨询了明略科技集团知识工程实验室主任张杰博士。 张杰博士曾带领团队以“知识图谱的自动构建及行业应用”为题获得2020年第十届吴文俊人工智能科学技术奖一等奖。 张杰博士说:

过去几年,铭略科技通过自主研发的知识图谱服务于政府、公安、银行、保险、证券、轨道交通、电力、制造、金融传媒、食品安全等领域的200多家企业平台和预建的行业解决方案。 业客户。

在社交媒体舆情分析场景中,基于知识图谱,可以将用户产生的评论与后台产品知识库进行比对,方便运营商分析产品更细粒度特征的用户舆情趋势,然后将这些结果整合到BI系统中,从而实现对用户需求的洞察,辅助创意内容的制作,实现千人千面的个性化广告。

线下零售场景,首先,销售人员佩戴明略的电子徽章将销售过程数字化,然后通过语音识别技术将销售对话转化为文本,再利用自然语言处理技术进行话题分类,并计算话题数量话题之间。 转移的概率形成了主题转移的知识图谱。 最后,通过与金牌业务员话题图对比,帮助业务员进行复习,分析订单流转的主要环节,提高口语表达能力,提高接单率。 我们开发的HAO图谱系统是目前全球首个企业级知识图谱开发工具包,可将语音实时生成图谱。

在金融风控场景下,个人授信客户可以通过亲戚、朋友、同事、担保等关系构成图,企业客户可以通过股权、担保、资金等关系构成图。 我们使用图表示学习算法来对客户进行矢量化表示。 包含图的结构信息,该向量可用于反欺诈模型和信用评分模型。

在工业设备检修场景中,我们可以从传感器发送的故障信号的时间序列数据中挖掘故障的主伴关系,我们可以从检修工单的非结构化文本中挖掘因果关系,然后逐步拼接出维修知识图谱,为维修人员提供最佳维修实践。 应用该系统后,车辆故障率降低了50%左右,逐渐从每天保养变为8天保养,大大减少了操作故障,减少了人工作业,提高了维修效率。

知识图谱未来已开,未来已来

据统计数据显示,目前知识图谱在技术上已经有了一定的发展,并逐渐开始在电商、公安、医疗等领域落地。 那么知识图谱领域目前的发展情况如何,有哪些优势呢? 未来知识图谱技术的发展将面临哪些技术挑战? 针对这些问题,张杰博士回答说:

知识图谱的发展得益于技术的逐渐成熟和数字化转型的历史趋势。 近年来,在大数据和人工智能技术快速发展的背景下,许多传统行业进行了新一轮的数字化转型。 2020年两届会议期间,数字化转型都被列入政府工作报告。 智能化是企业数字化转型的新方向和新阶段。 在智能化过程中,业界普遍认为可以分为三个阶段:计算智能、感知智能和认知智能。 知识图谱被认为是从感知智能到认知智能的关键环节,因此受到了广泛的关注。 越来越多的公司和组织正在构建知识图谱,并结合业务场景进行应用:一种是更通用的技术类型应用,如视觉洞察、信息检索、推荐系统、基于任务的问答等; 另一类是具有行业特色的解决方案型应用,如金融反欺诈、快消品营销、工业维护等。

知识图谱的优势主要体现在以下几个方面: 1)连接企业内部数据和海量外部数据。 知识图谱数据类型定义灵活,可高效支持深层次关联查询,在提升数据利用效率的同时扩大企业数据总量,释放大数据红利; 2)连接大数据技术和人工智能技术。 可以从网络结构、时间序列、行为对话等新型数据中处理高层特征,提供给下游算法工程师,使他们更专注于特定的业务模型; 3)连接领域知识和常识知识。 它可以对已有的知识体系进行整合、补全和推理,提高知识体系的完备性,为流程优化、辅助决策、预测分析等下游应用提供基础服务。

尽管知识图谱技术具有广阔的应用前景,但现阶段仍面临诸多技术挑战:1)建设成本。 对于结构化数据,需要进行复杂的数据治理工作,对于非结构化数据,在信息抽取过程中需要进行大量标注工作; 2)推理精度问题。 知识图谱可以提高搜索引擎和推荐引擎的准确率,但其独特的应用价值在于推理问答,需要解决领域知识不完备、数据量大的情况下快速准确推理的问题; 3)用表格来说明问题。 知识图谱的价值在于应用。 应用难点在于知识推理,知识推理难点在于知识表示。 现有技术成果大多集中于事实性知识(know-what),而对原理性知识(know-why)和技术性知识(know-how)的研究缺乏数学基础和最佳实践参考。

在一些行业,数字化进程起步较晚,需要首先解决在线数据和数据积累的问题,而对数字化建设和数字化管理的文化重视可以使知识图谱技术的应用成为可能。 未来的变化可能包括以下几个方面: 1)随着5G、物联网和传感技术的逐渐成熟,企业中非结构化数据的比重将会增加,来自语音、图像、视频多模态的联合需求会越来越多从数据中提取知识; 2) 结合 know-how知识和know-what知识,促进人机协作下的智能决策; 3)知识密集型行业的企业越来越重视知识资产。 基于知识图谱技术构建知识平台,不仅仅是管理文档和数据,而是通过专家经验和数据驱动的方法发现因果关系和推断因果关系,辅助业务决策。

从蒸汽时代到电力时代,再到21世纪的信息时代,科技的发展推动了时代的进步,人工智能正成为推动人类进入信息时代的决定性力量的情报。 我们期待知识图谱这一被认为是从感知智能到认知智能的关键环节的技术,在未来有更大更广的应用和发展空间。

笔记:

[1]:《工业专利分析报告——人工智能关键技术(第68卷)》

【2】:工信部电子知识产权中心公众号文章《知识图谱专利布局加速提升AI产业竞争力》

来源:中文网()

编辑:王颖校对:纵横君

“投稿”请发邮件“”

編輯:碩谷新聞聚合

點讚(0) 打賞

评论列表 共有 0 條評論

暫無評論

微信小程序

微信扫一扫體驗

立即
投稿

微信公眾賬號

微信扫一扫加關注

發表
評論
返回
頂部