后台-插件-广告管理-手机广告位-内容正文顶部 |
从产品经理的角度解释知识图谱。
编辑指南:知识地图是什么? 你是怎么构建的? 作者从知识地图的应用、构建过程、数据要求等方面进行了分析,希望对同为非技术出生的产品经理有所帮助。
因为在工作中参加了猜谜相关的项目,所以需要有关“知识地图”的知识。 作为非技术出身的b端产品经理,我多少不知道也不习惯第一次参与AI领域。
在那里阅读了很多文献资料和技术科普,也向身边制作AI的技术人员请教,从中大致理解了“知识地图”的原理,并整理了以下文章。
我的文章想让同样是非技术出身的产品经理和其他单位的同学更容易更迅速地知道什么是“知识地图”。
一、知识图谱的应用在介绍知识图谱之前,先谈谈知识图谱在日常中的应用。
1 .智能搜索举个例子,你在百度搜索“杨幂”时,搜索结果除了杨幂的个人信息和相关新闻外,还展示了与她的相关圈合作过的艺人。 这些人际关系信息都与“杨幂”这个关键词不一致,但由于与“杨幂”这个实体有实际关系,所以在“杨幂”的搜索结果中。
2 .智能问答; A智能问答; 那么,从知识图谱中推论答案。 例如,搜索“杨幂的前夫”时,会直接回复“刘恺威”的信息。
举另一个例子,在线医疗行业中,如果患者想挂号,但不知道挂哪个科室好,可以从就诊前助手那里获得科室信息。 诊前助手根据专业医疗知识图,采用多种算法模型与多种智能相互了解患者病情,根据患者病情准确匹配就诊科。
3 .个性化推荐搜索张国荣的《胭脂扣》时,会根据《胭脂扣》电影信息推荐更多相关作品,包括演员、导演、上映年份、作品类型等。 例如,推荐张国荣的其他电影、同一时期( 80-90年代)的香港电影、与张国荣合作的其他演员的电影等。
4 .以风险防范支付宝( Alipay )为例,在支付场景下,利用知识图谱将小票诈骗、信用卡套现等行为扼杀在摇篮里。 通过知识地图的地图数据库,对不同个体、团体进行相关分析,对人员在指定时间内的行为,如外地的IP地址、使用的MAC地址(包括手机端、PC端、WIFI等)、社交网络的相关性
二、知识图谱的定义在讲解定义之前,我们先来看看知识图谱的表现形式——【E-R图】。
(图为来自百度搜索() )。
由上图可知,无论E-R图变换为何种形式,外观如何不同,他都是由多点和多条线相互连接而形成的关系型网络。
我们把点称为【实体】,把线称为【关系】。 每个实体可能与一个或多个实体有关系。 在此基础上建立最简单的关系型网络需要三个要素:两个实体和一个关系。 这样的结构被称为“三元组”,多个三元组构成知识图。
(三元组)。
举个例子,“小芳和小明是同事,因为工作需要,两个人都在买笔记本电脑。 小明觉得用苹果笔记本更能倒逼,就入手了,小芳觉得联想笔记本更便宜,就选择了联想。 随后,小芳发现被同事安利的名为sketch的软件只有苹果电脑上才有,比Axure更智能、更方便使用。 ”从这句话中,我们可以分解出多个三元组:
实体:小明、小芳、苹果笔记本、联想笔记本、斯凯。 实体是名词,表示人、事、物的抽象对象。 关系:购买、拥有、同事。 关系是两个实体之间的联系,这种联系多种多样,可以是类属关系、并列关系等。 知识图的三元组除了可以表达实体之间的关系外,还可以表达实体的某些属性。 例如“小明”是实体,其他的“性别、出生年月日、出生地”等可以是属性。
事物被定义为实体的“属性”,有两个基本标准:
属性不能具有需要描述的性质。 属性必须是不可分离的数据项,并且不能包含其他属性。 不能与其他实体相关联。 此外,根据实际情况,实体可以是属性、属性或实体。
下图显示“员工”是一个实体,“员工编号、姓名、年龄”是员工的属性,“职称”与“工资、学位津贴、福利”没有关联,换言之,如果没有需要进一步描述的特性,则
但不同职称的工资、岗位津贴、附加福利不同时,职称作为一个实体来看更为合适。
(照片来自网络。 侵害时请联系删除)
说到这里,应该能更好地理解【知识图谱】的定义。 知识地图是结构化语义知识库,用于描述物理世界中的概念及其相互关系作为符号。 其基本构成单元是《实体-关系-实体》三元组和实体及其关联属性-值对,实体之间通过关系相互联结,构成网状知识结构。
知识地图打破了不同场景下的数据隔离,为搜索、推荐、答疑、解释、决策等应用提供基础支撑。
三、知识图谱的构建过程了解知识图谱的构建,有助于更好地理解知识图谱的应用原理。
知识图的构建过程概括为以下三个方面。
关于各步骤的介绍及其意义,整理了下表。
非商业转载请注明出处
下图是知识图的技术框架,有助于更好地理解知识图的构建过程。 虚线框内的部分既是知识图谱的构建过程,也是知识图谱的更新过程。
(照片来自网络,经过文化处理。 侵害时请联系删除)
四.数据请求和数据库类型1 )构建知识图谱需要哪些数据?
答案是“结构化数据”。
知识图谱的原始数据类型一般有三种:结构化数据、非结构化数据和半结构化数据。 最终的知识地图需要结构化数据。
结构化数据是高度组织和格式设置的数据类型,可以存储在电子表格中。 典型的结构化数据包括信用卡号码、日期、财务金额、电话号码、地址、产品名称等。
相比之下,非结构化数据是指不容易组织和格式化的数据,没有预定义的数据模型,不方便用数据库的二维逻辑表表示。 可能是文本或非文本,也可能是人工或机械生成的。
简而言之,非结构化数据是字段可变的数据,主要是合同文件、文章、PDF文件等文档、文件等。
另一方面,半结构化数据是非关系模型,是具有日志文件、XML文档、JSON文档等基本的固定结构模式的数据。
对于非结构化数据以及半结构化数据,需要确认从中提取什么样的可以利用的信息,制作信息登录规则,使用NLP等技术,将有效的信息作为结构化数据生成,并编入知识地图。
2 )图数据库与关系数据库的区别
知识地图用地图数据库保存数据。 图数据库不是存储图像、图像的数据库,而是存储图所示数据结构的数据库。 之前说的E-R图是图数据的可视化展示。
与使用传统二维表存储数据的关系数据库不同,图数据库在传统意义上被归类为一种无NoSQL(Not Only SQL )数据库。 这意味着图数据库属于非关系数据库。 为了避免内容过于技术性,这里不详细介绍图数据,只简单说明下图数据库和关系数据库的区别。
关系数据库不擅长处理数据之间的关系,而图数据库在处理数据之间的关系方面具有灵活性和高性能。
传统的关系数据库通过外键约束实现了多个表之间的关系引用,因此不如处理复杂关系的数据。 查询实体之间的关系需要JOIN操作,但JOIN操作通常需要时间。
图数据库的原始设计动机是更好地表达实体之间的关系。 图数据库与关系数据库的最大区别在于无索引相邻,图数据模型中的每个节点都保持与其相邻的节点关系。 也就是说,查询时间与图的总体规模无关,只与每个节点的邻居数量有关。 这样,图数据库在处理大量复杂关系时也能保持良好的性能。
此外,图的结构决定了容易扩展的特性。 以后添加新节点、新关系、新属性甚至新标签很容易,而且不会破坏现有的查询和APP功能,因此在设计模型时就不需要考虑所有细节。
在关系数据库中,如果一开始就设计数据字段并让数据在其中运行一段时间,则尝试添加字段会非常麻烦。 开发人员和产品经理必须假定将来可能在开发初期添加的字段,并提前将其添加到数据表中。
参考资料: neo4j-图数据库E-R图:实体和属性划分原则
通俗易懂地说明知识地图
图数据库是什么?
作者:杨桃,游戏行业B端产品经理,喜欢用文字记录观察和想法。
本文宣布@杨桃为原创,人人都是产品经理,未经许可禁止转载。
标题来自Unsplash,基于CC0协议。
- 上一篇
从现在开始,这是最新的行政事业单位会计科目表和行政事业单位会计分录。
行政事业单位会计做账有财务会计和预算会计之分,因此,就和我们常见的一般普通性质的企业会计做账是有很大区别的。首先,我们做账肯定是通过会计科目来核算的,一般企业会计是执行企业会计准则,所以做账用的会计科目就是企业会计准则下的会计科目表了,而行
- 下一篇
教你更改财务负责人和税务员的信息,离开后别忘了更改信息。
账务负责人丽丽上月底成功应聘到了一家大型企业,与原公司办理完了交接手续。朋友提醒她,交接时,千万别忘记了财务负责人信息变更!丽丽也不知道该怎么变更,顺道一块请教一下吧,怎么办理变更手续?原来电子税务局就可以操作!赶快收藏,超实用的!你早晚都
相关文章
后台-插件-广告管理-手机广告位-内容正文底部 |
发表评论