如何使用实体标记出现在知识图中

作者:毛哼

<p>搜索引擎越来越多地采用语义搜索的元素来改善搜索体验的某些方面 - 例如,使用schemaorg标记在SERP中创建增强的显示(如在Google丰富的片段中)语义搜索的元素现在几乎存在于所有阶段</p><p>搜索过程和语义Web发挥了关键作用继续阅读更多细节,并学习如何利用这个机会使您的网页在这种搜索演变中更加醒目在语义搜索的引擎下尽管已经有了学术界内部对语义网“从未发生过”的一些争论,显然谷歌已经采用了自己的版本</p><p>其他搜索和社交引擎也是如此 - 我在2012年9月写了一篇文章讨论搜索和社交引擎正在采用语义Web和语义搜索,并给出了搜索和社交引擎采用语义搜索的时间表即使在那时,很明显,搜索引擎正在朝着成为答案引擎的方向发展,并且他们越来越多地利用语义Web和语义搜索技术当时Google也在使用schemaorg来扩展知识图在2013年5月Google I / O上清楚地说明了这一点,当知识图仅处于起步阶段时,谷歌高管讨论了他们对回答和预测问题的关注,以及对话搜索几个月后Hummingbird的声明得到了加强这个新的方向并且表明知识图谱项目迄今为止取得了巨大的成功知识图表扩展了Schemaorg标记,来自Google I / O 2013(点击放大)Google I / O 2013在Hummingbird出现之前,我们已经看到了越来越多地在搜索过程的每个阶段使用语义搜索技术在更高的层次上,您可以将它们大致定义为:se的阶段当然,在实际查询之前发生的arch进程是对内容(Web文档或Freebase等数据集)的索引和分析</p><p>索引的目标实际上是为了加快答案呈现,现在它已经达到了预先提取和消除实体(或识别实体)的歧义;因此,在您的网页上添加语义标记,相关的页面优化是必须的知识图:理解/唯一识别世界中的每一件“事物”理解语义搜索的关键是身份Google的知识图计划旨在提供世界上每个“事物” - 或实体 - 的身份这个身份包括关于实体的事实,以及它与其他实体的关系创建这些身份的目的是使搜索引擎能够更好地理解用户对模糊搜索查询的意图(例如,搜索短语[黑眼豆豆]是否会返回食物或音乐组的结果</p><p>)了解用户意图是从搜索引擎转到答案引擎的关键 - 而不是将您的查询与关键字匹配一个页面,搜索引擎希望根据上下文了解您正在寻找的内容,并为您提供最相关的答案Microsoft已给出了相当简洁的定义o f实体识别和消除歧义过程:实体识别和消歧系统的目标是识别给定文本中的实体的提及,消除它们的歧义,并将它们映射到给定实体集合或知识库中的实体</p><p>在谷歌的情况下,表示识别网页或Web文档中的实体并将其映射回知识图中的特定实体此时,每个人都熟悉schemaorg在您的页面上放置schemaorg标记对于使它们具有机器可读性和协助搜索引擎是一个巨大的帮助;然而,有可能更进一步在2013年7月,Freebase通过Google+发布了一个有趣且重要的声明:这意味着网站现在应该被标记以表明他们在内容中谈论的“实体” - 告诉搜索引擎这些实体与其他网站或实体数据库(如Freebase)上的“sameAs”让我们仔细研究一下</p><p>在Dan Brickley和Shawn Simister的Google I / O 2013演讲中,他们说明了2个使用示例这个“SameAs”属性第一种方法是声明你的模式组织实体(无论是什么)与其他网页相同,例如维基百科,这是一个例子:Schemaorg“SameAs”映射回URL第二种方式是将您的实体与知识库中的ID相关联,例如Freebase:Schemaorg消除歧义(使用“SameAs”)到项目的Freebase MID对于你不熟悉的人来说,Freebase是“一个由知名人士,地方和事物组成的社区策划数据库” - 换句话说,一个非常大的实体数据库Freebase中的每个实体都由一个机器ID(MID)标识,它基本上是一个分配的ID号,MID采用[/ m / xxxxx]的形式,其中[xxxxx]代表一串数字而且更低-case可变长度字母让我们假设您想要查找MID以帮助搜索引擎消除页面上实体的歧义我将使用Danny Sullivan的示例如果我去Freebase并使用顶部的搜索框查找他在页面中,我得到以下结果:(点击进入正如你所看到的,有几个Danny Sullivans可供选择我选择了“组织创始人”,因为这是Danny Sullivan在这里打算你可以看到他在Freebase(或MID)中的唯一ID是[/ m / 0fyf30因此,我们可以使用他的Freebase MID将他标记为一个特定的实体(并将他与其他Danny Sullivans消除歧义),如下所示:Markup with“Danny Sullivan”消除歧义并映射到他的freebase MID</p><p>对于实体映射的一个很好的用例,检查Moz博客上的“我是一个实体:黑客知识图”请记住完全指定实体的每个属性,以便在搜索引擎中获得最大的可见性,并且还有资格获得完整的丰富网页摘要这在谷歌的公告中进一步说明了关于事件数据的一周你可以在这里看到完整的信息是必不可少的,你可以使用从微数据到JSON-LD的选项,如本搜索引擎土地文章中所述</p><p>完整信息是势在必行值得注意的是:结构化数据变得如此多产,以至于现在需要识别该数据的官方列表,....