blog

揭开谷歌知识图的神秘面纱

<p>搜索正在发生变化 - 而且变化速度比以往任何时候都快,我们越来越多地看到搜索结果中的有机元素被来自知识图的显示所取代但是从搜索文档(例如网页)转移到搜索数据(例如知识图)仍然处于起步阶段记住谷歌的使命宣言:谷歌的使命是组织世界的信息,使其普遍可访问和有用知识图是为了帮助实现这一使命而构建的</p><p>它包含有关实体及其相互关系的信息 - 这意味着Google越来越能够将搜索查询识别为一个独特的实体,而不仅仅是一串关键字随着我们从基于关键字的搜索转向更多基于实体的搜索,内部数据质量变得越来越迫切换句话说,如果你想要在未来的搜索结果中找到,搜索引擎需要能够理解什么是ent ities在您的网页上搜索引擎技术可以通过两种方式从您的内容中提取实体信息 - 显式(使用结构化数据标记),或隐式(使用自然语言)显式vs隐式实体当搜索引擎使用结构化数据标记时获取显式实体在网页上,利用语义网技术这样做隐式实体指的是何时从网页上的文本中推导或推断实体信息用于获取这些实体的技术通常是某种随机算法,如NLP(自然语言处理) )或类似形式的信息检索技术(查看我上一篇文章中的工具列表,以帮助确定网页上隐含和显式实体的内容)</p><p>外卖:确保隐式和显式实体都发送相同的“信号, “即,是关于相同的主题,从而加强关于您发送给搜索引擎的主题的积极信号对于那些关心“进入知识图”的人来说,在网页上放置Schemaorg的结构化数据标记至关重要Schemaorg提供了一系列结构化数据标记模式,帮助搜索引擎理解HTML文档中包含的信息</p><p>结构化数据允许搜索引擎识别实体并定义它们之间的关系 - 这反过来导致更好,更丰富和更有用的搜索结果Schemaorg定义(除其他事项外)关系换句话说,成为某事物的权威资源并标记你的具有适当结构化数据标记的页面可以增加“进入知识图”的可能性以下是如何使用Schemaorg和JSON-LD将事件导入Google知识图的示例注意:此分步指南/示例直接来自Google I / O教程(可在此处找到)以及一个或两个scr来自Google I / O 2014的“Cayley”教程(可在此处找到)中的eenshots正如我已经提到的,理解实体有助于Google了解世界上的“事物”以及用户搜索的内容知识图利用信息来自维基百科,Freebase,谷歌地图,FDA等权威来源在事件中,事件信息的最佳和最权威的来源是活动组织者自己因此激励搜索引擎从表面获得权威性答案活动组织者的官方网站从下图中可以看出,“Keith Urban”的知识图谱结果包含即将到来的节目列表来自官方网站的结构化数据由搜索引擎使用,然后该信息直接存储因此,在Google的知识图表活动中,组织者需要获得他们的活动的所有权并相应地标记他们的网站谷歌抓取网络,然后它可以读取标记并在用户搜索该信息时向用户显示结果正如您所看到的,知识图表可以提供大量信息和周围事件的结果在这种情况下,我们会看到知识图形供电:Schemaorg是指定此信息的首选词汇或本体,因为它受到主要搜索引擎的支持,即Yandex,Yahoo,Microsoft,当然还有Google 就您用来标记事件列表的语法而言,它可以在微数据或JSON-LD中完成,无论您喜欢哪种决定您要使用哪种语法并坚持使用它(在我个人看来,JSON-LD是更容易)一旦你选择了你的语法,在整个网页(最好是网站,根据你正在标记的信息类型)使它保持一致.Microdata(左)和JSON-LD(右)为schemaorg类型MusicEvent对于类型事件,确保您最具体的子类型,例如“SportsEvent”(或您正在标记的任何事件类型)对于特定的事件子类型,您可以添加有用的属性,例如主队和客队</p><p>在下面的示例中,来自Keith在Urban网站上,您可以在官方艺术家网站上看到列为“MusicEvent”JSON-LD的活动类型</p><p>对于“报价”信息,添加卖家网页的URL此时,谷歌将尝试访问卖家的卖家并检查corres积极信息JSON-LD下面显示该网页应如何标记的示例,如官方卖家网站所示,您可以清楚地看到,优惠已被标记,价格信息,有效日期,可用性票证(“InStock”)和提供票证的网站一旦您实施了标记,下一步就是确保它有效对于事件,您可以使用Google的事件标记测试器页面(对于其他类型的结构化数据) ,查看谷歌的结构化数据测试工具)谷歌的事件标记测试工具所以你有它总而言之,谷歌将抓取官方网站,检查网站上的事件的官方售票员,将该信息存储在知识图表,以及当用户正在寻找数据时,能够在搜索结果中显示它对于那些有事件要标记的人,享受这样做;对于那些在不涉及事件的域中工作的人来说,理解该过程仍然有用,因为它与其他类型的结构化数据标记实现类似</p><p>另外,我建议考虑实体: “事情,而不是字符串”,正如谷歌所说的那样搜索的未来正在逐渐脱离“关键词”的概念,关于“关键词密度”的概念在搜索引擎优化的未来中没有任何地方请注意以下谷歌研究博客的最新声明:换句话说,随着语义技术变得越来越复杂,您可能只需要提及一次概念,其余部分可以由搜索引擎推断出来</p><p>因此,随着搜索引擎变得越来越敏感,自然语言将越来越成为常态隐式实体关键字填充将 - 实际上已经是 - 一种过去的技术总之,您可以做很多事情来优化知识图谱的网页我的公关正如本文所讨论的那样,imary策略在此概述:本文中表达的观点是客座作者的观点,

查看所有