一个搜索并不孤单:推荐相关搜索

3分读

|查理关闭,盖尔数据科学家|金宝搏彩票

我们的数字产品,旨在帮助我们的用户,谁是主要执行研究生,找到他们要找的信息。主要途径我们的产品做到这一点是让用户输入搜索,然后返回的匹配搜索词的文章列表。换句话说,该产品试图回答用户提出的问题。

在大风金宝搏彩票,我们开始寻找办法,我们可以做得更好不仅仅是回答用户提出的问题。我们想建议用户可以问下什么。

我们已经知道是什么感觉有Netflix的推荐下电影观看,或Goodreads推荐下一本书阅读。这有可能带来同样的想法,以学生的研究。

让我们来看一个例子。

首先,音符开始,我们有搜索其他用户执行了,他们检索的文章基于这些检索的履历。这段历史是存储在数据库中。

假设用户搜索“英雄之旅”,这涉及到讲故事,神话和心理学的概念。

绿点或节点,下面代表的“英雄之旅”的搜索。它是从搜索历史记录的数据库中查找。很多人在多次访问我们的产品已取得该搜索。

下面,这里又是节点,但现在的一些文章通过基于搜索用户检索到。每个蓝色节点是一篇文章,搜索和文章之间的箭头指示的搜索和检索它们之间的关系。多行表示来自多个产品检索。每篇文章可能已经在许多不同的访问检索多次。

这里显示的文章的标题是:

英雄之旅
英雄之旅[具有相同名称不同的文章]
约瑟夫·坎贝尔的神话和/对战宗教
在作为一个学术特立独行,金宝搏彩票或约瑟夫坎贝尔指南宇宙
天真的超级大国:在英雄之旅的小女孩
英雄之旅:约瑟夫·坎贝尔在他的生活和工作

数据库存储的文章有多少次被检索对于给定的搜索,所以有可能推荐基于早期用户的搜索历史的文章,提供搜索的最热门文章。

然而,在这篇文章中,我们不会纠缠于推荐的文章。相反,让我们更进一步,看看如何推荐搜索。

正如搜索可能会导致许多文章的检索,所以也制品可通过许多搜索来检索。例如,对于“英雄之旅”的搜索检索标题为“在作为一个学术特立独行”的文章。金宝搏彩票对于“约瑟夫坎贝尔”搜索还检索到的同一篇文章。因此,我们可以说,因为他们有“论作为一个学术特立独行”,在共同寻找“英雄之旅”与检索“约瑟夫坎贝尔”是相关的。金宝搏彩票

两个搜索可以由一个以上的文章有关。在更多的文章两个搜索的共同点,更强的搜索之间的关系。

当我们扩大这个想法,与“英雄之旅”的文章和搜索,我们得到这样的图片。

上图为只有一些与“英雄之旅”的文章和搜索。我们甚至可以进一步扩大到包括所有这些文章,搜索,排序列表把最相关的搜索是在上面。前十六搜索有以下几种。

约瑟夫坎贝尔
英雄
原型
奥德赛
一个英雄的旅程
妇女
英雄之旅约瑟夫坎贝尔
英雄千面
贝奥武夫
约瑟夫坎贝尔英雄之旅
monomyth
神话
英雄
女英雄
奥德修斯
伊利亚特

我们可以推荐这些搜索给用户,这样他或她可以在不同的方向探索和新的和有趣的地方结束。


关于作者


查理关闭在大风数据科学家和前任分析师在大风的搜索引擎团队。金宝搏彩票他的研究包括对用户行为的研究,以提高产品的大风。金宝搏彩票


发表评论