论文导读：Finding and approximating top-k answers in keyword proximity search

[KimelfeldS06]Benny Kimelfeld, Yehoshua Sagiv: Finding and approximating top-k answers in keyword proximity search. PODS 2006:173-182.

温馨提示：“论文导读”旨在推荐他人发表的本领域相关论文。本论文摘要由厦门大学计算机系林子雨老师(http://www.cs.xmu.edu.cn/linziyu)翻译，如果您对该论文细节感兴趣，可以阅读英文原文（全文PDF版权归出版商所有，因此需要到出版商网站下载该论文PDF）。

【摘要】已经有不少研究关注面向关系数据库、XML和WEB的关键词相似搜索，但是，在所有这些方法里，结果都是Q-片段，也就是关于给定数据图G的子树T，T包含了查询Q的所有关键词，并且不存在具有这种性质的T的子树。结果的排序是和结果的尺寸成反比。这里有三个有趣的问题：寻找最优的结果，计算top-k个结果，以及以排序的方式枚举出所有结果。研究已经表明，鉴于数据复杂性，一个可以解决第一个问题的高效算法，也足够可以用来在多项式时间延迟内解决其他两个问题。类似地，为了寻找最优答案的“θ–近似”而设计的高效算法，也可以足够用来在多项式时间延迟内解决如下两个问题。首先，以“（θ+1）–近似”的次序进行枚举。其次，计算 top-k结果的“（θ+1）–近似”。作为一个推论，这篇论文给出了第一个在数据复杂性下的高效算法，来以排序的方式对结果进行枚举，以及计算top-k个结果。同时也给出了高效的算法，它们可以在数据查询复杂性情况下，以一种近似的次序进行枚举，以及计算一个top-k查询的近似。