关键字 |
查询表单,用户交互、查询表单生成 |
介绍 |
最广泛使用的用户界面查询数据库获取信息是查询形式。Historicquery形式是由开发人员或配置和预定义的数据库管理员在不同informationmanagement系统。网络信息的快速发展和科学数据库,新的数据库becomevery巨大的和困难的。在自然科学,如基因和疾病,数据库都有各种各样的实体forchemical和/或生物数据资源。Diversekinds web数据库都有成千上万的结构化网络实体。因此,很难计划的一组静态查询形式回答各种临时数据库查询这些difficultand复杂的数据库。 |
数据库管理和发展现有的工具,如SAP、微软访问,用户数据库上创建customizedqueries。然而,自定义查询的设计完全取决于用户的手工编辑。如果用户不熟悉数据库模式之前,那些成百上千的数据属性混淆他/她。 |
1.1的方法 |
用户的相关反馈系统实现动态查询形式,一个查询接口能够ofdynamically形式为用户生成查询。用户在数据库检索往往愿意执行多轮ofactions(即。之前,提炼查询条件)确定最终候选人。 |
这是捕获用户利益的本质在用户交互和适应迭代查询结果。startswith基本查询形式包含很少的主要属性数据库。图1显示了用户的feedbackrelevant 'sflow动态查询形式系统。基本查询表单然后通过interactionsbetween迭代丰富用户,我们的系统到用户满意的查询结果。 |
相关工作 |
自定义查询形式:现有的数据库clientsand工具努力帮助开发人员设计和generatethe查询表单,如EasyQuerySAP, Microsoft Access等等。他们提供视觉接口形式为开发者创造或定制查询。这些工具的困难是,他们提供专业开发者来说都熟悉他们的数据库,而不是终端用户.Proposed系统允许用户定制现有在运行时查询表单。然而,一个终端用户与数据库可能不知道。巨大的数据库schemais,难以捕捉适当的数据库实体和属性,创建所需的查询表单。 |
自动完成对数据库查询:用户界面开发,协助用户类型databasequeries基于查询负载,数据分布和数据库模式。不同于这集中onquery形式,查询他们的工作是在形式的SQL和关键词。 |
查询形式 |
3.1接口查询表单 |
每个查询形式对应于一个SQL查询的模板。查询形式F是定义为一个元组(AF、射频、σF (RF)),它表示一个数据库查询模板如下:F =(选择A1, A2,…,AkFROM (RF)σF),房颤= {A1, A2,…,正义与发展党}是k属性投影,k > 0。射频= {R1, R2,…,Rn} is the set of n relations (or entities) involved in this query, n >0. Each attribute in AFbelongs to onerelation in RF. σFis a conjunction of expressions for selections (or conditions) on relations in RF. (RF) is a joinfunction to generate a conjunction of expressions for joining relations of RF. |
查询的用户界面形式F, AFis结果表的列的集合。σFis befilled由用户输入组件的集合。查询形式允许用户填写参数产生不同的查询。RFand (RF)是不可见的用户界面,通常由系统根据数据库模式。为一个查询形式F,则会自动创建(RF)根据射频的外键之间的关系。与此同时,rfi决定byAFandσF。rfi欧盟的关系包含至少一个属性AForσF。因此,查询形式F的组件实际上是由房颤和σF。只有AFandσFare用户可见的用户界面。在这方面,重点是投影和选择组件查询的形式。 |
3.2排名估计 |
用户的期望的结果是返回的查询形式。两个指标来评估查询结果的质量:precisionand召回。由不同的输入查询形式产生不同的查询,不同的查询可以输出不同的queryresults和实现不同精度和召回,所以预计精度和召回是用来评估带来期望的性能查询表单。预期的比例由currentuser感兴趣的查询结果是预期的精度。预期的比例的用户感兴趣的数据实例返回的currentquery形式是预期的回忆。用户兴趣估计基于用户的点击率查询resultsdisplayed的查询形式。 |
3.2.1排名的属性 |
建议投影组件实际上是暗示属性投影。当前查询表单Fi,下届查询形式Fi + 1。让AFi = {A1, A2,…,Aj}, and AFi+1 = AFi∪{Aj+1}, j+1 ≤ |A|. Aj+1 is the projection attributesuggest for the Fi+1, which maximizes FScoreE(Fi+1). FScoreE(Fi+1) is obtained as follows: |
|
|
添加一个投影组件Aj + 1不会影响选择Fi的一部分。因此,σFi + 1 =σFi和P(σFi + 1 | d) = P(σFi | d)。既然Fi已经使用的用户,估计P (dAFi + 1)(σFi + 1 | d)如下。提交表单Fi为每个查询,这些查询结果包括射频的所有列。显然,对于那些实例不是在查询结果P(σFi + 1 | d) = 0,不需要考虑他们。d每个实例的查询结果,只需数出现的次数在结果和P (dAFi + 1)(σFi + 1 | d) =发生数除以N。 |
聚氨酯(dAj + 1 | dAFi)在运行时数据不可见,自dAj + 1 + 1还没有被使用过。条件probabilityPu (dAj + 1 | dAFi)估计从以下方法。 |
•基于工作负载的方法:Pu的条件概率(dAj + 1 | dAFi)可以从queryresults估计的历史查询。如果很多用户查询属性AFi和Aj + 1 d在实例,然后Pu (dAj + 1 | dAFi)一定要高。 |
•基于模式的方法:数据库模式意味着关系的属性。如果两个attributesare包含相同的实体,那么他们更相关。 |
图的模式是用来计算两个属性的相关性。数据库架构图用G =(ξ,R,颗),R组节点代表的关系,一个是组属性,颗edgesrepresenting外键的集合,和ξ:→R是一个属性标签包含theattribute函数来表示关系 |
3.2.2排名实体 |
实体的排名分数只是一个平均FScoreE (Fi + 1)实体的属性。直观地说,如果一个实体hasmany高分属性,那么它应该有一个更高的等级。 |
3.3相关的选择根据用户的反馈 |
选择属性必须与当前预测实体,否则,选择将bemeaningless。因此,首先找出相关的属性创建选择组件。 |
3.3.1相关属性选择 |
属性的相关性测量系统是基于数据库模式如下。 |
相关属性:一个数据库查询形式F架构图G =(ξ,R,颗),相关的属性是:基于“增大化现实”技术(F) ={|一个∈,∃Aj∈房颤,d (a, Aj)≤t},其中t是一个用户定义的阈值和d (a, Aj)模式的距离。t的选择取决于紧凑模式的设计。例如,一些数据库你才能把所有属性的实体关系,那么t可能是1。一些数据库的所有属性,一个实体划分成几个关系,那么t可能大于1。 |
3.3.2排名选择组件 |
选择查询的表单组件形式,浓缩组投影组件AFis固定,即。AFi + 1 = AFi。因此,FScoreE (Fi + 1)只取决于σFi + 1。找到下一个查询的最佳选择组件形式,没什么是查询数据库来检索数据实例。P(σFi + 1 | d)σFi取决于前面的查询条件。奖学金(σFi | d) = 0, P(σFi + 1 | d)必须是0。为了计算P(σFi + 1 | d)对于每个d∈d,不需要在数据库中检索所有datainstances。数据实例的集合D '⊆D是只需要这样每个D∈D '满足P(σFi | D) > 0。所以选择一个查询的查询查询条件的工会在Fi执行。一个查询将所有selectionattributes添加到查询的预测。 |
查询创建: |
数据:Q = {Q1、Q2,…。}是先前查询的集合上执行Fi |
结果:Qone是一个查询的查询 |
方法 |
beginσone← 0 Q ε Q doσone← σone σQAone← AFi Ar (Fi)Qone← GenerateQuery (Aone, σone) |
当系统接收到查询结果Qone从数据库引擎,它调用第二个算法的一个查询来找到最好的查询条件的系统。寻找最好的“≤”条件的伪代码如下:找到最好少方程条件 |
数据:α是由用户所需的部分实例,DQone Qone查询结果,选择属性。结果:*是最好的查询条件 |
开始/ /排序成一个有序集DsortedDsorted←排序(DQone,) s *←Ø,fscore * n←←0 0 d←αβ2for我←1 | Dsorted |国防部←Dsorted[我]年代←”< = dAs“/ /计算fscore”< = dAs“n←n + Pu (dAFi) P (dAFi) P(σFi | d) P (s | d)←d + P (dAFi) P(σFi | d) P (s | d) fscore←(1 +β2)。n / dif fscore > = fscore *然后*←sfscore *←fscore |
3.4评价 |
查询结果的质量评价主要是:使用精度和召回。不同的输入通过查询formsproduce不同的查询,查询产生不同的查询结果,实现不同精度andrecalls,所以评估的预期性能查询形式预计精度和召回。保证查询结果的比例由当前用户感兴趣的预计精度 |
|
预期的比例的用户感兴趣的数据实例返回的当前查询表单calledExpected召回 |
|
考虑到精度和召回,Fscore推导如下: |
|
|
|
用户兴趣是基于用户的点击率查询查询结果显示的形式。 |
结果 |
查询表单捕捉用户的反馈。用户选择组件和选择的基础上生成查询结果。用户可以完善组件选择一个精致的查询结果。迭代查询的基本形式是丰富通过用户和系统之间的互动,直到用户查询结果感到满意。排名formcomponents完成并生成查询结果 |
在上面的数据中,用户选择所需的列组件和行组件查询形式期望的结果。更精致的行组件选择精制查询结果。最后后relavantcomponent seleciton精制获得查询结果。 |
结论和未来的工作 |
用户的反馈相关动态查询表单生成是帮助用户动态地生成queryforms完成。vitalnotion是使用概率模型对基于用户偏好的表单组件。Userpreference捕获使用历史查询和运行时单击等反馈。的排名formcomponents更容易为用户定制查询形式。未来的工作,这种方法可以扩展到nonrelationaldata。多个方法来捕捉用户的兴趣除了点击反馈的查询计划的开发。例如,可以添加文本框供用户输入一些关键字查询。 |
数据乍一看 |
|
|
引用 |
- 梁,李道;Yexi江;志远Chen¢动态查询表单数据库QueriesA¢,知识和数据工程,IEEETransactions(卷:26日问题:9)
- 2. easyquery.http: / /devtools.korzh.com/eq/dotnet。
- 南帝和h . v . Jagadish¢协助查询使用instantresponseinterfacesA¢。在ACM SIGMOD诉讼,pages1156A¢1158,2007
- 4所示。云周和w·布鲁斯克罗夫特¢排名健壮性:一种新型框架来预测查询PerformanceA¢ACIKMA¢06,11月5日¢11,2006年,
- 美国弗吉尼亚州阿灵顿
- 里卡多Baeza-Yates, BerthierRibeiro-NetoA¢现代信息retrievalA¢一个发布艾迪生¢韦斯利
|