合成图
The Web as a Knowledge-base for Answering Complex Questions:大问题分解成小问题
Answering Complex Questions by Combining Information from Curatedand Extracted Knowledge Bases:
部分查询。问句编码(q)、主路径编码、约束编码、注意力机制。其中注意力机制是利用查询向量\(g\)(主路径编码和约束编码联合)学习针对问句中的emphasize parts最后形成上下文向量\(c\)。最后\(c,q,g\)一起训练得到语义相似度分数\(S_{sem}(q,G_i)\),最后的损失函数为 \[ loss=ylog(S_{sem})+(1-y)log(1-S_{sem}) \] \(y\in \{0,1\}\)表示\(G_i\)是否正确。将部分查询的质量估计为其所有完整查询派生的最佳\(F_1\)分数。
每一步搜索出的作为部分查询,然后判断部分查询与原问题的相似度大小。
数据集:CompQWeb、WebQSP
最后不是可以直接生成问句??
UHop模型
- UHop An Unrestricted-Hop Relation Extraction Framework for Knowledge-Based Question Answering:
- 使用的数据集为带标记的数据集(严重bug!):
- WebQSP:有标记,但跳数少
- PathQuestion(L):2 跳或3 跳
- Grid World:跳数很多,但是三元组很特殊(relations in Grid World are the relative directions of two nodes)
- Complex Sequential QA 未使用,不是需要多跳的问题,而是问题序列,每个问题需要一跳关系
- 单跳关系提取、比较终止、动态问题表示
- 一次确定一条边,更新颖的是结束标志,所有outbound 比之前的都小
- 使用的数据集为带标记的数据集(严重bug!):
- Query Graph Generation for Answering Multi-hop Complex Questions from Knowledge Bases:
- 查询图一边加约束一边延伸,直到某一迭代的评分不比前一代高,但是语义匹配做的不好。
- 数据集
- ComplexWebQuestions(CWQ)为主,1 跳 2 跳
- WebQuestionSP(WQSP)
- ComplexQuestion(CQ)
- Multi-hop knowledge base question answering with an iterative sequence matching model:
- 一个很传统的搜索匹配模型
- 之前已经匹配过了,所以相似度得分只考虑最后一个的,但是还是设置一个变量考虑之前的匹配程度
- 终止检查考虑的是阀值【可以考虑利用UHop里的】
- 问题和推理分开!!!相当于监督概率分布,监督的损失不好。教师网络相当于把学生网络正着反着做了一遍,损失一个是最后的结果,一个是中间各步骤的差。没有讲清楚推理的步数(推理的步数由指示组件完成)?忽略了语序,正着反着也容易忽略语义情况
- 监督也的确是得监督中间的概率分布,至于中间预设的跳数可以用UHop,监督语义匹配的分数概率
- 没有中间路径,所以很多是直接计算的目前的和整个问题的相似度,利用那个分解树,建立中间的监督或者是调节?来消除虚假推理。去年和前年两篇中顶会的论文采用了部分查询的思想,但是还是比较的