實(shí)體關(guān)系推理與知識(shí)圖譜補(bǔ)全
如需轉(zhuǎn)載,請聯(lián)系本人:jtianwen2014,并注明出處
Unsupervised Person Slot Filling based on Graph Mining
作者:Dian Yu, Heng Ji
機(jī)構(gòu):Computer Science Department, Rensselaer Polytechnic Institute
本文的任務(wù)為槽填充(Slot Filling),即從大規(guī)模的語料庫中抽取給定實(shí)體(query)的被明確定義的屬性(slot types)的值(slot fillers)。對于此任務(wù),本文敘述目前主流的方法可以分為兩類:有監(jiān)督的分類方法,設(shè)計(jì)分類器識(shí)別給定的實(shí)體與值所屬的關(guān)系類型,分類器的訓(xùn)練往往使用如活動(dòng)學(xué)習(xí)、利用距離監(jiān)督的噪聲標(biāo)注等方法;模式匹配方法,從文本中自動(dòng)或半自動(dòng)地抽取和生成詞法或句法的模式,以用于關(guān)系的抽取,但因?yàn)殛P(guān)系所表述的方式千差萬別,這種模式匹配方法無法擁有較好的召回率。
本文認(rèn)為,以上兩類方法都無法很好的應(yīng)對新的語言或是出現(xiàn)新的關(guān)系類型的情況,即移植性不強(qiáng);而且,兩種方法都只是專注于實(shí)體和候選值之前的平坦表示,并沒有考慮到它們之間的全局結(jié)構(gòu)關(guān)系,以及語句中其他的關(guān)系事實(shí)的影響。本文重要的算法思想基于以下兩個(gè)觀察: