服務(wù)機(jī)器人在展館迎賓講解
多模態(tài)檢索成為近期關(guān)注的問題,當(dāng)前的方法包括單流方法、多流方法,以及不同模態(tài)之 間對(duì)齊的技術(shù),已經(jīng)在知識(shí)挖掘領(lǐng)域開展應(yīng)用。
圖像問答可以分為三個(gè)層次:
1.初級(jí):從圖像識(shí)別啲結(jié)果中直接得到答案
2.中等:答案需要簡單事實(shí)的支持
3.高級(jí):對(duì)于復(fù)雜的問題,答案不在圖像中,可能涉及常識(shí)、具體 話題和百科知識(shí)進(jìn)行推理
多模態(tài)問答的挑戰(zhàn):
1 多模態(tài)數(shù)據(jù)具有異構(gòu)性
2 多模態(tài)數(shù)據(jù)的關(guān)聯(lián)難度表示較大
3 多模態(tài)知識(shí)融合困難
4 多模態(tài)問答大多只能處理簡單的問題
5 多模態(tài)知識(shí)問答推理能力弱
6 多模態(tài)知識(shí)問答可解釋性差
洛川智能問答機(jī)器人加盟
|