“三冠一亞”成最大赢家!深蘭首次參加CCKS 2020彰顯技(jì )術硬實力
2020-11-12捷報頻傳,三冠一亞!11月12-15日,CCKS 2020(國(guó)内知識圖譜和語義計算等領域的核心學(xué)術會議)在江西南昌成功舉行,深蘭科(kē)技(jì )DeepBlueAI團隊首次參加即斬獲“三冠一亞”的佳績,并是唯一獲得多(duō)個冠軍的隊伍,成為(wèi)與會嘉賓和媒體(tǐ)關注焦點。
此次大會由中(zhōng)國(guó)中(zhōng)文(wén)信息學(xué)會語言與知識計算專業委員會主辦(bàn),主題為(wèi)“知識圖譜與認知智能(néng)”,共設立8個相關主題的技(jì )術評測任務(wù),旨在為(wèi)研究人員提供測試知識圖譜與語義計算技(jì )術、算法及系統的平台和資源,促進國(guó)内知識圖譜領域的技(jì )術發展。
随着互聯網科(kē)技(jì )飛速發展,人們逐漸從信息時代進入智能(néng)時代。知識圖譜作(zuò)為(wèi)承載底層海量知識并支持上層智能(néng)應用(yòng)的重要載體(tǐ),在智能(néng)時代中(zhōng)扮演了極其重要的角色。其中(zhōng),多(duō)模态知識圖譜的構建,能(néng)夠讓基于知識圖譜的智能(néng)服務(wù)更好地理(lǐ)解真實世界的數據場景,進而更好地支撐各項上遊任務(wù)和行業應用(yòng),如推薦系統、語義搜索、智能(néng)問答(dá)等。
大會現場吸引衆多(duō)行業資深專家莅臨現場
深蘭科(kē)技(jì )獲獎信息(點擊可(kě)看清晰獎狀)
新(xīn)冠百科(kē)知識圖譜類型推斷
面向金融領域:事件主體(tǐ)抽取
基于标題大規模商(shāng)品實體(tǐ)檢索
面向中(zhōng)文(wén)短文(wén)本的實體(tǐ)鏈指
基于标題大規模商(shāng)品實體(tǐ)檢索(創)
面對社會各行各業不斷湧現的科(kē)技(jì )需求,深蘭科(kē)技(jì )研發人員正在加速開展各項技(jì )術的突破研發。據了解,深蘭科(kē)技(jì )DeepBlueAI團隊此次奪冠的三個任務(wù)方案,分(fēn)别可(kě)在電(diàn)商(shāng)、金融、輿情監控等領域的應用(yòng)上發揮重要作(zuò)用(yòng)。
具(jù)體(tǐ)來說,深蘭科(kē)技(jì )DeepBlueAI團隊分(fēn)别在 “新(xīn)冠百科(kē)知識圖譜類型推斷”、 “面向金融領域的篇章級事件主體(tǐ)抽取”、“基于标題的大規模商(shāng)品實體(tǐ)檢索”這三個(子)任務(wù)中(zhōng)奪得冠軍;在“面向中(zhōng)文(wén)短文(wén)本的實體(tǐ)鏈指”任務(wù)中(zhōng)僅以0.00002分(fēn)之差屈居亞軍;此外,本屆組委會還特别評選出每一任務(wù)至多(duō)一項的“創新(xīn)技(jì )術獎”,專門用(yòng)于鼓勵創新(xīn)性技(jì )術的使用(yòng),深蘭團隊在“基于标題的大規模商(shāng)品實體(tǐ)檢索”的任務(wù)中(zhōng)再次脫穎而出。
綜上所述,從包括CCKS2020在内的國(guó)内外“頂會”賽題任務(wù)設置中(zhōng)不難發現,共同要點更注重于落地應用(yòng)性。如今人工(gōng)智能(néng)已逐漸滲透到各個行業并轉化為(wèi)實際應用(yòng),深蘭早在成立之初就提出了“基礎研究與落地應用(yòng)”齊頭并進的理(lǐ)念,并取得有(yǒu)目共睹的成效。會議競賽的成績正是對現在及過往的檢驗,更是對今後不斷進取的鞭策,“人工(gōng)智能(néng) 服務(wù)民(mín)生”将是深蘭矢志(zhì)不渝的奮鬥目标。
“三冠”詳細解讀:
一, “新(xīn)冠百科(kē)知識圖譜類型推斷” 任務(wù),要求從實體(tǐ)百科(kē)(包括百度百科(kē)、互動百科(kē)、維基百科(kē)、醫(yī)學(xué)百科(kē))頁(yè)面出發,從給定的數據中(zhōng)推斷相關實體(tǐ)的類型。然而,大量類型信息以非結構化文(wén)本形式呈現于網絡頁(yè)面中(zhōng),文(wén)本處理(lǐ)難度大,抽取結果同時保證高準确度和覆蓋率仍然是個極大的挑戰。
應對:針對數據集的特點,DeepBlueAI團隊構建了數個基于BERT模型的文(wén)本分(fēn)類器,并引入了多(duō)個外部數據集,最後将這些分(fēn)類器進行融合得到最終判斷結果。實體(tǐ)類型是知識圖譜的重要組成,正确的實體(tǐ)類型是構建一個高質(zhì)量知識圖譜的前提。
二,“事件”在金融領域是投資分(fēn)析、資産(chǎn)管理(lǐ)的重要決策參考,也是知識圖譜的重要組成部分(fēn),而“事件抽取”是進行圖譜推理(lǐ)、事件分(fēn)析的必要過程。在金融領域,“事件抽取”是一項十分(fēn)重要的任務(wù),也是自然語言處理(lǐ)領域一項比較複雜的任務(wù),它的挑戰相當部分(fēn)體(tǐ)現在文(wén)本複雜上:輸入的文(wén)本可(kě)能(néng)是句子、段落或者篇章,不定長(cháng)度的文(wén)本使得限制文(wén)本長(cháng)度的模型無法使用(yòng)。
應對:“面向金融領域的篇章級事件主體(tǐ)抽取”任務(wù)中(zhōng),DeepBlueAI團隊使用(yòng)了多(duō)标簽事件分(fēn)類加實體(tǐ)識别pipeline模型,在标準的多(duō)标簽分(fēn)類模型中(zhōng)加入了特征提取模塊,實體(tǐ)識别模型采用(yòng)BERT-LSTM-CRF與閱讀理(lǐ)解投票融合的方式,最終以較大優勢獲得第一。
三,“基于标題的大規模商(shāng)品實體(tǐ)檢索”是典型的語義識别類任務(wù),在網購(gòu)已成為(wèi)一種生活方式的前提下,該技(jì )術發展具(jù)有(yǒu)非常實用(yòng)的價值。商(shāng)品标題一般較短,上下文(wén)語境不豐富;用(yòng)戶搜索時,文(wén)本口語化嚴重;商(shāng)品标題中(zhōng)存在很(hěn)多(duō)變異指代,沒有(yǒu)給定的指代映射表,這些方面都需要對上下文(wén)語境進行精(jīng)準理(lǐ)解,具(jù)有(yǒu)很(hěn)大的挑戰。
應對:DeepBlueAI團隊針對商(shāng)品檢索任務(wù)采用(yòng)召回-粗排-精(jīng)排的總體(tǐ)方案,在召回階段放棄了bm25、dssm等主流召回技(jì )術,創新(xīn)性地使用(yòng)Triplet BERT模型進行召回,在排序階段采用(yòng)基于BERT的二分(fēn)類排序方式,檢索準确率達到0.88489。最終不但排名(míng)第一,還收獲了創新(xīn)技(jì )術獎。
關于 CCKS
第十四屆全國(guó)知識圖譜與語義計算大會(CCKS: China Conference on Knowledge Graph and Semantic Computing)由中(zhōng)國(guó)中(zhōng)文(wén)信息學(xué)會語言與知識計算專業委員會主辦(bàn),主題是“知識圖譜與認知智能(néng)”,共設立8個相關主題的技(jì )術評測任務(wù),旨在為(wèi)研究人員提供測試知識圖譜與語義計算技(jì )術、算法及系統的平台和資源,促進國(guó)内知識圖譜領域的技(jì )術發展,此次大會吸引了包括華為(wèi)、百度、騰訊、小(xiǎo)米、北京大學(xué)、上海交通大學(xué)和浙江大學(xué)等知名(míng)企業和學(xué)府的團隊同台競技(jì )。
-
8項冠亞季軍收官ECCV2020,深蘭獲三大視覺頂會挑戰賽大滿貫
計算機視覺 -
與騰訊、哈工(gōng)大同台競技(jì ),深蘭獲自然語言處理(lǐ)領域國(guó)際頂會NAACL2021冠軍
計算機視覺 -
捷報 | 深蘭科(kē)技(jì )“雙隊”出征CVPR2021 斬獲五冠共獲14項大獎
計算機視覺 -
2022CVPR傳捷報丨深蘭科(kē)技(jì )再度折桂,連續4屆獲得CVPR挑戰賽冠軍
計算機視覺 -
深蘭科(kē)技(jì )奪冠CCKS2022“帶條件的分(fēn)層級多(duō)答(dá)案問答(dá)”評測任務(wù)競賽
自然語言處理(lǐ) -
PK 656 個對手!深蘭科(kē)技(jì )在全球頂級AI賽事kaggle競賽中(zhōng)再次奪冠
計算機視覺 -
一冠三亞二季!深蘭科(kē)技(jì )在EMNLP2022國(guó)際頂級賽事再創佳績
數據挖掘 -
6個獎項!深蘭科(kē)技(jì )在CVPR 2023挑戰賽中(zhōng)再獲佳績
計算機視覺 -
6冠3亞2季!深蘭科(kē)技(jì )在RANLP2023國(guó)際賽事上斬獲11項大獎
計算機視覺