本部要聞 來源:中譯語通日期:2021-07-31瀏覽次數:4000
2021年7月30日,中譯語通科技股份有限公司(簡稱“中譯語通”)主辦的跨語言多領域知識圖譜應用研討會在京召開。來自中國科學院、復旦大學、同濟大學等院校的知識圖譜專家學者、知名企業(yè)技術專家、IT企業(yè)家和用戶代表參會,共同圍繞跨語言多領域知識圖譜技術及行業(yè)應用進行研討交流。中國對外翻譯有限公司總經理、中譯語通副董事長于洋為會議致辭。
于洋在致辭中回顧了中譯語通的發(fā)展背景與探索歷程。于洋說,中譯語通承載著深厚的語言基因,踏上了機器翻譯與語言科技、跨語言大數據的研發(fā)之路。通過在金融科技、科研數據分析、數字城市建設和工業(yè)互聯(lián)網等垂直領域深耕,公司發(fā)展為全球領先的金融科技和科研數據分析公司。這一路上,我們在不斷嘗試中加深了對數據、算法、算力的認知,并進一步延伸到對知識圖譜的探索。未來中譯語通將在聚焦多語言人工智能、金融科技和科研數據分析的同時,堅定夯實知識圖譜的技術基礎。于洋表示,在中譯語通成立八周年這個特殊日子里,很榮幸邀請到各位專家和合作伙伴分享知識圖譜領域的研究成果和實踐經驗,希望在思想碰撞中發(fā)現更多突破口,實現知識圖譜技術應用的深化。
工信部電子標準研究院物聯(lián)網研究中心知識圖譜標準負責人、IEEE知識圖譜測評工作組主席李瑞琪做主題為《知識圖譜標準化及其現狀解讀》的專題報告。他在報告中圍繞當前知識圖譜在產業(yè)化應用過程中的標準化需求,介紹了知識圖譜標準體系構成、國內外標準化進展,以及知識圖譜技術框架、測試評估、認證、領域應用等關鍵標準核心內容和下一步方向等內容。
復旦大學大數據學院副院長陽德青以遠程視頻方式圍繞《認知智能與內容產業(yè)智能化》做主題報告。在陽德青看來,知識圖譜作為大數據知識工程的代表,是實現機器認知智能、語言智能的關鍵要素。知識圖譜及其相關技術已在眾多互聯(lián)網應用和行業(yè)領域的業(yè)務中發(fā)揮出重要的智能支撐作用。陽德青在報告中梳理了認知智能發(fā)展的核心訴求和挑戰(zhàn),并從提高內容生產的質量、改善內容消費的體驗、提升內容監(jiān)管的效果等方面介紹知識圖譜促進內容產業(yè)智能化的成功實踐經驗,用以探索大數據人工智能時代下的內容產業(yè)智能化升級與轉型的前進方向。
中譯語通大數據研究中心知識圖譜科學家傅興玉在會上介紹了中譯語通在JoveMind跨語言多領域知識圖譜構建平臺研發(fā)方面的成果。傅興玉介紹說,跨語言行業(yè)知識圖譜構建平臺是集合數據、算法、工具、計算和服務等資源和能力為一體化的知識圖譜構建和計算平臺。系統(tǒng)以全球大規(guī)模多語言開放文本為核心數據,打通從多語言數據到跨語言知識、從跨語言知識到全球信息認知的全鏈路,核心系統(tǒng)包括行業(yè)知識圖譜構建平臺、算法構建和訓練平臺,知識計算和推理引擎。系統(tǒng)將為知識圖譜技術在行業(yè)領域的應用提供基礎平臺支撐。
同濟大學研究員、中文開放知識圖譜聯(lián)盟OpenKG發(fā)起人之一王昊奮遠程參會,并在題為《多策略多模態(tài)智能問答》的報告中分享了基于知識圖譜的問答技術相關進展和挑戰(zhàn)。王昊奮認為,現實世界包括文本、知識和多媒體等多種信息源,近年來隨著自然語言處理和計算機視覺的快速發(fā)展,多模態(tài)問答因其能提供“文本+視覺”之間關系的洞察而引起越來越多的關注。目前,問答系統(tǒng)仍然面臨著很多挑戰(zhàn),多模態(tài)信息增加了問答的難度,系統(tǒng)必須同時理解語言以及學習相應的視覺表示。對此,王昊奮在報告中分別介紹“文本+知識”的多策略問答和兩種形式的多模態(tài)問答,如視覺問答(Visual Question Answering)和視頻問答(Video Question Answering)等關鍵技術和常用數據集,希望能夠為挑戰(zhàn)應對提供借鑒。
百分點科技首席算法科學家蘇海波在《知識圖譜技術及行業(yè)應用實踐》的報告中指出,近兩年,人工智能逐漸從感知智能向認知智能發(fā)展,知識圖譜則是實現認知智能的關鍵技術方法,在構建出知識圖譜后,可以實現各種智能場景應用。在服務客戶過程中,行業(yè)客戶對知識圖譜的應用訴求非常強烈,核心需求是將行業(yè)數據知識化,然后進行搜索、推薦、問答,以及用知識輔助客戶更加智能地決策。蘇海波以此為背景進而介紹了百分點科技公司知識圖譜抽取、知識圖譜問答等技術的算法原理和實踐,以及知識圖譜在多個行業(yè)場景中的具體應用。
中譯語通大數據研究中心總監(jiān)、技術委員會主席、數據科學家蔡超以《知識圖譜在金融科技領域的應用》為題分享了中譯語通跨行業(yè)知識圖譜構建的實踐。蔡超介紹說,通過對海量科技文獻和經濟數據的加工,公司構建了全球企業(yè)、科研機構、科創(chuàng)人才、產業(yè)產品、技術方向及其關系網,形成跨科技與金融的知識圖譜,并以此為基礎實現了科技發(fā)現與價值評估、科研加速、投研分析、風險監(jiān)控、政府管理等多行業(yè)場景的應用。
中國科學院自動化研究所模式識別國家重點實驗室研究員、中國科學院大學人工智能學院崗位教授趙軍做報告點評。他就知識圖譜建模、知識獲取、知識推理等難點分享了自己的見解。趙軍表示,在建模問題上,如何面對人腦的復雜認知結構進行知識建模,是需要學術界和企業(yè)界共同攻克的難題。對于復雜應用場景中的小樣本知識獲取、噪音數據情況下的知識獲取、保護私密數據情況下的知識獲取等難點,我們需要探索新的學習方法。同時,他認為,當前認知智能的難點與核心問題之一是知識推理問題。要解決該問題需要將語言知識、世界知識、領域知識、常識等結合起來,實現多種知識類型的融合關聯(lián),建立起知識系統(tǒng),實現推理,才能適應千變萬化的知識服務需求。
研討會最后,與會專家圍繞知識圖譜建模、數據標注與合規(guī)性、技術產業(yè)化、應用常態(tài)化、知識圖譜技術的商業(yè)價值挖掘等內容進行了互動交流,表示未來將攜手共同助推中國知識圖譜技術和應用的發(fā)展。北京谷尼大數據公司董事長、中譯語通專家顧問鄒鴻強主持會議。