本部要聞 來(lái)源:中譯語(yǔ)通日期:2025-09-03瀏覽次數(shù):1758
近日,第三十四屆國(guó)際人工智能聯(lián)合會(huì)議(IJCAI 2025)在加拿大蒙特利爾與中國(guó)廣州兩地同步舉行。中譯語(yǔ)通科技股份有限公司(簡(jiǎn)稱“中譯語(yǔ)通”)2030人工智能研究院副院長(zhǎng)陳自巖博士率團(tuán)隊(duì)出席廣州會(huì)場(chǎng),發(fā)布“格物”大模型在多模態(tài)學(xué)習(xí)領(lǐng)域的最新研究成果。
IJCAI是中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)推薦的A類國(guó)際頂級(jí)人工智能學(xué)術(shù)會(huì)議,本屆大會(huì)匯聚了包括菲爾茲獎(jiǎng)得主、國(guó)際知名數(shù)學(xué)家丘成桐教授在內(nèi)的全球眾多權(quán)威學(xué)者與行業(yè)專家。
本次中譯語(yǔ)通團(tuán)隊(duì)展示的核心成果為其自主研發(fā)的多模態(tài)架構(gòu)——“MAGE: Multimodal Alignment and Generation Enhancement via Bridging Visual and Semantic Spaces”。該研究聚焦多模態(tài)大模型的核心難題——視覺(jué)與語(yǔ)言的跨模態(tài)對(duì)齊,提出創(chuàng)新性“智能對(duì)齊網(wǎng)絡(luò)(IAN)”與雙重?fù)p失優(yōu)化策略,并通過(guò)多模態(tài)工具調(diào)度機(jī)制,實(shí)現(xiàn)“Any-to-Any”跨模態(tài)生成能力。在 MMBench、SEED、MME 等國(guó)際權(quán)威基準(zhǔn)測(cè)試中,MAGE模型表現(xiàn)卓越,多項(xiàng)指標(biāo)刷新現(xiàn)有紀(jì)錄。
該研究依托中譯語(yǔ)通獨(dú)立承擔(dān)的國(guó)家發(fā)改委“國(guó)防科技產(chǎn)業(yè)大腦項(xiàng)目”及中央引導(dǎo)地方“基于多模態(tài)思維鏈推理的可控內(nèi)容生成大模型技術(shù)研究及示范應(yīng)用項(xiàng)目”等國(guó)家及省部級(jí)重點(diǎn)研發(fā)項(xiàng)目。