近日,AAAI 2024 Global Competition on Math Problem Solving and Reasoning大賽落下帷幕,天翼云智能邊緣事業(yè)部AI團隊憑借在大模型基礎能力研究領(lǐng)域的數據處理與模型訓練策略的領(lǐng)先優(yōu)勢,在眾多參賽隊伍中脫穎而出,榮獲本次競賽冠軍。
AAAI(Association forthe Advancement of Artificial Intelligence)是人工智能領(lǐng)域的國際權威學(xué)術(shù)組織,其舉辦的會(huì )議和賽事聚集全球AI從業(yè)者,是展示最新人工智能研究成果的重要平臺。
數學(xué)推理長(cháng)期以來(lái)被視為檢驗大模型能力的試金石。盡管當前的大語(yǔ)言模型(LLM)在語(yǔ)言能力方面已經(jīng)取得了長(cháng)足進(jìn)步,但在數學(xué)推理方面仍存在不足,尤其是對公式、符號和抽象圖形的理解和計算。在此背景下,AAAI 2024 Global Competition on Math Problem Solving and Reasoning競賽應運而生,面向全球科研機構、企業(yè)提供競技平臺,旨在測試和優(yōu)化大模型的數學(xué)推理能力。
本次競賽任務(wù)包括一系列數學(xué)問(wèn)題,從基本算術(shù)到復雜的空間幾何。面對跨越多個(gè)難度、多個(gè)問(wèn)題門(mén)類(lèi)的數學(xué)問(wèn)題,天翼云AI團隊采用了綜合數據對齊策略(Alignment Strategy),通過(guò)探索不同數學(xué)問(wèn)題的整體推理路徑(Inference Path)、精準劃分和配比訓練樣本,提升了模型性能。同時(shí),團隊采用了高度定制化的指令(Prompt)、模型訓練方法和后處理策略(Post-Processing Strategy),提升了模型回復一致性。
本次競賽所展現出的創(chuàng )新成果,已在天翼云“慧澤”政務(wù)大模型的研發(fā)和生產(chǎn)中得到應用。在“慧澤”政務(wù)大模型的優(yōu)化中,以上數據處理和模型訓練策略為其在政策咨詢(xún)、政務(wù)指導、12345服務(wù)支持等多樣化應用場(chǎng)景提供了強大支撐,這在提升政務(wù)辦事效率的同時(shí),也促進(jìn)了“一網(wǎng)通辦、一網(wǎng)統管、一網(wǎng)協(xié)同”體系的智能化升級,為加速推進(jìn)城市治理現代化樹(shù)立了新標桿。
人工智能技術(shù)的快速發(fā)展和廣泛應用,正不斷打破各個(gè)行業(yè)的發(fā)展瓶頸,重塑不同產(chǎn)業(yè)的生產(chǎn)模式。展望未來(lái),天翼云AI團隊將持續深耕人工智能技術(shù)創(chuàng )新,加速構建原創(chuàng )技術(shù)策源地,用更豐富、更智能的數字化技術(shù),為各行各業(yè)的數字化轉型注入新動(dòng)能。