6月14日,在北京智源大會(huì )上,中國電信人工智能研究院(TeleAI)聯(lián)合北京智源人工智能研究院發(fā)布全球首個(gè)單體稠密萬(wàn)億參數語(yǔ)義模型Tele-FLM-1T,成為國內首批發(fā)布稠密萬(wàn)億參數大模型的機構。
針對大模型訓練算力消耗高的問(wèn)題,TeleAI與智源基于模型生長(cháng)和損失預測等關(guān)鍵技術(shù)聯(lián)合研發(fā)出的Tele-FLM系列模型僅使用了業(yè)界普通訓練方案9%的算力資源?;?12臺A800服務(wù)器,用4個(gè)月完成3個(gè)模型總計2.3T tokens的訓練。模型訓練全程做到了零調整零重試,算力能效高且模型收斂性和穩定性好。Tele-FLM-1T版本即將開(kāi)源,期望為社區訓練萬(wàn)億稠密模型提供技術(shù)參考,避免萬(wàn)億模型訓練收斂難等問(wèn)題。
作為最早布局并首先開(kāi)源大模型的央企機構,TeleAI在中國電信CTO、TeleAI院長(cháng)李學(xué)龍帶領(lǐng)下,堅持全鏈路完全自主研發(fā)創(chuàng )新,去年便發(fā)布了千億參數“星辰”語(yǔ)義大模型,性能處于國內同級別參數模型的前列。今年2月,TeleAI自主研發(fā)的星辰大模型首次通過(guò)了“境內深度合成服務(wù)算法備案”。隨后,在5月15日,根據北京市生成式人工智能服務(wù)備案信息公告,星辰大模型再次通過(guò)產(chǎn)品備案?!半p備案”標志著(zhù)星辰大模型可正式對外提供生成式人工智能服務(wù)。
同時(shí),TeleAI也積極通過(guò)開(kāi)源推動(dòng)大模型技術(shù)進(jìn)步和大模型國產(chǎn)化進(jìn)程,加快研發(fā)創(chuàng )新,接連開(kāi)源7B、12B、52B參數規模大模型,吸引國內外開(kāi)源社區開(kāi)發(fā)者廣泛討論和使用,開(kāi)源模型下載量過(guò)萬(wàn),積累超40W+用戶(hù)。隨著(zhù)TeleChat系列模型的發(fā)布,TeleAI也同步對多個(gè)大模型落地項目進(jìn)行了能力升級,顯著(zhù)提升了項目交付的質(zhì)量。在某市民生訴求場(chǎng)景項目上,通過(guò)引入TeleChat-52B模型能力,整體應用效果提升40%,達到了行業(yè)內領(lǐng)先水平。同時(shí),在長(cháng)文生成和知識采編等多個(gè)應用領(lǐng)域,也取得了顯著(zhù)的進(jìn)步。
此外,依托中國電信在多個(gè)行業(yè)深耕多年的深厚優(yōu)勢與豐富經(jīng)驗,攜手行業(yè)領(lǐng)軍者共同打造了覆蓋教育、政務(wù)、應急等超過(guò)20個(gè)行業(yè)的大型模型。并通過(guò)不斷升級的語(yǔ)音、視覺(jué)以及多模態(tài)大模型技術(shù)能力,共同推動(dòng)大模型技術(shù)與各行業(yè)的深度融合,助力千行百業(yè)轉型升級。未來(lái),TeleAI也將進(jìn)一步為客戶(hù)、生態(tài)伙伴、開(kāi)發(fā)者及個(gè)人用戶(hù)等提供前沿的AI能力,賦能千行百業(yè)變革的同時(shí)也提升個(gè)人工作效率和日常生活便利性,切實(shí)推進(jìn)國內AI技術(shù)進(jìn)步及落地應用,加速全社會(huì )邁向通用人工智能時(shí)代。
TeleChat-52B開(kāi)源模型鏈接:https://github.com/Tele-AI/TeleChat-52B
Tele-FLM-1T開(kāi)源鏈接敬請期待。