近日,由天翼云彈性網(wǎng)絡(luò )產(chǎn)品線(xiàn)撰寫(xiě)的《Small?Scale?Data-free?Knowledge?Distillation》長(cháng)文被IEEE?Conference?on?Computer?Vision?and?Pattern?Recognition收錄。
IEEE?CVPR是人工智能與模式識別技術(shù)領(lǐng)域的頂級國際學(xué)術(shù)會(huì )議,也是中國計算機學(xué)會(huì )CCF推薦的A類(lèi)國際會(huì )議之一。該會(huì )議始于1983年,是業(yè)界公認的全球計算機視覺(jué)三大頂級會(huì )議之一。此次論文被IEEE?CVPR成功收錄,不僅展現了天翼云在A(yíng)I領(lǐng)域的創(chuàng )新能力,也意味著(zhù)中國企業(yè)在國際學(xué)術(shù)舞臺上的影響力日益增強。
《Small?Scale?Data-free?Knowledge?Distillation》這篇長(cháng)文提到,知識蒸餾技術(shù)(Knowledge?Distillation)可以利用預訓練的眾多網(wǎng)絡(luò )信息,在相同的訓練數據上訓練一個(gè)更小的新建特定網(wǎng)絡(luò )。傳統的知識蒸餾方法假設原始訓練數據總是可以獲得的,但在實(shí)際應用中,由于網(wǎng)絡(luò )用戶(hù)關(guān)注數據隱私和安全問(wèn)題,通常無(wú)法獲取網(wǎng)絡(luò )的訓練數據集。為了放寬對獲取訓練數據的限制,零數據條件下的知識蒸餾技術(shù)應運而生。
本論文提出了基于小規模逆向生成數據的零數據知識蒸餾技術(shù)(Small?Scale?Data-free?Knowledge?Distillation,下文簡(jiǎn)寫(xiě)為SSD-KD),引入了兩個(gè)相互依賴(lài)的模塊,顯著(zhù)加快了逆向生成數據的質(zhì)量和蒸餾范式的整體訓練效率。SSD-KD的第一個(gè)模塊依賴(lài)于一個(gè)新穎的調制函數,定義了樣本多樣性分布感知項和樣本難度分布感知項,以顯式方式共同平衡了逆向生成數據過(guò)程中的數據樣本分布。
第二個(gè)模塊定義了借鑒強化學(xué)習優(yōu)化策略的優(yōu)先級采樣函數。該函數選擇適當的逆向生成樣本來(lái)更新動(dòng)態(tài)重放緩沖區中的一部分現有樣本,進(jìn)一步提高了逆向生成樣本在知識蒸餾中的采樣效率。得益于上述兩個(gè)模塊,本論文所提出的方法可極大地滿(mǎn)足客戶(hù)對于高性能、高效率的需求。一方面,SSD-KD可以在極小規模的合成樣本(比原始訓練數據規模少10倍)條件下進(jìn)行網(wǎng)絡(luò )蒸餾訓練,使得整體訓練效率比眾多主流零數據知識蒸餾方法快一到兩個(gè)數量級,同時(shí)保持有競爭力的模型性能。另一方面,當放寬逆向生成樣本的數據規模到一個(gè)相對較大的數字(盡管仍然小于現有零數據知識蒸餾方法的規模)時(shí),論文中提出的方法在更小的新建特定網(wǎng)絡(luò )的準確性上取得了大幅改進(jìn),并保持了整體訓練效率。該方法已在不同人工智能應用上進(jìn)行實(shí)驗,驗證了方法的普適性。同時(shí),天翼云將把論文中提出的人工智能模型訓練方法,應用于彈性網(wǎng)絡(luò )智能運維的深度學(xué)習模型訓練中,讓深度學(xué)習模型適配更多的彈性網(wǎng)絡(luò )環(huán)境,讓彈性網(wǎng)絡(luò )更高效,更智能。
人工智能的蓬勃發(fā)展激蕩新一輪產(chǎn)業(yè)變革,天翼云彈性網(wǎng)絡(luò )產(chǎn)品線(xiàn)今后將持續發(fā)力云網(wǎng)絡(luò )領(lǐng)域的架構創(chuàng )新及高新技術(shù)預備研發(fā),不斷攻堅提升云網(wǎng)絡(luò )的關(guān)鍵性能指標;針對廣泛的人工智能和機器學(xué)習業(yè)務(wù)應用,基于智能算力架構平臺,結合云網(wǎng)融合、智能運維等技術(shù),賦予網(wǎng)絡(luò )在人工智能及大模型領(lǐng)域內模型的高可用、低時(shí)延和強魯棒等特性。
面向未來(lái),天翼云將通過(guò)不斷地科技創(chuàng )新與服務(wù)優(yōu)化,推動(dòng)云計算、人工智能等新興技術(shù)融合發(fā)展,為各行各業(yè)的數字化轉型提供更加智能、高效、安全的云服務(wù)體驗,為經(jīng)濟社會(huì )的高質(zhì)量發(fā)展注入源源不斷的新動(dòng)能。