永久免费观看国产裸体美女_亚洲不卡av不卡一区二区_亚洲国产精品国语在线_99精品偷拍视频一区二区三区_色播在线播放_亚洲不卡免费视频

請(qǐng)輸入關(guān)鍵字
搜索

太初資訊

跨越技術(shù)壁壘,打破固有模式,用智慧重新鏈接關(guān)系。

神碁智慧·算領(lǐng)未來(lái) | 太初2024優(yōu)秀開發(fā)者故事

2024年,太初舉辦了多場(chǎng)精彩紛呈的開發(fā)者生態(tài)活動(dòng),例如:元碁智匯·定義未來(lái)-模型復(fù)現(xiàn)賽、SDAA C算子挑戰(zhàn)賽、開放原子大賽-Tecorigin挑戰(zhàn)賽等,吸引了數(shù)百位開發(fā)者參加。伴隨著SDAA生態(tài)的孕育,開發(fā)者們?cè)诟鱾€(gè)活動(dòng)中大放異彩。

西安交通大學(xué)張棟旭:
優(yōu)化算子性能,提升計(jì)算效率
張棟旭同學(xué)是西安交通大學(xué)軟件工程專業(yè)的在讀研究生,曾獲得計(jì)算機(jī)能力挑戰(zhàn)賽C++組國(guó)家二等獎(jiǎng),以及計(jì)算機(jī)網(wǎng)絡(luò)對(duì)戰(zhàn)賽西北賽區(qū)一等獎(jiǎng),并發(fā)表了三篇學(xué)術(shù)論文。2024年Q4,他與香港中文大學(xué)和北京師范大學(xué)的兩名隊(duì)友一起,在開放原子大賽-Tecorigin算子開發(fā)任務(wù)挑戰(zhàn)賽中,榮獲一等獎(jiǎng)。
在比賽中,張棟旭基于太初 AI 加速卡,對(duì) Conv_forward 這一 CNN 卷積前向傳播的關(guān)鍵操作進(jìn)行了深度優(yōu)化。他通過將預(yù)處理邏輯從設(shè)備端轉(zhuǎn)移到 CPU 端,避免了設(shè)備端計(jì)算資源的浪費(fèi);手動(dòng)調(diào)整初始分塊參數(shù),實(shí)現(xiàn)了線程負(fù)載的均衡,有效減少了性能瓶頸;同時(shí)運(yùn)用 SIMD 加速,替換了原有的數(shù)據(jù)寫回方式,大幅降低了開銷。經(jīng)過一系列優(yōu)化,性能得到了顯著提升,從優(yōu)化前的 18.25 ms降低至優(yōu)化后的 8.41 ms,充分展現(xiàn)了太初AI加速卡在性能優(yōu)化方面的強(qiáng)大潛力。

張棟旭表示:

通過參加本場(chǎng)賽事,在高性能計(jì)算方面的知識(shí)得到了顯著積累,加深了對(duì)算子性能優(yōu)化方法的理解與應(yīng)用。將復(fù)雜問題中的前處理與計(jì)算任務(wù)有效分離,這不僅提高了代碼的執(zhí)行效率,還使得代碼結(jié)構(gòu)更加清晰,易于維護(hù)和擴(kuò)展。比賽所提供的教程詳盡且易于上手。這些教程不僅系統(tǒng)地介紹了SDAA C的基本概念,還通過實(shí)例引導(dǎo)我快速實(shí)踐,極大地降低了學(xué)習(xí)門檻,使我在短時(shí)間內(nèi)能掌握核心知識(shí)。感謝大賽官方提供的機(jī)會(huì),也感謝團(tuán)隊(duì)的努力與支持。


北京郵電大學(xué)王濤:
復(fù)現(xiàn)開源視覺模型,超越官方指標(biāo)
王濤同學(xué)是北京郵電大學(xué)電子科學(xué)與技術(shù)專業(yè)的在讀博士,研究方向涵蓋人體姿態(tài)估計(jì)、后處理和生成等領(lǐng)域,曾以第一作者身份在 AI 頂會(huì) ACM MM、CVPR 上發(fā)表兩篇論文。2024年Q2,王濤參加了太初的小模型復(fù)現(xiàn)比賽,基于太初AI加速卡對(duì)開源模型進(jìn)行適配優(yōu)化,獲得了元碁開物初級(jí)認(rèn)證。

考慮到全連接網(wǎng)絡(luò)(FCN)在人工智能領(lǐng)域的基礎(chǔ)性地位,王濤首先復(fù)現(xiàn)了基于FCN的人體姿態(tài)后處理算法SmoothNet。得益于TecoPyTorch框架優(yōu)秀的接口適配,王濤僅更改了幾行代碼就將基于CUDA設(shè)備的代碼遷移到了SDAA設(shè)備上,完成了SmoothNet pipeline的復(fù)現(xiàn)。進(jìn)一步,他在TecoPyTorch上開啟了混合精度訓(xùn)練,成功將模型訓(xùn)練速度提升了40%。最終,復(fù)現(xiàn)模型不僅達(dá)到了官方基準(zhǔn)性能,更在部分指標(biāo)上超越了原論文報(bào)告的結(jié)果,充分展現(xiàn)了太初AI加速卡在硬件和軟件層面的卓越計(jì)算精度。

在第二個(gè)模型的選擇上,王濤著眼于當(dāng)前主導(dǎo)大語(yǔ)言模型領(lǐng)域的Transformer架構(gòu),探索太初AI加速卡的廣泛適用性。他選取了基于Transformer的人體動(dòng)作預(yù)測(cè)網(wǎng)絡(luò)MRT作為研究對(duì)象,通過規(guī)范化官方開源代碼,使其能夠兼容CPU、CUDA和SDAA等多種設(shè)備,為用戶提供了靈活的設(shè)備選擇空間。隨后,他深入探索了TecoPyTorch的多卡訓(xùn)練能力,通過三種不同的啟動(dòng)方式實(shí)現(xiàn)多卡并行訓(xùn)練,并結(jié)合混合精度技術(shù)進(jìn)一步優(yōu)化了MRT的訓(xùn)練效率。這種訓(xùn)練策略具有廣泛的適用性,能夠滿足大多數(shù)科研工作者的需求。最終,復(fù)現(xiàn)模型完全達(dá)到了官方性能標(biāo)準(zhǔn),這充分證明了TecoPyTorch對(duì)Transformer架構(gòu)的良好支持。

王濤表示:

回顧整個(gè)參賽歷程,我不僅深化了對(duì)混合精度訓(xùn)練和多卡并行技術(shù)的理解,更在評(píng)委們嚴(yán)謹(jǐn)?shù)脑u(píng)審標(biāo)準(zhǔn)下提升了代碼接口規(guī)范化的意識(shí)。太初軟件生態(tài)的卓越適配性給我留下了深刻印象:僅需一條簡(jiǎn)單命令即可完成模型設(shè)備的遷移,極大降低了科研人員的遷移成本。TecoPyTorch提供的教程文檔內(nèi)容豐富、易于理解,顯著降低了學(xué)習(xí)曲線。特別值得一提的是,太初AI加速卡在顯著提升訓(xùn)練速度的同時(shí),其超低功耗特性也為降低訓(xùn)練過程中的碳排放做出了重要貢獻(xiàn)。我十分期待在未來(lái)的科研工作中繼續(xù)使用太初AI加速卡,為推動(dòng)AI技術(shù)的發(fā)展貢獻(xiàn)自己的力量。


蘇州大學(xué)蘇儀:
適配自研大模型,拓展應(yīng)用邊界
蘇儀是蘇州大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)的在讀研究生,主要研究方向?yàn)榇笳Z(yǔ)言模型的預(yù)訓(xùn)練和推理加速。他曾以第一/共一作者身份在頂會(huì) ACL、EMNLP 上發(fā)表了三篇論文。蘇儀基于太初 AI 加速卡,對(duì)蘇大自研的大語(yǔ)言模型 OpenBA-V2 進(jìn)行了適配和指令微調(diào),取得了顯著成果。
在適配過程中,蘇儀修改了 cross-attention API,使其支持 OpenBA-V2 的 encoder-decoder 類型;在將文本轉(zhuǎn)換成tokens的過程中,增加了 SentencePieceTokenizer;針對(duì)optimized-ul2預(yù)訓(xùn)練任務(wù),添加數(shù)據(jù)預(yù)處理代碼。微調(diào)過程中,他針對(duì) optimized-ul2 預(yù)訓(xùn)練任務(wù),添加了數(shù)據(jù)預(yù)處理代碼,并搜集處理了 1 億條中英指令數(shù)據(jù);針對(duì) 8 機(jī) 64 卡與實(shí)際模型結(jié)構(gòu),調(diào)整了分布式策略,修改 TP、DP、PP 參數(shù),以獲得最優(yōu)的硬件利用率;同時(shí),在多機(jī)多卡的訓(xùn)練過程中進(jìn)行了精度排查,提升了模型的可靠性。最終,微調(diào)后的 OpenBA-V2 在 C-Eval、MMLU、CMMLU 數(shù)據(jù)集上的評(píng)測(cè)準(zhǔn)確率分別提升了 13%、13%、12%。

蘇儀表示:

本次活動(dòng)中我獲得了十分難得的多機(jī)多卡訓(xùn)練機(jī)會(huì),在64卡上完成了自研模型的訓(xùn)練。使用 torch2.0 以上版本 + 太初開發(fā)的 torch_sdaa 后端,可以在用戶層面實(shí)現(xiàn)太初AI加速卡和友商加速卡的無(wú)縫切換。通過這次活動(dòng),還學(xué)習(xí)了分布式系統(tǒng)下的debug技巧,以及如何在分布式訓(xùn)練的場(chǎng)景下通過調(diào)整超參提升模型的訓(xùn)練效率,這對(duì)我以后的訓(xùn)練經(jīng)驗(yàn)是非常重要。

總結(jié)與展望

2024年,太初生態(tài)活動(dòng)不僅為開發(fā)者提供了強(qiáng)大的算力和易用的軟件,還通過豐富的教程和文檔,幫助開發(fā)者快速上手,輕松完成模型運(yùn)行、應(yīng)用開發(fā)/運(yùn)行、模型遷移、算子開發(fā)、自研模型開發(fā)等任務(wù)。
通過參加太初生態(tài)活動(dòng),開發(fā)者們不僅提升了自身的技術(shù)水平,還加深了對(duì)算子優(yōu)化、混合精度訓(xùn)練、多機(jī)多卡訓(xùn)練、分布式系統(tǒng)調(diào)試等方面的理解。開發(fā)者們對(duì)太初AI加速卡強(qiáng)大的計(jì)算能力及軟件優(yōu)秀的適配性給予了高度評(píng)價(jià)。
展望未來(lái),我們將為開發(fā)者提供更多精彩的生態(tài)活動(dòng),希望更多的開發(fā)者能夠加入到這一充滿活力的社區(qū)中,共同探索 AI 技術(shù)的無(wú)限可能,為構(gòu)建未來(lái)智能世界貢獻(xiàn)自己的力量。


主站蜘蛛池模板: 无码毛片视频一区二区三区 | 隔壁黑人的巨大中文字幕 | 日日婷婷夜日日天干A片 | 国产免费99热在线播放 | 欧美日韩精品一区二区三区无码 | 久操麻豆| 久久精品国语 | www.com香蕉 | 国产高潮A片一区二区 | 国产专区自拍 | 亚洲欧美动漫少妇自拍 | 看一级黄色毛片 | 人人人妻人人人妻人人人 | 欧美人与动性xxxxx交性 | 台湾gayxxxxgay2| 国产精品久久久久婷婷五月 | 七级毛片 | 成人影片免费观看中文字幕 | 在线视频观看一区 | 国产在线精品一区 | 日本一区二区色 | 国产老师开裆丝袜喷水视频 | 国产亚洲成av片在线观看 | 国产精品亚洲第一区焦香味 | 国产无限免费av在线播放 | 国产成人av在线影院无毒 | 亚洲超碰97人人做人人爱 | 欧美性1生交XXXXX无码 | 国产91在线播放九色快色 | 伊人久久在 | 大地资源中文在线观看官网免费 | 四虎国产精品亚洲一区久久特色 | 噜噜噜噜av夜色在线 | 国产成人久久av免费高清密臂 | 免费a级毛片无码专区 | 欧美性猛交xxxxxⅹxx88 | 插插插精品亚洲一区 | 红花成人网 | 披按摩高潮A片一区二区三区 | 久久久精品综合 | 国产精品久久久久久久久久99 |