首頁 資訊 dlc的概念、優(yōu)勢(shì)及使用場(chǎng)景

dlc的概念、優(yōu)勢(shì)及使用場(chǎng)景

來源:泰然健康網(wǎng) 時(shí)間:2024年12月13日 06:08

分布式訓(xùn)練DLC(Deep Learning Containers)是基于云原生的AI訓(xùn)練平臺(tái),為開發(fā)者和企業(yè)提供靈活、穩(wěn)定、易用和高性能的機(jī)器學(xué)習(xí)訓(xùn)練環(huán)境。它支持多種算法框架,能夠處理大規(guī)模的分布式深度學(xué)習(xí)任務(wù),同時(shí)也支持自定義算法框架。通過DLC,開發(fā)者和企業(yè)能享受到更優(yōu)的訓(xùn)練環(huán)境,在降低成本的同時(shí)提升訓(xùn)練效率。

產(chǎn)品優(yōu)勢(shì)

支持多樣算力資源:

基于靈駿智算和通用計(jì)算資源,支持云上ECS、ECI、神龍裸金屬和靈駿裸金屬等多種算力形態(tài),實(shí)現(xiàn)異構(gòu)算力的混合調(diào)度。

多樣的分布式任務(wù)類型:

DLC作為分布式訓(xùn)練系統(tǒng),您不需要搭建各種集群,可以直接提交Megatron、Deepspeed、Pytorch、Tensorflow、Slurm、Ray、MPI及XGBoost等十多種訓(xùn)練框架的任務(wù)。DLC預(yù)置了多種官方鏡像,支持自定義開發(fā)運(yùn)行環(huán)境, 支持控制臺(tái)、SDK或命令行的提交方式, 為AI訓(xùn)練場(chǎng)景提供一站式服務(wù),也為大型客戶提供簡(jiǎn)單的集成方式。

高穩(wěn)定:

在大模型訓(xùn)練場(chǎng)景中,通過自研的容錯(cuò)引擎AIMaster、高性能Checkpoint框架EasyCKPT、健康檢測(cè)SanityCheck以及節(jié)點(diǎn)自愈功能,PAI-DLC能夠有效解決多種穩(wěn)定性問題。PAI-DLC具備快速探查、準(zhǔn)確感應(yīng)與快速反饋的能力,有效降低算力損失,提升訓(xùn)練穩(wěn)定性。

高性能:

通過PAI自主研發(fā)的AI訓(xùn)練加速框架,實(shí)現(xiàn)統(tǒng)一數(shù)據(jù)并行、流水并行、算子拆分以及嵌套的并行加速策略。通過并行策略自動(dòng)探索和多維度顯存優(yōu)化技術(shù),并結(jié)合高速網(wǎng)絡(luò)的拓?fù)涓兄{(diào)度,以及通信線程池、梯度分組融合、混合精度通信、梯度壓縮的分布式通信庫的優(yōu)化,提升分布式訓(xùn)練效率。尤其在大模型分預(yù)訓(xùn)練、持續(xù)訓(xùn)練和Alignment的分布式訓(xùn)練場(chǎng)景下,為您提供較優(yōu)的訓(xùn)練引擎。

資源形態(tài)

通過分布式訓(xùn)練(DLC)提交訓(xùn)練任務(wù)時(shí),根據(jù)使用場(chǎng)景和所需的算力類型,PAI提供了以下兩種資源形態(tài):

靈駿智算:專為大模型訓(xùn)練設(shè)計(jì),適用于需要大量計(jì)算資源的深度學(xué)習(xí)任務(wù)。是面向超大規(guī)模深度學(xué)習(xí)和融合智算,基于軟硬件一體優(yōu)化技術(shù)。構(gòu)建高性能異構(gòu)算力底座,提供全流程AI工程化能力,具備高性能、高效率、高利用率等核心優(yōu)勢(shì),以滿足在大模型訓(xùn)練、自動(dòng)駕駛、基礎(chǔ)科研以及金融等領(lǐng)域的廣泛需求。

通用計(jì)算:適用于常規(guī)訓(xùn)練需求,能夠靈活地支持多種規(guī)模和類型的機(jī)器學(xué)習(xí)任務(wù)。

靈駿智算和通用計(jì)算資源支持以下幾種使用方式:

資源配額:您可以通過包年包月的方式提前購買靈駿智算或通用計(jì)算資源,用于AI開發(fā)和訓(xùn)練,從而實(shí)現(xiàn)資源的靈活管理和高效利用。

公共資源:無需提前購買資源,您可以在提交訓(xùn)練任務(wù)時(shí),按需使用靈駿智算或通用計(jì)算資源,并通過按量付費(fèi)的方式進(jìn)行結(jié)算。

競(jìng)價(jià)資源:靈駿智算提供競(jìng)價(jià)資源,助力您以較低成本獲取所需的AI算力,從而降低任務(wù)運(yùn)行所需的資源成本。

應(yīng)用場(chǎng)景

數(shù)據(jù)預(yù)處理

支持您自定義運(yùn)行環(huán)境,可以對(duì)數(shù)據(jù)進(jìn)行離線并行預(yù)處理,從而大幅降低數(shù)據(jù)預(yù)處理工程的難度。

大規(guī)模分布式訓(xùn)練

支持使用多種開源深度學(xué)習(xí)框架進(jìn)行離線大規(guī)模分布式深度訓(xùn)練。DLC支持上千個(gè)節(jié)點(diǎn)同時(shí)訓(xùn)練,顯著縮短訓(xùn)練時(shí)間。

離線推理

通過DLC可以離線對(duì)模型進(jìn)行離線推理,有效增加閑時(shí)GPU機(jī)器使用率,大大降低資源浪費(fèi)。

相關(guān)文檔

創(chuàng)建訓(xùn)練任務(wù)

通過控制臺(tái)、SDK或命令行提交訓(xùn)練任務(wù),以及了解其中關(guān)鍵參數(shù)如何配置。

DLC使用案例匯總

通過實(shí)際案例,來了解如何使用DLC。

本頁導(dǎo)讀 (1)

相關(guān)知識(shí)

中醫(yī)兒科的優(yōu)勢(shì)及前景
《中國(guó)家電大健康場(chǎng)景技術(shù)發(fā)展白皮書》及面向大健康場(chǎng)景的優(yōu)勢(shì)家電產(chǎn)品發(fā)布
嬰兒用品市場(chǎng)現(xiàn)狀及前景分析2023
營(yíng)養(yǎng)健康食品市場(chǎng)發(fā)展概況及市場(chǎng)發(fā)展趨勢(shì)分析
對(duì)話慢教授李俊堃:以控糖為使命,用低GI概念重塑健康飲食新市場(chǎng)
2021健康食品行業(yè)市場(chǎng)前景及趨勢(shì)分析
2023年中國(guó)營(yíng)養(yǎng)健康食品市場(chǎng)發(fā)展概況及市場(chǎng)發(fā)展趨勢(shì)分析[圖]
港股概念追蹤
移動(dòng)醫(yī)療的概念與發(fā)展趨勢(shì)
酵素分析報(bào)告:發(fā)展環(huán)境分析、市場(chǎng)供需態(tài)勢(shì)及未來前景預(yù)測(cè)(2025版)

網(wǎng)址: dlc的概念、優(yōu)勢(shì)及使用場(chǎng)景 http://www.u1s5d6.cn/newsview484978.html

推薦資訊