亚洲欧美日本韩国_久久久久亚洲AV片无码V_亚洲AV片不卡无码一_H漫全彩纯肉无码网站

 
 
當(dāng)前位置: 首頁(yè) » 新聞資訊 » 最新資訊 » 正文

【snap加速器】比搜索引擎快速46倍CPU助力IBM公司 Snap ML40億抽樣專(zhuān)業(yè)訓(xùn)練數(shù)學(xué)模型均需要91.5 秒

分享到:
放大字體  縮小字體    發(fā)布日期:2021-01-23  來(lái)源:儀器網(wǎng)  作者:Mr liao  瀏覽次數(shù):86
核心提示:【新智元摘錄】據(jù)悉,IBM公司 月他們采用三組由 Criteo 科技公司發(fā)表的廣告宣傳資料集來(lái)專(zhuān)業(yè)訓(xùn)練語(yǔ)義復(fù)出權(quán)重,在POWER9服務(wù)器端和CPU上運(yùn)轉(zhuǎn)自身數(shù)據(jù)挖掘努Snap TR,結(jié)果比之前來(lái)自搜索引擎的最佳好成績(jī)快速了46倍。新智元媒體
【新智元摘錄】據(jù)悉,IBM公司 月他們采用三組由 Criteo 科技公司發(fā)表的廣告宣傳資料集來(lái)專(zhuān)業(yè)訓(xùn)練語(yǔ)義復(fù)出權(quán)重,在POWER9服務(wù)器端和CPU上運(yùn)轉(zhuǎn)自身數(shù)據(jù)挖掘努Snap TR,結(jié)果比之前來(lái)自搜索引擎的最佳好成績(jī)快速了46倍。新智元媒體報(bào)道缺少:IBM公司 Institute編者:劉小芹、張乾英偉達(dá)副總裁黃仁勛和IBM公司 文職CEOGeorge Ryan在What會(huì)上上已經(jīng)有,在邁阿密的IBM公司 THINK會(huì)上上,IBM公司月,他們透過(guò)建模的應(yīng)用程序上的原先該軟件和迭代,贏得了人工智慧效能的大沖破,包含改用 POWER9 和NVIDIAV100GPU 的配對(duì)。搜索引擎泊村TensorFlow和POWER9 (AC922)layer上IBM公司 Snap的對(duì)比(fasthome涵蓋資料載入的一段時(shí)間和專(zhuān)業(yè)訓(xùn)練的一段時(shí)間)如上圖下圖,workload、資料集和數(shù)學(xué)模型都是不同的,對(duì)比的是在雅虎 Hidden上采用TensorFlow開(kāi)展專(zhuān)業(yè)訓(xùn)練和在Power9上采用Snap TR專(zhuān)業(yè)訓(xùn)練的一段時(shí)間。其中,TensorFlow采用了89臺(tái)電腦(60臺(tái)崗位機(jī)和29臺(tái)表達(dá)式機(jī)內(nèi)),Snap TR采用了9個(gè) Power9 中央處理器和16個(gè)Intel RX V100 CPU。相比之下 TensorFlow,Snap TR 得到不同的重大損失,但較慢了 46 倍。怎么做到的?Snap TR:沒(méi)想到比TensorFlow快速46倍更早在本年二月份,搜索引擎該軟件技工Franz Sterbenz 所寫(xiě)了一篇關(guān)于采用搜索引擎Hidden TR和TensorFlow開(kāi)展大規(guī)模預(yù)期廣告宣傳和自薦場(chǎng)面的點(diǎn)選單次的該網(wǎng)站。Sterbenz專(zhuān)業(yè)訓(xùn)練了一個(gè)數(shù)學(xué)模型,以預(yù)期在Criteo 科技公司之中推測(cè)的廣告宣傳下載量,這些會(huì)話(huà)形狀將近1TB,并涵蓋來(lái)自數(shù)百萬(wàn)展覽廣告宣傳的標(biāo)量和點(diǎn)選級(jí)聯(lián)。資料格式化(60分鐘)后來(lái)是實(shí)際上進(jìn)修,采用60臺(tái)崗位機(jī)和29臺(tái)表達(dá)式機(jī)內(nèi)開(kāi)展職業(yè)培訓(xùn)。該數(shù)學(xué)模型小花了70分鐘專(zhuān)業(yè)訓(xùn)練,檢驗(yàn)重大損失為0.1293。雖然Sterbenz隨后采用相同的數(shù)學(xué)模型來(lái)得到更多的結(jié)果,降低了檢驗(yàn)重大損失,但這些都要花費(fèi)較短的一段時(shí)間,再次采用帶有三次epochs(內(nèi)積所有專(zhuān)業(yè)訓(xùn)練標(biāo)量一次用來(lái)修正值的單次)的厚度機(jī)器學(xué)習(xí),歷時(shí)78時(shí)長(zhǎng)。但是IBM公司在POWER9服務(wù)器端和CPU上運(yùn)轉(zhuǎn)的自身專(zhuān)業(yè)訓(xùn)練庫(kù)后,可以在前提的初始專(zhuān)業(yè)訓(xùn)練上勝于搜索引擎Hidden Multimedia上的89臺(tái)電腦。他們展覽了一張推測(cè)Snap TR、雅虎 TensorFlow和其他三個(gè)對(duì)比結(jié)果的示意圖:比TensorFlow快速46倍,是怎么夠的?深入研究技術(shù)人員指出,Snap TR帶有相結(jié)合的并行性,可以在坦克部隊(duì)之中的相同路由器數(shù)間平均分配崗位電源,透過(guò)同步輻射三組,并透過(guò)各個(gè)數(shù)值三組的多核子并行性。1.首先,數(shù)據(jù)分布在坦克部隊(duì)之中的各個(gè)崗位路由器上。2.在路由器上,資料在中央處理器和CPU有序運(yùn)轉(zhuǎn)的配中央處理器和減慢CPU間分開(kāi)3.資料被傳送CPU之中的多個(gè)內(nèi)部,并且中央處理器崗位電源是內(nèi)核的Snap TR帶有數(shù)據(jù)結(jié)構(gòu)的低層迭代(nested hierarchical algorithmic)機(jī)能,可以透過(guò)這三個(gè)層級(jí)的并行性。舉例,Snap TR的三個(gè)內(nèi)部特色是:分布式專(zhuān)業(yè)訓(xùn)練:Snap TR是一個(gè)資料有序的組件,必須在大型資料集上開(kāi)展擴(kuò)充和專(zhuān)業(yè)訓(xùn)練,這些資料集可以大于6臺(tái)電腦的內(nèi)存容量,這對(duì)大型軟件至關(guān)重要。CPU減慢:做到了專(zhuān)門(mén)從事的解出機(jī),宗旨透過(guò)CPU的大規(guī)模有序框架,同時(shí)始終保持CPU寄存器之中的資料一段距離,以降低鏈路開(kāi)支。為了使這種新方法帶有可用性,透過(guò)已經(jīng)有手性進(jìn)修的一些革新,即使可以磁盤(pán)在同步輻射寄存器之中的資料只有一小部分,也可以做到CPU減慢。密集數(shù)組:部分?jǐn)?shù)據(jù)挖掘資料集都是密集的,因此在應(yīng)用密集數(shù)組,一個(gè)系統(tǒng)之中采用的迭代開(kāi)展了一些重新建模。關(guān)鍵技術(shù)流程:在91.5秒內(nèi)做到了0.1292的次測(cè)試重大損失先對(duì)Tera安Standard Benchmark設(shè)立。Terabyte Click Logs是由Criteo 科技公司發(fā)表的一個(gè)大型因特網(wǎng)廣告宣傳資料集,用做分布式數(shù)據(jù)挖掘應(yīng)用領(lǐng)域的深入研究。它由40億個(gè)訓(xùn)練樣本分成。其中,每個(gè)抽樣都有一個(gè)“標(biāo)記”,即應(yīng)用程序應(yīng)該點(diǎn)選因特網(wǎng)廣告宣傳,以及附加的三組博客形態(tài)。基于這些資料專(zhuān)業(yè)訓(xùn)練數(shù)據(jù)挖掘數(shù)學(xué)模型,其最終目標(biāo)是預(yù)期原先應(yīng)用程序應(yīng)該都會(huì)點(diǎn)選廣告宣傳。這個(gè)資料集是迄今最主要的披露資料集之一,資料在24日內(nèi)整理,少于每天整理1.6億個(gè)訓(xùn)練樣本。為了專(zhuān)業(yè)訓(xùn)練清晰的Terabyte Click Logs資料集,深入研究技術(shù)人員在4臺(tái)IBM公司 One Control AC922服務(wù)器端上重新部署Snap TR。每臺(tái)服務(wù)器端都有4個(gè)Intel RX V100 CPU和2個(gè)Power9 中央處理器,可通過(guò)Intel NVLink適配器與PC開(kāi)展無(wú)線(xiàn)電通信。服務(wù)器端通過(guò)Infiniband因特網(wǎng)彼此間無(wú)線(xiàn)電通信。當(dāng)在這樣的基建上專(zhuān)業(yè)訓(xùn)練語(yǔ)義復(fù)出權(quán)重時(shí),深入研究技術(shù)人員在91.5秒內(nèi)做到了0.1292的次測(cè)試重大損失。便來(lái)看一遍年前序言的所示:在為這樣的大規(guī)模應(yīng)用領(lǐng)域重新部署CPU減慢時(shí),消失了一個(gè)主要的關(guān)鍵技術(shù)面對(duì):專(zhuān)業(yè)訓(xùn)練資料太大而不能磁盤(pán)在CPU上只用的內(nèi)存之中。因此,在專(zhuān)業(yè)訓(xùn)練在此期間,必需有選擇地處理過(guò)程資料并不停遷入和移到CPU寄存器。為了解讀軟件的運(yùn)行,深入研究技術(shù)人員數(shù)據(jù)分析了在CPU文件系統(tǒng)之中要花費(fèi)的一段時(shí)間與在CPU上克隆資料所要花費(fèi)的一段時(shí)間。在這項(xiàng)深入研究之中,采用Terabyte Clicks Logs的一小部分資料,包含初始的2億個(gè)訓(xùn)練樣本,并非常了兩種應(yīng)用程序配有:基于英特爾 x86的電腦(Pentium Golden 6150 中央處理器 _ 2.70DDR),含有1個(gè)采用匯流排 Major 3適配器連接起來(lái)的Intel RX V100 CPU。采用NVLink適配器連接起來(lái)4個(gè)RX V100 CPU的IBM公司 Spark AC922服務(wù)器端(在非常之中,均采用其中1個(gè)CPU)。所示w推測(cè)了基于x86的設(shè)立的效能數(shù)據(jù)分析結(jié)果??梢砸?jiàn)到S1和S2這平行線(xiàn)。在S1線(xiàn)上,實(shí)際上的專(zhuān)業(yè)訓(xùn)練剛順利完成時(shí)(即,codice_語(yǔ)義復(fù)出文件系統(tǒng))。專(zhuān)業(yè)訓(xùn)練每個(gè)資料塊的一段時(shí)間大概為90毫秒(ms)。當(dāng)專(zhuān)業(yè)訓(xùn)練正要開(kāi)展時(shí),在S2線(xiàn)上,深入研究技術(shù)人員將下一個(gè)資料塊寫(xiě)入CPU上。通過(guò)觀察到克隆資料必需318毫秒,這僅僅CPU荒廢了十分總長(zhǎng)的長(zhǎng)時(shí)間,克隆資料的一段時(shí)間或許是一個(gè)難題。在所示d之中,對(duì)于基于Spark的設(shè)立,由于Intel NVLink給予了更為快速的信道,因此下一個(gè)資料塊寫(xiě)入CPU的一段時(shí)間顯著降低到55 ms(大部分降低了6倍)。這種減慢是由于將資料克隆一段時(shí)間偽裝在文件系統(tǒng)督導(dǎo)左邊,有效率減輕了關(guān)鍵路徑上的克隆一段時(shí)間,并做到了3.5倍的減慢。IBM公司的這個(gè)數(shù)據(jù)挖掘努給予相當(dāng)快速的專(zhuān)業(yè)訓(xùn)練飛行速度,可以在傳統(tǒng)中央處理器 / CPU數(shù)值控制系統(tǒng)上專(zhuān)業(yè)訓(xùn)練流向當(dāng)今的數(shù)據(jù)挖掘數(shù)學(xué)模型,也可用做職業(yè)培訓(xùn)數(shù)學(xué)模型以辨認(rèn)出重新新奇方式也,或者在有原先資料只用時(shí)再次專(zhuān)業(yè)訓(xùn)練既有數(shù)學(xué)模型,以始終保持飛行速度因特網(wǎng)CVT技術(shù)水平(即因特網(wǎng)所能擁護(hù)的極快飛行速度)。這僅僅更為較高的應(yīng)用程序計(jì)算成本,更長(zhǎng)的利用效率,更為靈巧的開(kāi)發(fā)計(jì)劃和更為快速的順利完成一段時(shí)間。不過(guò),IBM公司深入研究技術(shù)人員并并未堅(jiān)稱(chēng)TensorFlow并未透過(guò)并行性,并且也不給予Snap TR和TensorFlow間的任何非常。但他們的確問(wèn)道:“我們施行專(zhuān)門(mén)從事的框架,來(lái)透過(guò)CPU的大規(guī)模有序框架,同時(shí)負(fù)責(zé)任CPU寄存器之中的資料范圍,以不必要大量鏈路開(kāi)支?!?/span>短文引述,改用NVLink 2.0適配器的AC922服務(wù)器端,比改用其RX CPU的PCI-E適配器的Pentium服務(wù)器端(Pentium Golden 6150 中央處理器 _ 2.70DDR)要更為快速,PCI-E適配器是戈達(dá)德CPU的適配器。“對(duì)于基于PCI-E的設(shè)立,我們測(cè)的有效率信道為11.8KB /秒,對(duì)于基于NVLink的設(shè)立,我們測(cè)的有效率信道為68.1KB /秒?!?/span>專(zhuān)業(yè)訓(xùn)練資料被傳送CPU,并在那里被處理過(guò)程。NVLink控制系統(tǒng)以比PCI-E控制系統(tǒng)極快的飛行速度向CPU發(fā)送塊,一段時(shí)間為55ms,而不是318ms。IBM公司制作團(tuán)隊(duì)還指出:“當(dāng)應(yīng)用密集數(shù)組時(shí),我們一個(gè)系統(tǒng)之中采用的迭代開(kāi)展了一些重新建模?!?/span>總的來(lái)說(shuō),也許Snap TR可以更多地透過(guò)NVIDIA CPU,在NVLink上數(shù)據(jù)傳輸比在x86服務(wù)器端的PCI-E track上更為快速。但不明白POWER9 中央處理器與Xeons的飛行速度相比之下如何,IBM公司未披露發(fā)表任何單獨(dú)POWER9與Pentium DP的非常。因此也不會(huì)問(wèn)道,在不同的應(yīng)用程序配有上運(yùn)轉(zhuǎn)兩個(gè)suckers之后,Snap TR比TensorFlow更糟。無(wú)論是什么情況,46倍的升幅都更讓人感觸引人注目,并且給了IBM公司極大的空間內(nèi)來(lái)促進(jìn)其POWER9服務(wù)器端作為插進(jìn)NVIDIA CPU,運(yùn)轉(zhuǎn)Snap TR努以及開(kāi)展數(shù)據(jù)挖掘的娛樂(lè)場(chǎng)所。清晰試驗(yàn)和結(jié)果不見(jiàn)科學(xué)論文:>://arxiv.消/abs/1803.06333>://tw.theregister.co.www/2018/03/21/ibm_logic_education_technology_trained_pass/>://cloud.web.的網(wǎng)站/部落格/radio安application/2017/02/However安web安cloud安logic安education安to安predict安clicks安at安Large
 
關(guān)鍵詞: 數(shù)據(jù) GPU 訓(xùn)練 Snap ML
 
打賞
[ 新聞資訊搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 違規(guī)舉報(bào) ]  [ 關(guān)閉窗口 ]
免責(zé)聲明:
本網(wǎng)站部分內(nèi)容來(lái)源于合作媒體、企業(yè)機(jī)構(gòu)、網(wǎng)友提供和互聯(lián)網(wǎng)的公開(kāi)資料等,僅供參考。本網(wǎng)站對(duì)站內(nèi)所有資訊的內(nèi)容、觀點(diǎn)保持中立,不對(duì)內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。如果有侵權(quán)等問(wèn)題,請(qǐng)及時(shí)聯(lián)系我們,我們將在收到通知后第一時(shí)間妥善處理該部分內(nèi)容。
 

【snap加速器】比搜索引擎快速46倍CPU助力IBM公司 Snap ML40億抽樣專(zhuān)業(yè)訓(xùn)練數(shù)學(xué)模型均需要91.5 秒二維碼

掃掃二維碼用手機(jī)關(guān)注本條新聞報(bào)道也可關(guān)注本站官方微信賬號(hào):"xxxxx",每日獲得互聯(lián)網(wǎng)最前沿資訊,熱點(diǎn)產(chǎn)品深度分析!
 

 
0相關(guān)評(píng)論

 
国产精品无码一区二区在线看| 国产97在线 | 中文| 久久午夜福利无码1000合集| 一道久久爱综合久久爱| 女人自熨全过程直播| 国产午夜影视大全免费观看| 亚洲国产精品久久亚洲精品| 无码国产精品一区二区高潮| 精品国产乱码久久久久久1区2区 | 人体内射精一区二区三区| 无遮挡边吃摸边吃奶边做| 国产七十六+老熟妇| 中文人妻熟女乱又乱精品| 亚洲日本va中文字幕久久| 内射后入在线观看一区| 美女扒开内裤让男生桶| 又爽又黄禁片视频1000免费| 无码毛片aaa在线| 亚洲日本va中文字幕久久| 成人夜色视频网站在线观看| 久久99精品国产麻豆婷婷| 国产精品无码无卡在线观看久| 国产日产欧产美韩系列麻豆 | 欧美日韩久久久精品a片| 国产精品免费久久久久影院| 亚洲综合色丁香婷婷六月图片| 在线看亚洲十八禁网站| 久久婷婷丁香五月综合五| 国产精品一品二区三区的使用体验 | 97在线观看视频| 精精国产xxxx视频在线播放| 草草浮力地址线路①屁屁影院| 无码成人aaaaa毛片| 久久精品中文字幕一区| 免费现黄频在线观看国产| 真人祼交二十三式视频| 久久精品水蜜桃av综合天堂| 亚洲综合天堂av网站在线观看| 婷婷色香五月综合缴缴情| 中文字幕日韩人妻不卡一区| 国产suv精品一区二区883|