Humiling ng Quote

Balita

Ang New Blackwell AI chip ng NVIDIA ay nakalantad na may sobrang pag -init ng mga isyu, na nagiging sanhi ng mga pagkaantala sa paghahatid hanggang Enero sa susunod na taon


Ang susunod na henerasyon ng NVIDIA na Blackwell AI chips ay nahaharap sa malubhang mga isyu sa sobrang pag-init kapag naka-install sa mga rack ng high-capacity server.Ang mga isyung ito ay humantong sa mga pagbabago sa disenyo at pagkaantala, at nagtaas ng mga alalahanin sa mga customer tulad ng Google, Meta, at Microsoft tungkol sa napapanahong paglawak ng mga server ng Blackwell.

Inihayag ng mga tagaloob na ang Blackwell GPU ng Nvidia ay maaaring mag -overheat kapag ginamit sa mga server na may 72 chips.Ang mga aparatong ito ay inaasahang kumonsumo ng hanggang sa 120kW ng kapangyarihan bawat rack.Ang mga isyung ito ay pinilit ang NVIDIA na suriin muli ang disenyo ng rack ng server nang maraming beses, dahil ang sobrang pag -init ay maaaring limitahan ang pagganap ng GPU at magdulot ng panganib ng pagkasira ng sangkap.Nag -aalala ang mga customer na ang mga pag -setback na ito ay maaaring hadlangan ang kanilang iskedyul para sa pag -deploy ng mga bagong chips sa mga sentro ng data.

Ayon sa mga ulat, inutusan ng NVIDIA ang mga supplier nito na gumawa ng maraming mga pagbabago sa disenyo sa rack upang matugunan ang sobrang pag -init ng mga isyu.Ang kumpanya ay gumagana nang malapit sa mga supplier at kasosyo upang makabuo ng mga pagbabago sa engineering upang mapabuti ang paglamig ng server.Bagaman ang mga pagsasaayos na ito ay karaniwang kasanayan para sa tulad ng isang malaking sukat na paglabas ng teknolohiya, nagdaragdag pa rin sila ng mga pagkaantala at higit na maantala ang inaasahang petsa ng paghahatid.

Ayon sa isang ulat ng First Financial, bilang tugon sa mga pagkaantala at sobrang pag -init ng mga isyu, sinabi ng isang tagapagsalita para sa NVIDIA, "Nagtatrabaho kami sa mga nangungunang tagapagbigay ng serbisyo sa ulap bilang isang mahalagang bahagi ng aming koponan sa engineering at mga proseso. Ang mga iterasyon ng engineering ay normal at inaasahan. PagsasamaAng GB200, ang pinaka advanced na system hanggang ngayon, sa iba't ibang mga kapaligiran ng data center ay nangangailangan ng magkasanib na disenyo sa aming mga customer. "Sinabi rin ni Nvidia na "ang mga customer ay kasalukuyang nasamsam ang pagkakataon sa merkado para sa mga sistema ng GB200.

Noong nakaraan, kinailangan ni Nvidia na ipagpaliban ang paggawa ng Blackwell dahil sa mga depekto sa disenyo sa ani ng chip.Ang NVIDIA's Blackwell B100 at B200 GPU ay gumagamit ng TSMC COWOS-L packaging na teknolohiya upang ikonekta ang kanilang dalawang chips.Kasama sa disenyo na ito ang isang RDL intermediate layer na may LSI (lokal na silikon na interconnect) na tulay, na sumusuporta sa mga bilis ng paglipat ng data ng hanggang sa 10TB/s.Ang tumpak na pagpoposisyon ng mga tulay ng LSI na ito ay mahalaga para sa teknolohiya na gumana tulad ng inaasahan.Gayunpaman, ang mismatch sa mga katangian ng pagpapalawak ng thermal sa pagitan ng mga chips ng GPU, mga tulay ng LSI, mga interlayer ng RDL, at mga substrate ng motherboard ay humantong sa mga pagkabigo sa warping at system.Upang matugunan ang isyung ito, binago ng NVIDIA ang tuktok na layer ng metal at paga ng istraktura ng GPU silikon upang mapabuti ang pagiging maaasahan ng produksyon.

Samakatuwid, ang pangwakas na binagong Nvidia Blackwell GPU ay magsisimula lamang sa paggawa ng masa sa huling bahagi ng Oktubre, na nangangahulugang ang NVIDIA ay maaaring maipadala ang mga chips na ito mula sa huling bahagi ng Enero sa susunod na taon.

Ang mga kliyente ng Nvidia, kabilang ang mga higanteng tech tulad ng Google, Meta, at Microsoft, ay gumagamit ng mga NVIDIA GPU upang sanayin ang kanilang pinakamalakas na malalaking modelo ng wika.Ang pagkaantala ng Blackwell AI GPU ay natural na makakaapekto sa mga plano at produkto ng mga customer ng NVIDIA.