I te puna o 2026, i wiri te umanga AI e nga purongo nui: e ai ki a Reuters, kei te tirotirohia e Anthropic te kaha ki te hoahoa i ana ake maramara.Ko tenei taiwhanga AI, me nga moni whiwhinga a-tau neke atu i te $30 piriona me te nui o te turanga kaiwhakamahi mo tana tauira Claude, kei te tino whakaaro ki te huri mai i te kaihoko mana rorohiko ki te kaiwhakaahua.
E whakaae ana nga puna korero kei te timata tonu nga mahere;kare ano te kamupene kia oti i nga mahere motuhake, i hanga ranei i tetahi roopu whakatapua.Ko te mutunga ka whiriwhiri a Anthropic ki te hoko maramara anake kaua ki te hoahoa i roto i te whare.Engari ahakoa te mea ka taea te korero nui.
I tenei wa, ka whakamahia e Anthropic nga TPU e rua (Tensor Processing Units) i hangaia e te kamupene matua o Google a Alphabet me nga maramara Trainium a Amazon ki te whakawhanake me te whakahaere i a Claude.I tenei wiki, i hainatia ano e te kamupene he kirimana mo te wa roa me Google me Broadcom-ko te mea whakamutunga ko te kaitautoko hoahoa matua o nga TPU a Google.Ko te hainatanga i tetahi kirimana hoko-a-waho e maha piriona taara i te wa e tirotiro marie ana i te whanaketanga o roto-whare, he tino rite tenei huarahi-rua ki a Meta me Microsoft i etahi tau ki muri, kei a raua ano o raua ake maramara ritenga.
Ko nga whakatau tata o te ahumahi e kii ana ko te hoahoa i tetahi maramara AI taumata-runga te utu tata ki te $500 miriona, engari i tua atu i te utu, ko te mea nui ake ko te tohu umanga kei muri i te nekehanga a Anthropic.I te wa ka timata te kamupene tauira parakore ki te whai whakaaro nui ki te whakawhanake i tana ake silicon, kua uru te whawhai taputapu mo te whakapae AI ki te taumata hou o te kaha.
I roto i nga tau e rua kua pahure ake nei, kua kaha te hurihanga o te ahumahi AI, me te nui o te tono hiko rorohiko e tere haere ana mai i te taha whakangungu ki te taha whakatau.
Ko te wahanga whakangungu, he wiki, he marama ranei, e hiahia ana ki nga tautau GPU nui-nui mo te rorohiko whakarara, a ko te mana o Nvidia i tenei taha ka tata tonu.Engari he rereke te whakatau.Ko te whakatauira ko te tatauranga-a-waa ka puta i nga wa katoa ka whakautu te tauira ki te tono a te kaiwhakamahi;e whai ana i te iti o te torohūtanga, te nui o te whakaputanga, me te iti o te whakapau kaha—ko nga whainga kare e tino rite ki nga mea e pai ana a GPU.
E ai ki te matapae a Barclays, hei te tau 2026, ka nui ake i te 70% o te katoa o te tono hiko rorohiko AI, e 4.5 nga wa o te tono whakangungu.Ka taea te kii ko te pakanga tino nui i roto i te maakete maramara AI kei te heke mai kei roto i te whakatau.
Kua hangaia e Nvidia he moat mo te tekau tau i roto i te mutunga whakangungu, engari ki te kore e taea e tenei moat te toro atu ki te mutunga o te whakatau, ka anga te hanganga ahumahi katoa ki te tuhi ano.Mo konei, i mahi a Nvidia i tetahi nekehanga okawa i te mutunga o tera tau, e kii ana i tetahi kirimana raihana kore-motuhake me te whakaoho maramara AI inference Groq.Ko Jonathan Ross, te kaiwhakarewa me te Tumuaki o Groq, te Perehitini a Sonny Madra, me etahi miihini matua i uru atu ki Nvidia.I kii nga kaipāho o tawahi ki te hunga o roto e kii ana ko te whakaaro mo tenei whakawhitinga he tata ki te $20 piriona.
Ko nga kupu whaimana a Nvidia he tupato, e kii ana he raihana hangarau anake me te whiwhi taranata, ehara i te hoko tuku iho.Engari ko tenei tikanga hoko atypical he mea noa i Silicon Valley—ka taea e ia te karo i nga arotake antitrust uaua i te wa e kawe mai ana te hangarau me te roopu matua ki roto i te roopu.
Ko te korero a Groq i te tuatahi he tino whakamiharo.Ko te Kaihanga a Ross he mema matua mo te kaupapa TPU a Google, a, i tino mohio ia ki nga herenga o te hoahoanga GPU i roto i nga ahuatanga whakatauira: nga mano o nga waeine rorohiko whakarara me te arorau whakamaumahara tino uaua.Ko enei ahuatanga he painga ki te whakangungu engari ka puta te ohorere ohorere i roto i te whakatau.
Mo tenei take, i whiriwhiria e Groq tetahi huarahi rereke: ka whakakore katoa i te kaihōtaka i te taumata taputapu, engari ma te kaitoi e whakatau te huarahi rere o ia moka o nga raraunga i te waahi waehere, ka taea e te maramara te mahi ano he raina huihuinga aunoa ki te nanohekona.Ko te ingoa o tenei hoahoanga ko LPU, ko te Waenga Tukatuka Reo ranei.I roto i nga whakamatautau whakatau o nga tauira nui auraki, ka neke atu i te tekau nga wa te tere o te whakaputa kupu o nga GPU Nvidia, ko tana kohi hiko mo ia tohu he kotahi whakatekau noa iho o enei.
Na tenei mahi tino nui, neke atu i te 1.5 miriona nga kaiwhakamahi kaiwhakawhanake a Groq me te maha o nga rauna haumi mai i nga umanga teitei penei i a Cisco, Samsung, me BlackRock, me te uara kua eke ki te $6.9 piriona.Heoi, na te mea i angitu ai i hinga ano.Na te tino rawe a Groq i mahi ai i te tino whainga kia kati ki nga kanohi o Jensen Huang.
I runga i te mata, ko te hoko a Nvidia ki a Groq ko te whakakii i tana whakatakotoranga hangarau i runga i te taha whakatau, engari ko te hohonu ake, he whakauru parepare.Ma te whakauru i tetahi o nga kaiwero kaha o waho ki roto i tana rauwiringa kaiao, ka tangohia e Nvidia nga maramara hokohoko mai i nga kaihokohoko kapua tuarua me nga kamupene rorohiko AI kaore he kaha ki te whakawhanake i a raatau ake maramara.Ki te kore a Groq hei rereke, ko nga whiringa mo te hunga e kore e pai kia "takehia" e Nvidia kua iti haere.
Heoi, kare pea e roa tenei ahuatanga pouri.
Inaa, i mua noa atu i te aranga ake o Groq, kua oti kee nga tangata nunui o te kapua ki te whakamahere i o raatau ake huarahi hiko rorohiko.Kei a Google nga TPU, kei a Amazon te Trainium, kei a Microsoft a Maia—kua eke nga huarahi e toru o roto-whare ki te waahi pakeke e taea ai te hoko ki waho.
Ko te TPU tuawhitu-whakatupuranga a Google, ko Ironwood te ingoa, i tukuna mana me te whakarewahia i te mutunga o te 2025. Ka whakatauritea ki te reanga o mua, kua piki ake tana mahinga maramara kotahi neke atu i te 4 nga wa, a ka taea e te roopu kotahi te hono ki te 9,216 maramara.Kaore i huna e Google tana tuunga mo tenei whakatipuranga o nga hua: te miihini arumoni tino whai hua i roto i te waa whakatau.Mai i te kaha ki te whakawhanake i roto i te whare na te kaha o te hiko rorohiko o roto i te tau 2015, ki te whakatuwhera i te tuku TPU ki nga pokapū raraunga a nga kaihoko i te tau 2025, tekau tau a Google ki te whakakoi i tetahi kaupapa ohorere hei patu rautaki.Ko te panui a Anthropic ko te whakangungu me te tukunga o te raupapa Claude a meake nei ka whakamahi ki te kotahi miriona TPU kua whakamanahia te maakete ki te uara arumoni o Ironwood.
He huarahi rereke a Amazon.Kua roa a AWS e whakawhirinaki nui ana ki nga maramara i hangaia i roto i te whare e tana apiti a Annapurna Labs.Ko te raupapa Trainium he tino rite ki nga Nvidia GPU, engari e aro ana ki te whakaheke i te utu o nga hanganga kapua me te whakaiti i te whakawhirinaki ki nga kaiwhakarato o waho.Ko te hainatanga tata a AWS mo te whakaaetanga mahi tahi mo nga tau maha me Cerebras ki te whakauru i nga maramara Wafer-Scale Engine (WSE) Cerebras ki roto i nga pokapu raraunga mo te tuku whakarara me nga maramara Trainium i whakawhanakehia e ia ano he whakaaturanga raima o tenei arorau o te whakarite i te whanaketanga o roto-whare me te taapiri i nga hoko o waho.
He tino marama te whainga a AWS: whakamahi i te Trainium ki te whakahaere i te tono whakatauranga iti-tere, iti-utu, me te whakamahi i nga maramara Cerebras ki te maukati i nga kaihoko teitei e tino aro ana ki te toroa me te hiahia ki te utu moni mo te tere.
Mo nga maramara whakatau, kaore i rite ki nga maramara whakangungu e whai ana i te tere mo te wa poto, ka nui ake te aro ki te kaha o te kaha mo te wa roa.Ka pau te Nvidia GPU tata ki te 700 Watts, i te mea ka taea e te maramara whakatapua me te mana rorohiko rite te whakahaere i te whakapau hiko i roto i te 200 Watts.Mo nga tono tino-nui-nui e hiahia ana ki nga rau mano o nga maramara whakatau, ka taea e tenei waahi te kawe mai i nga rau miriona taara hei penapena utu ia tau.Koinei tetahi o nga tino take e whakataetae ai nga tangata nunui o te kapua penei i a Google, Amazon, me Meta ki te peti i runga i nga maramara whakatapua a ASIC.
E ai ki nga purongo hou, kua tae atu a Meta ki te whakangungu 1Gw me te kirimana mahi tahi maramara maramara me Broadcom, e herea ana ki te kawe mai i nga kaikawe hou ki te maakete maramara "pouri" kua oti.
Mena ko nga huarahi R&D a-whare o nga roroa kapua he putea mo te wa roa me te nui o nga taurangi rauemi, na te hononga i waenga i a Intel me SambaNova e tohu ana i tetahi atu huarahi pakaruhanga tino pono.
I te tau 2026, i kii a SambaNova i te whakarewatanga o te otinga whakaurunga taputapu rereke me te Intel, e tango ana i te hoahoanga e toru nga taumata: GPU mo te whakakii i mua i te whakakii, Intel Xeon 6 te tukatuka hei whakahaere matua me te PTM mahi, me te SambaNova RDU mo te wetewete, i hangaia mo nga kawenga mahi a te kaihoko AI.Ka tuwhera tenei otinga ki nga umanga, kaiwhakarato ratonga kapua, me nga kaupapa AI rangatira i te haurua tuarua o 2026.
I kii a SambaNova he pai nga punaha GPU parakore ki te hono i mua i te whakakii, engari i roto i nga mahi whakatau i roto i nga taiao whakangao, ko te whakaritenga taputapu o nga PTM me te kaha wetewete o nga kaiwhakatere whakatapu whakatapua ko nga taurangi matua e whakatau ana i te tere me te utu.
Ko ana raraunga whakamatautau e whakaatu ana ko te tere whakahiato LLVM o nga kaitoro Intel Xeon 6 he nui ake i te 50% tere atu i nga PTM tūmau i runga i te hoahoanga o Arm, a ko te mahinga o te papaaarangi vector ka eke ki te 70% tere ake.Ko enei tohu e rua i tino pa ki nga pounamu mahi matua o te rerengamahi kaihoko waehere.
Ko te mahi a Intel i roto i tenei mahi tahi he mea whakahirahira.I te wa o te PC hegemon, kua tata te whakahekehia mai i te papa pakanga AI maramara matua i te waa GPU.Inaianei, na te mana o te PTM me te whakarite i nga painga o Xeon 6, kei te hoki mai ano te turanga i roto i nga otinga whakatauranga rerekee.Ko te rauwiringa kaiao rorohiko pokapu raraunga kei runga i te hoahoanga x86, nana hoki i whakahoki mai a Intel ki waenganui o te atamira AI.
Ko Cerebras tetahi ingoa e tika ana kia tuhia motuhaketia.
Ko tenei whakaoho e aro nui ana ki nga maramara AI wafer-scale i tukuna he tono IPO i te tau 2024 katahi ka unuhia e ia, na te nui o nga feaa e pa ana ki ana tumanako ki te maakete whakapaipai.Engari i muri mai, ka hainatia e OpenAI tetahi kirimana mahi tahi me Cerebras neke atu i te $10 piriona te utu hei whakarato mana rorohiko mo ChatGPT.Na tenei purongo i hoki mai a Cerebras ki te aro nui o te iwi, a, na aua whare e tatari ana, e kite ana, kia tirohia ano tona uara hangarau.I te Hui-tanguru 2026, i oti i a Cerebras tetahi rauna hou mo te $1 piriona i roto i te putea, me te tapeke putea $2.6 piriona me te uara i muri i te haumi mo te $23 piriona.
Ko te hangarau matua a Cerebras ko te Wafer-Scale Engine (WSE), e whakamahi ana i te angiangi katoa hei maramara kotahi, ka pakaru i nga herenga tapahi tinana o nga maramara tuku iho me te whakaputa i nga mahi tino pai i roto i nga mahi whakatau.E ai ki a Cerebras, ko te tere o ana maramara i roto i te hononga wetewete whakatau ka eke ki te 25 nga wa o nga GPU Nvidia.
Ko te panuitanga tata a AWS mo te whakaaetanga mahi tahi mo nga tau maha me Cerebras ki te whakauru i nga maramara WSE ki roto i nga pokapu raraunga mo te tohu AI e tohu ana i te whakawhitinga tuakiri matua mo tenei whakaoho-mai i te korero putea ki te kaiwhakarato o te papaahi kapua nui rawa atu o te ao.
Ko te kowhiringa a AWS mo Cerebras i ahu mai i runga i te whakaaro o OpenAI: mo nga ahuatanga e tino aro nui ana ki te tere o te whakautu, penei i te awhina hotaka me nga mahi a nga kaihoko, ko ia millihekona o te whakahekenga toroa e hono tika ana ki te wheako kaiwhakamahi me te uara arumoni—a koinei te ngoikore o nga GPU.
Mo Cerebras, i te mea ka nui noa atu nga tangata e whakamahi ana i te AI ki te whakaoti rapanga uaua ake, ka piki noa te hiahia mo te tere.Mena ko te tere ake te uara hua, ko te utu moni mo te tere he whanonga arumoni maori.Kei te whakaaehia tenei arorau e te maha atu o nga umanga.
Kei muri i te pakanga hiko rorohiko ko te whakatikatika i te taha whakawhiwhi hanganga.I tenei mutunga, ko te mahi a CoreWeave kei te nui haere te mahi.
I te tau 2025, ko Meta te kaiarahi ki te haina i tetahi kirimana tuku me CoreWeave, i whakaae ki te hoko $14.2 piriona i roto i te mana rorohiko AI i te tau 2031;Ko nga tuhinga i tukuna tata nei me te SEC e whakaatu ana kua taapiri atu a Meta ki te whakaaetanga, e whakaae ana ki te hoko i te $21 piriona taapiri i roto i te mana rorohiko AI i te tau 2032. Ko te taapiri o tenei whakaaetanga hou kua pana te ota ota a CoreWeave ki te $87.8 piriona, ko Meta anake te kaute mo te 40%.
Ko te pikinga o CoreWeave he microcosm o te whanaketanga o te mana rorohiko GPU mai i te taonga iti ki te hanganga.I te mea he kairihi hiko rorohiko parakore, kaore i te whakarato i nga kaha tauira, engari ko te tautoko o raro e taea ai te rere o nga tauira.I tua atu i nga roroa kapua nui e toru, ka hiahia nga umanga AI ki tetahi whiringa hiko rorohiko kaore e herea ki te puunaha rauwiringa kaiao—a ka whakakiia e CoreWeave tenei waahi.
I te tau 2025, i tutuki i a CoreWeave nga hoko $5.13 piriona, he pikinga mo te 170% i te tau o mua.Kua whakawhānuihia tana tauine pokapū raraunga ki te 43, me te kaha o te kaha ki te whakamahi i te 850 megawatts.Ko te kamupene kei te tata ki te 600,000 GPU, ko Nvidia H100 me H200 te nuinga, me te nui o nga raupapa Blackwell e piki haere tonu ana.Kua eke te kaha katoa o te hiko ki te 3,500 megawatts, he nui ake i te wha nga wa o te kaha o naianei.
Heoi, ko te arorau roha a CoreWeave ko tana pehanga hanganga nui rawa atu.Hei utu i te utu mo te whakawhänui i te pokapū raraunga, kua panuitia e te kamupene he tuunga motuhake mo te $4.75 piriona i roto i nga here.I te iti iho i te $4 piriona moni kei te ringa, ka oti te $30 piriona ki te $35 piriona i roto i nga whakapaunga whakapaipai i te tau 2026 ko te tikanga me whakawhirinaki ki nga putea o waho ki te pupuri i te tere tere.Ko nga kaipupuri moni a CoreWeave kei te tino mohio ki te whakaaro nui ka tipu haere tonu te tono hiko rorohiko ki te reiti teitei mo te wa roa.
Ko te torotoro a Anthropic mo te hoahoa maramara o-whare, ko te $20 piriona te rironga mai a Nvidia mo Groq, ko te tekau tau te whakapau kaha a Google ki te huri i te TPU hei hua tohu, ko te whakaurunga mai a Amazon o Cerebras ki roto i tana ake pokapū raraunga ki te hanga i tetahi kōpaki whakatau rerekee, me te hononga o Intel me SambaNova ki te whakataetae mo te wahanga o te maakete ki nga huihuinga rerekee.te whakatau ko te papa pakanga hou.
He maha ake nga tangata e mohio ana kei te huri te arotahi o AI mai i te whakangungu tauira pai ake ki te pehea e kii atu ai i nga tono mo te utu iti me te tere tere.Na tenei nekehanga i puta he huringa nui i roto i te punaha hiko rorohiko-pokapū GPU o mua.
He rereke tenei whakataetae whakataetae mai i te whakakapinga moata o nga PTM e nga GPU.Ko te kuru kotahi-ara o nga hua hou i runga i nga mea tawhito.Ko te pakanga o tenei ra mo nga maramara whakatau he rite tonu ki te wehewehenga o nga mahi whakatikatika i roto i te puunaha rauwiringa kaiao.Karekau he hoahoanga kotahi e kaha ki te whakahaere i nga ahuatanga katoa, a ko nga huinga rerekee kei te noho auraki.Ka whakahaerehia e nga GPU te whakarara i mua i te whakakī, ka mau nga maramara whakatapua ki te wetewete, ko nga PTM te kawenga mo te whakarite me te ruruku, he rereke nga arotahi ki te kapua me nga pito, me te maha o nga kaitakaro e whakataetae ana i ia hononga.
Ko te tikanga ko te huanga kei tawhiti atu i te whakatau.
Mo Anthropic, ko te tirotiro i te hoahoa maramara-a-whare he whai i te mana whakahaere mana rorohiko me te kaupapa here inihua kia kore ai e mauheretia e nga kaiwhakarato o runga.Engari ko te huringa roa me te nui o te haumi i roto i te maramara R&D ko te tikanga kaore tenei huarahi e ngawari.Mo Nvidia, kei te hohonu tonu te moat rauwiringa kaiao o CUDA, engari ko te aputa e tino kitea ana te utu mahi-utu i runga i te mutunga o te whakatau ka noho hei whainga pakaruhanga noa mo nga kaiwero katoa.Mo etahi atu kaiwhakataetae hangarau penei i a Groq, kaore i te whakamaorihia te kaiarahi hangarau ki te angitu arumoni, a kei te piki haere tonu te tupono ka riro mai.
Kua tuhia nga rarangi whawhai, kei te tipu tonu te rarangi o nga kaiuru.Kua uru mai tenei AI inference computing power melee ki tana upoko tino kaha.