2023.11.02. VipAIR
Az AWS újradefiniálja az AI-térséget, mivel egyedi bérleti szolgáltatást kínál az Nvidia GPU-khoz, amelyet kevesebb költséggel a gyors és hatékony AI-projektekhez szabtak.
-
Az AWS olyan szolgáltatást indít, amely lehetővé teszi az ügyfelek számára az Nvidia GPU-k bérlését meghatározott időtartamra.
-
A szolgáltatás célja, hogy optimalizálja a költségeket és az erőforrásokat az AI-projektek végrehajtása során.
-
Az ajánlat rugalmasságot biztosít, lehetővé téve a GPU-példányok foglalását egyértelmű költségbiztonsággal.
A nagy nyelvi modellek iránti megugró kereslet az
Nvidia GPU-kat kapós árucikké tette, ami gyakran hiányhoz és magas költségekhez vezet. Az
AWS ezt a kihívást kezelve vezeti be az
Amazon Elastic Compute Cloud (EC2) kapacitásblokk ML szolgáltatását. Ez az innovatív szolgáltatás lehetővé teszi az ügyfelek számára, hogy meghatározott időtartamra béreljenek Nvidia
H100 Tensor Core GPU-kat, amelyek ideálisak az AI-val kapcsolatos feladatokhoz, például gépi tanulási modellek képzéséhez vagy a már meglévőkkel való kísérletezéshez.
Channy Yun az AWS szóvivője, egy nemrégiben megjelent blogbejegyzésében kiemelte a szolgáltatás rugalmasságát, és egy szállodai szoba foglalásához hasonlította. Az ügyfelek egytől 64-ig terjedő, egyenként 8 GPU-val rendelkező klaszterekben foglalhatnak GPU-kat. A foglalások akár 14 napra is szólhatnak, és akár nyolc héttel előre is leköthetők. A lefoglalt időszak lejárta után a példányok automatikusan leállnak. Ez a megközelítés egyértelművé teszi a felhasználók számára a projekt időtartamát, a felhasznált GPU-k számát és a teljes költséget, így nem érheti őket rejtett meglepetés.
Az AWS szemszögéből ez a szolgáltatás mindenkinek számára előnyös. Lehetővé teszi számukra, hogy a keresett erőforrásokat hatékonyan, szinte egy aukciós felálláshoz hasonlóan osszák ki, biztosítva a folyamatos bevételt. A dinamikus árképzési modell, amelyet a kereslet és a kínálat befolyásol, átláthatóságot biztosít a felhasználók számára. A regisztráció során megjelenik a kiválasztott időtartam és erőforrás teljes költsége, így a felhasználók a költségvetésük és igényeik alapján módosíthatják azt. Ez a funkció egyelőre az AWS US East (Ohio) régióban érhető el.