Ana SayfaGenelŞirketler GPU'lara daha ucuz erişim aradıkça alternatif bulutlar patlama yapıyor

Şirketler GPU’lara daha ucuz erişim aradıkça alternatif bulutlar patlama yapıyor

Published on

spot_img


Alternatif bulutlara yönelik iştah hiç bu kadar büyük olmamıştı.

Örnek olarak: CoreWeaveHayatına bir kripto para madenciliği operasyonu olarak başlayan GPU altyapı sağlayıcısı, bu hafta Coatue, Fidelity ve Altimeter Capital gibi yatırımcılardan 1,1 milyar dolarlık yeni fon topladı. Bu tur, değerlemesini para sonrası 19 milyar dolara ve toplamda borç ve öz sermaye olarak 5 milyar dolara çıkardı – on yaşından küçük bir şirket için dikkate değer bir rakam.

Sadece CoreWeave değil.

Bulutta barındırılan bir dizi GPU örneği de sunan Lambda Labs, 320 milyon dolarlık C Serisi turunu kapattıktan aylar sonra, Nisan ayı başında 500 milyon dolara kadar bir “özel amaçlı finansman aracı” temin etti. Kripto milyarderi Jed McCaleb tarafından desteklenen kar amacı gütmeyen Voltage Park, geçtiğimiz Ekim ayında duyuruldu GPU destekli veri merkezlerine 500 milyon dolar yatırım yaptığını açıkladı. Ve Birlikte Yapay ZekaAynı zamanda üretken yapay zeka araştırmaları da yürüten bulut GPU sunucusu, Mart ayında Salesforce liderliğindeki bir turda 106 milyon dolar kazandı.

Peki alternatif bulut alanına yönelik bu heves ve bu alana akan para neden?

Cevap, tahmin edebileceğiniz gibi, üretken yapay zeka.

Üretken yapay zeka patlaması devam ettikçe, üretken yapay zeka modellerini büyük ölçekte çalıştıracak ve eğitecek donanıma olan talep de artıyor. GPU’lar, mimari olarak, modelleri eğitmek, ince ayar yapmak ve çalıştırmak için mantıklı bir seçimdir çünkü üretken modelleri oluşturan doğrusal cebir denklemlerini gerçekleştirmek için paralel olarak çalışabilen binlerce çekirdek içerirler.

Ancak GPU’ları kurmak pahalıdır. Bu yüzden çoğu geliştirici ve kuruluş bunun yerine buluta yöneliyor.

Amazon Web Services (AWS), Google Cloud ve Microsoft Azure gibi bulut bilişim alanındaki yerleşik şirketler, üretken yapay zeka iş yükleri için optimize edilmiş GPU ve özel donanım örneklerinde hiçbir eksiklik sunmuyor. Ancak en azından bazı modeller ve projeler için alternatif bulutlar daha ucuz olabilir ve daha iyi kullanılabilirlik sağlayabilir.

CoreWeave’de, model eğitimi ve çıkarım için popüler bir seçim olan Nvidia A100 40GB kiralamanın maliyeti saat başına 2,39 dolar, yani aylık 1.200 dolar. Aynı GPU Azure’da saat başına 3,40 dolar veya aylık 2.482 dolar; Google Cloud’da ise saat başına 3,67 dolar veya aylık 2.682 dolar.

Üretken yapay zeka iş yüklerinin genellikle GPU kümeleri üzerinde gerçekleştirildiği göz önüne alındığında, maliyet deltaları hızla büyür.

Gartner’ın bulut hizmetleri ve teknolojileri başkan yardımcısı Sid Nag TechCrunch’a verdiği demeçte, “CoreWeave gibi şirketler, özel ‘hizmet olarak GPU’ bulut sağlayıcıları olarak adlandırdığımız bir pazara katılıyor” dedi. “GPU’lara olan yüksek talep göz önüne alındığında, Nvidia GPU’larını aldıkları ve bu GPU’lara erişim ve pazar için başka bir yol sağladıkları hiper ölçekleyicilere bir alternatif sunuyorlar.”

Nag, bazı büyük teknoloji firmalarının bile bilgi işlem kapasitesi sorunlarıyla karşılaştıklarında alternatif bulut sağlayıcılarına yönelmeye başladıklarına dikkat çekiyor.

Geçtiğimiz Haziran ayında CNBC rapor edildi Microsoft’un, ChatGPT’nin üreticisi ve yakın bir Microsoft ortağı olan OpenAI’nin üretken yapay zeka modellerini eğitmek için yeterli bilgi işlem gücüne sahip olmasını sağlamak için CoreWeave ile milyarlarca dolarlık bir anlaşma imzaladığını duyurdu. CoreWeave’in çiplerinin büyük bölümünü tedarik eden Nvidia, belki de kaldıraç nedenleriyle bunu arzu edilen bir eğilim olarak görüyor; bazı alternatif bulut sağlayıcılarına verdiği söyleniyor tercihli erişim GPU’larına.

Forrester’da baş analist olan Lee Sustar, CoreWeave gibi bulut satıcılarının kısmen başarılı olduğunu çünkü yerleşik sağlayıcıların uğraşmak zorunda olduğu altyapı “bagajına” sahip olmadıklarını düşünüyor.

“Altyapıya ve çok az gelir getiren ya da hiç getirmeyen hizmetlere büyük yatırımlar gerektiren genel genel bulut pazarındaki hiper ölçekleyici hakimiyeti göz önüne alındığında, CoreWeave gibi rakipler, genel olarak hiper ölçekleyici düzeyindeki yatırımların yükü olmadan premium yapay zeka hizmetlerine odaklanarak başarılı olma fırsatına sahipler” dedi.

Ancak bu büyüme sürdürülebilir mi?

Sustar’ın şüpheleri var. Alternatif bulut sağlayıcılarının genişlemesinin, GPU’ları yüksek hacimde çevrimiçi hale getirmeye devam edip edemeyeceklerine ve bunları rekabetçi bir şekilde düşük fiyatlarla sunup sunamayacaklarına bağlı olacağına inanıyor.

Google, Microsoft ve AWS gibi yerleşik şirketler modelleri çalıştırmak ve eğitmek için özel donanım yatırımlarını artırdıkça fiyatlandırma konusunda rekabet etmek zorlaşabilir. Google, kendi TPU’larMicrosoft kısa süre önce iki özel yonga tanıttı, Azure Maia ve Azure Cobaltve AWS’nin Trainium, Inferentia ve Graviton.

Sustar, “Hypercaler’lar Nvidia’ya olan bağımlılıklarını azaltmak için özel silikonlarından yararlanacak, Nvidia ise CoreWeave ve diğer GPU merkezli yapay zeka bulutlarına yönelecek” dedi.

Ayrıca, birçok üretken yapay zeka iş yükü en iyi GPU’larda çalışsa da, tüm iş yüklerinin bunlara ihtiyaç duymadığı gerçeği var – özellikle de zamana duyarlı değillerse. CPU’lar gerekli hesaplamaları çalıştırabilir, ancak genellikle GPU’lardan ve özel donanımlardan daha yavaştır.

Daha varoluşsal olarak, üretken yapay zeka balonunun patlaması tehdidi var, bu da sağlayıcıları GPU yığınlarıyla ve bunları talep eden neredeyse yeterli müşteriyle baş başa bırakacak. Ancak Sustar ve Nag, geleceğin kısa vadede pembe göründüğünü söylüyor ve her ikisi de yeni başlayan bulutların istikrarlı bir akışını bekliyor.

“GPU odaklı bulut girişimleri [incumbents] Özellikle de halihazırda çoklu buluta sahip olan ve birden fazla bulutta yönetim, güvenlik, risk ve uyumluluğun karmaşıklığıyla başa çıkabilen müşteriler arasında büyük bir rekabet söz konusu.” “Bu tür bulut müşterileri, güvenilir bir liderliğe, sağlam bir finansal desteğe ve bekleme süresi olmayan GPU’lara sahipse yeni bir yapay zeka bulutunu rahatlıkla deneyebilir.”



Source link

Latest articles

OpenAI plans to open an office in Germany

OpenAI is expanding its footprint to Germany. According to a press release issued...

Anthropic CEO says DeepSeek was ‘the worst’ on a critical bioweapons data safety test

Anthropic’s CEO Dario Amodei is worried about competitor DeepSeek, the Chinese AI company...

Trump admin freezes EV charging program that gave Tesla millions

The Department of Transportation has paused funding for a $5 billion EV charging...

One of Elon Musk’s young DOGE engineers explains how he won the $700K Vesuvius Challenge

This week, Silicon Valley came barrelling into Washington, D.C., in the form of...

More like this

OpenAI plans to open an office in Germany

OpenAI is expanding its footprint to Germany. According to a press release issued...

Anthropic CEO says DeepSeek was ‘the worst’ on a critical bioweapons data safety test

Anthropic’s CEO Dario Amodei is worried about competitor DeepSeek, the Chinese AI company...

Trump admin freezes EV charging program that gave Tesla millions

The Department of Transportation has paused funding for a $5 billion EV charging...