Teknoloji

Çin’in yapay zekası DeepSeek, birdenbire nasıl bu kadar popüler oldu?

OpenAI, geçtiğimiz hafta ChatGPT için Operator AI aracısını yayınlayarak en azından demolar söz konusu olduğunda Google gibi rakiplerine göre çok önde olduğunu gösterdi. Ancak dünyayı sarsan AI haberi ChatGPT, Operator veya geçen hafta duyurulan devasa Stargate projesi değildi. DeepSeek AI, Çinli bir girişimin OpenAI’nin ChatGPT o1’ine rakip olan R1 akıl yürütme modelini yayınlamasıyla AI dünyasında büyük dalgalar yarattı.

DeepSeek’i farklı kılan ne?

OpenAI o3’ü duyurmuşken diğer AI şirketlerinin o1’e rakip sistemler oluşturması zaten beklenen bir şey olduğu için bu kısımda şaşırtıcı bir durum yok. Ancak DeepSeek’in sıra dışı yanı, Çinli şirketin modellerini açık kaynaklı hale getirerek herhangi bir şirket veya geliştirici tarafından erişebilir ve incelenebilir kılmasıydı. Daha da ilgi çekici olan kısım ise, DeepSeek’in yayınladığı, son derece gelişmiş modelin OpenAI’nin o1’inin maliyetinin çok daha az bir kısmına eğitildiğini iddia eden R1 araştırma makalesiydi.

DeepSeek R1 eğitiminin, OpenAI’ın ChatGPT ile benzer ilerleme için ihtiyaç duyduğu kaynakların yalnızca %3 ila %5’iyle mümkün olduğu haberi dünya çapında yankı uyandırdı. Pazartesi günü erken işlemlerde yapay zeka ile ilgili hisse senetleri düştü, DeepSeek ise App Store’da ChatGPT’yi geride bırakarak 1 numaraya yükseldi.

Mevcut AI yazılımlarındaki sorunlardan biri, ürünü geliştirme ve kullanma maliyetiyle ilgili. o1 gibi gelişmiş modellerin geliştirilmesi onlarca milyon dolara mal olabilir. İşlem, gerekli bilgi işlem gücünü ve enerji harcamalarını sağlayan üst düzey grafik kartları (GPU) gerektirir.

Bu yüzden ChatGPT o1 gibi bitmiş ürünler sınırlamalar olmadan ücretsiz olarak sunulamıyor. OpenAI gibi şirketlerin maliyetleri karşılaması ve kar elde etmesi gerekir. Bu yüzden 500 milyar dolarlık devasa Stargate programı, özellikle ABD ile Çin arasındaki kaçınılmaz AI silahlanma yarışı düşünüldüğünde, AI geliştirme için çok önemli bir karar.

ABD’nin Çin’e karşı uyguladığı ambargoya rağmen…

Çin’in, ChatGPT o1 ürünlerinin geliştirilmesini mümkün kılan aynı üst düzey çiplere ve GPU’lara erişimini engelleyen ABD yaptırımları da düşünüldüğünde, ChatGPT, Gemini, Meta AI ve Claude’un Çin’den önemli bir rekabetle karşılaşmaması beklenebilirdi.

DeepSeek’in bu kadar şaşırtıcı olmasının bir sebebi de buydu. Çinli girişim, sadece donanım gücüne güvenerek OpenAI ile rekabet edemeyeceğini biliyordu. OpenAI gibi şirketlerin elinde tuttuğu sayıda GPU’ya erişemezdi. Bu nedenle, DeepSeek araştırmacıları R1 için farklı bir yaklaşım benimsedi ve aynı donanıma erişim olmadan gelişmiş bir mantık modeli eğitmenin yollarını buldu.

Ayrıca DeepSeek, R1’e erişimi OpenAI’nin ChatGPT’sinden çok daha ucuz hale getirdi. Bütün bunlara DeepSeek modellerinin açık kaynaklı doğasını da eklerseniz, neden geliştiricilerin Çinli firmanın AI’sını test etmek için akın ettiğini ve DeepSeek’in App Store’da neden yükseldiğini tahmin etmek çok zor olmuyor.

Bir araştırmaya göre, Çinli girişim, daha hızlı ve daha ucuz sonuçlar üretmek için OpenAI’nin ChatGPT’yi eğitmek için kullandığı Gözetimli İnce Ayar (SFT) teknolojisi yerine Takviyeli Öğrenme (RL) kullandı. SFT, AI’ye çeşitli komutlara ne tür yanıtlar vereceğini bilmesi için verilere erişim sağlayarak sorunları çözmenin yollarını göstermeye dayanıyor. RL ise, AI modeline güvenir, ödül sistemiyle yanıtları bulmaya çalışır ve ardından AI’ya geri bildirim sağlar.

RL, DeepSeek’in R1’in muhakeme yeteneklerini geliştirmesine ve hesaplama eksikliğinin üstesinden gelmesine olanak sağladı. Ancak, VentureBeat’in belirttiği üzere, RL’ye geçmeden önce R1’in erken aşamalarında insanların AI’yı denetledikleri bazı SFT eğitimleri gerekliydi.

Sadece 50.000 Nvidia GPU ile gelen başarı

DeepSeek’in bu başarıyı, ABD yaptırımlarından önce alınmış olan 50.000 Nvidia GPU ile başarmış olması, çok daha yeni 500000’den fazla GPU ile çalışan OpenAI, Google ve Anthropic gibi Batılı firmaların benzer yöntemler kullanarak yapabileceklerinin sorgulanmasına yol açıyor. DeepSeek’in Çin merkezli olması bazı kuruluşlar ve kişiler için bir endişe sebebi olacak olsa da, pek çok kişi bu daha ucuz hizmeti tercih edecektir. Bu yüzden batılı AI şirketlerinin de artık maliyetlerini azalmaları zorunlu olabilir ve AI alanında yakında çok daha fazla atılım görebiliriz.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu