DeepSeek yeni model için çalışmaları hızlandırdı: ABD ve Çin için 'kritik bir dönemeç' olacak

Çinli girişim DeepSeek, Ocak ayında piyasaya sürdüğü R1 modelinin yeni ve üst versiyonunu daha hızlı bir şekilde tanıtmayı planlıyor.
Şirket, uygun fiyatlı yapay zeka akıl yürütme modeliyle Batılı rakiplerini geride bırakarak küresel hisse senedi piyasalarında 1 trilyon doları aşan bir satış dalgasını tetikledi. Bu durum şirketin çalışma temposunu da değiştirdi.
Konuya yakın kaynaklara göre DeepSeek başlangıçta daha gelişkin R2 modelini Mayıs başında piyasaya sürmeyi planlıyordu. Ancak şirketin bunu mümkün olduğunca erken bir tarihe çekmeye çalıştığı belirtildi.
Şirket, yeni modelin daha iyi kodlama yapmasını ve İngilizce dışındaki dillerde de akıl yürütebilmesini umuyor. R2'nin hızlandırılmış takvimiyle ilgili ayrıntılar daha önce kamuoyuna açıklanmamıştı. DeepSeek, konuya ilişkin yorum taleplerine yanıt vermedi.
ABD ve Çin için kritik bir dönemeç
Rakipleri hâlâ yüz milyarlarca dolara mal olan ABD merkezli yapay zeka modelleriyle rekabet edebilen ancak daha az maliyetli Nvidia çipleriyle geliştirilen R1 modelinin etkilerini sindirmeye çalışıyor.
Hintli teknoloji firması Zensar’ın operasyon direktörü Vijayasimha Alilughatta, "DeepSeek’in R2 modelinin piyasaya sürülmesi, yapay zeka endüstrisi için kritik bir an olabilir," dedi. DeepSeek’in maliyet açısından verimli yapay zeka modelleri geliştirme başarısının dünya çapında şirketleri kendi çalışmalarını hızlandırmaya teşvik edebileceğini ve bu alandaki az sayıdaki baskın oyuncunun tekelini kırabileceğini belirtti.
R2 modelinin piyasaya sürülmesi, yapay zeka liderliğini ulusal bir öncelik olarak belirleyen ABD hükümetini endişelendirebilir. Öte yandan, bu gelişme Çinli yetkilileri ve şirketleri de harekete geçirebilir. Çin’de onlarca firma, DeepSeek modellerini ürünlerine entegre ettiklerini açıkladı.
Gizemli Kurucu: Liang Wenfeng
DeepSeek hakkında bilinenler oldukça sınırlı. Şirketin kurucusu Liang Wenfeng, High-Flyer adlı fon sayesinde milyarder oldu. Eski bir işvereni tarafından 'gösterişsiz ve içe dönük' olarak tanımlanan Liang, Temmuz 2024’ten bu yana hiçbir medya kuruluşuna konuşmadı.
1985 yılında Guangdong eyaletinin kırsal bir bölgesinde doğan Liang, Çin’in en prestijli üniversitelerinden Zhejiang Üniversitesi’nde iletişim mühendisliği okudu. Kariyerine Şanghay’da bir akıllı görüntüleme şirketinin araştırma departmanında başladı. O dönemdeki patronu Zhou Chaoen, 9 Şubat’ta devlet medyasına yaptığı açıklamada, Liang’ın ödüllü algoritma mühendislerini işe aldığını ve 'düz yönetim tarzı' benimsediğini söyledi.
DeepSeek ve High-Flyer’da da Liang, Çinli teknoloji devlerinde yaygın olan katı hiyerarşik yönetim anlayışını, genç çalışanlara düşük maaş verilmesini ve haftanın altı günü sabah 9’dan akşam 9’a kadar çalışmayı ifade eden '996' kültürünü reddetti.
Pekin’deki ofisini, Çin’in en prestijli üniversiteleri olan Tsinghua ve Peking Üniversitesi’ne yürüme mesafesinde açtı. Teknik ayrıntılara derinlemesine dalıyor ve şirketin genç çalışanlarının büyük çoğunluğunu oluşturan Z kuşağı stajyerleri ve yeni mezunlarla birlikte çalışıyordu.
İki eski çalışana göre, genellikle sekiz saatlik çalışma günleri olan, işbirliğine dayalı bir atmosfer yaratılmıştı. Şirketten eylül ayında ayrılan 26 yaşındaki araştırmacı Benjamin Liu, "Liang bize kontrol yetkisi veriyor ve bizi uzman olarak görüyordu. Sürekli sorular soruyor ve bizimle birlikte öğreniyordu," dedi.
Maliyet etkin yapay zeka modelleri
2023 yılında Baidu ve diğer Çinli teknoloji devleri, ChatGPT’ye rakip olacak tüketici odaklı uygulamalar geliştirirken, Liang, yüksek bütçeli uygulamalar yerine modelin kalitesini iyileştirmeye odaklandığını açıklamıştı.
Üç kaynağa göre DeepSeek ve High-Flyer, çalışanlarına cömert maaşlar ödüyordu.
Bilgisayar gücü ve ABD yaptırımları
DeepSeek’in düşük maliyetli yapay zeka modelindeki başarısının arkasında, High-Flyer’ın on yılı aşkın süredir araştırma ve bilgisayar gücüne yaptığı büyük yatırımlar bulunuyor. 2020 ve 2021’de High-Flyer, milyarlar harcayarak iki süper bilgisayar kümesi kurdu. Fire-Flyer II adlı ikinci küme, AI modellerini eğitmek için kullanılan yaklaşık 10.000 Nvidia A100 çipinden oluşuyordu.
Bu yatırımlar, Çinli düzenleyicilerin dikkatini çekti. Bir yetkili, "Bu kadar çok çipe neden ihtiyaç duyduklarını anlamak istedik. Bunları nasıl kullanacaklardı? Piyasaya etkisi ne olacaktı?" diye sordu. Ancak yetkililer müdahale etmemeye karar verdi.
Bu karar, DeepSeek için kritik bir dönüm noktası oldu. Zira ABD, 2022’de A100 çiplerinin Çin’e ihracatını yasakladığında, Fire-Flyer II zaten faaliyetteydi.
Batı dünyasında artan endişeler
DeepSeek’in düşük maliyetli modelleri, Çinli şirketlerin hızla benimsemesiyle Pekin tarafından da desteklenmeye başlandı. Ocak ayında Liang, Çin Başbakanı Li Qiang ile yapay zeka sektörünü temsilen bir toplantıya katıldı.
Öte yandan, DeepSeek’in yükselişi Batılı hükümetleri endişelendiriyor. Güney Kore ve İtalya, gizlilik endişeleri nedeniyle DeepSeek uygulamalarını yasakladı. ABD’de bazı yetkililer, Çin’in yapay zeka alanında kazandığı avantajın ABD teknolojileri üzerindeki yaptırımları artırabileceğini düşünüyor.
Çinli yetkililer ise DeepSeek’in medyaya açıklama yapmasını sınırlamış durumda. Bir kaynak, yetkililerin şirketin aşırı medyada yer almasının gereksiz dikkat çekebileceğinden endişelendiğini belirtti.
DeepSeek’in ABD yapay zeka devlerine getirdiği rekabet baskısı, OpenAI ve Google gibi firmaları fiyatlarını düşürmeye ve daha uygun maliyetli seçenekler sunmaya zorladı.
DeepSeek’in başarısı, yapay zeka sektöründeki rekabetin yalnızca büyük bütçelerle değil, yenilikçi yaklaşımlarla da kazanılabileceğini gösteriyor.
Today