12 Şubat 2025

Çeviri: 

Yapay Zekâ DeepSeek ile yeni bir boyut kazanıyor

Michael Roberts

Çoğu okuyucu bu haberi muhtemelen duymuştur. Çinli bir YZ [yapay zekâ] şirketi olan DeepSeek, OpenAI, Anthropic ve Meta gibi şirketlerin en iyi modelleriyle karşılaştırılabilir yeteneklere sahip, ancak çok daha düşük bir maliyetle ve en gelişmiş GPU çiplerini kullanmadan eğitilen R1 adlı bir YZ modeli yayımladı. DeepSeek, modelin detayları konusunda kamuoyuna yeterli düzeyde açıklama yaptı; böylece dileyen herkesin bu modeli kendi bilgisayarında ücretsiz olarak çalıştırması mümkün.

DeepSeek, ABD’nin Muhteşem Yedili adı verilen yedi büyük teknoloji devini suyun altından vuran bir torpido gibi oldu. DeepSeek, Nvidia’nın en yeni ve en gelişmiş çiplerini ve yazılımlarını kullanmadı; Amerikalı rakiplerinin aksine YZ modelini eğitmek için devasa harcamalar yapmamasına rağmen, kullanıcılara aynı derecede faydalı uygulamalar sunuyor.

DeepSeek, R1’i, ABD yaptırımlarının Çin’e ihracatına izin verdiği Nvidia’nın daha eski ve daha yavaş çipleriyle geliştirdi. ABD hükümeti ve teknoloji devleri, daha iyi çipler ve YZ modelleri üretmenin yüksek maliyetleri nedeniyle YZ geliştirme alanında tekele sahip olduklarını düşünüyordu. Ancak DeepSeek’in R1 modeli, daha sınırlı bütçeye sahip şirketlerin de yakında rekabetçi YZ modelleri geliştirebileceğini gösteriyor. R1, son derece düşük bir bütçeyle ve çok daha az bilgi işlem gücüyle çalıştırılabiliyor. Üstelik, kullanıcıların modeli sorgulayıp yanıt aldığı süreç olan “çıkarım” [inference] konusunda rakipleri kadar başarılı. Ayrıca, her türlü şirketin sunucusunda çalıştırılabiliyor; böylece OpenAI gibi şirketlerden yüksek fiyatlarla hizmet kiralamaya gerek kalmıyor.

En önemlisi, DeepSeek’in R1 modeli "açık kaynak" bir model, yani kodlama ve eğitim yöntemleri herkes tarafından kopyalanıp geliştirilebiliyor. Bu, OpenAI ya da Google’ın Gemini’sinin kârlarını maksimize etmek için "kara kutu" içinde sakladıkları sırlara büyük bir darbe indiriyor. Bu durum, markalı ve jenerik ilaçlar arasındaki farkla kıyaslanabilir.

ABD’li YZ şirketleri ve yatırımcıları için en büyük sorun, yeterince başarılı sonuçlar elde etmek için pahalı çiplerle dolu devasa veri merkezleri inşa etmenin aslında gerekmeyebileceğinin ortaya çıkmış olmasıdır. Bugüne kadar ABD’li şirketler devasa harcama planlarını büyütüyor ve bunun için milyarlarca dolar fon toplamaya çalışıyordu. Nitekim, tam da DeepSeek’in R1 modelinin gündeme oturduğu pazartesi günü, Meta 65 milyar dolarlık yeni bir yatırım yapacağını duyurdu. Üstelik yalnızca birkaç gün önce Başkan Trump, Stargate adlı proje kapsamında teknoloji devlerine 500 milyar dolarlık devlet sübvansiyonu sağlayacağını açıklamıştı. İşin ironik yanı, Meta CEO’su Mark Zuckerberg’in yatırım gerekçesini şu sözlerle açıklamasıydı: "Küresel yapay zekâ standardını Çin değil, ABD belirlemeli." Aman Tanrım.

Grafik Başlığı: Şekil 2: Muhteşem Yedili Şirketlerin Sermaye Harcamaları ve Hisse Senedi Fiyat Endeksi
Şimdi yatırımcılar, bu harcamaların gereksiz olabileceğinden ve daha da önemlisi, DeepSeek’in yapay zekâ uygulamalarını onda bir maliyetle sunabilmesi hâlinde Amerikan şirketlerinin kârlılığının ciddi şekilde zarar görebileceğinden endişe ediyor. YZ’ye odaklanan en büyük beş teknoloji hissesinin -çip üreticisi Nvidia ile hiper ölçekli bulut sağlayıcılar olarak adlandırılan Alphabet, Amazon, Microsoft ve Meta Platforms’un- piyasa değeri bir gün içinde toplamda neredeyse 750 milyar dolar azaldı. Üstelik DeepSeek, Muhteşem Yedili’nin “devasa ölçek büyütme” hamlesinden faydalanmayı bekleyen veri merkezi şirketleri ile su ve elektrik işletmelerinin kârlarını da tehdit ediyor. ABD borsa rallisi büyük ölçüde bu yedi dev teknoloji şirketi üzerinde yoğunlaşmış durumda.

Grafik Başlığı: Grafik 28: ABD ve ABD Dışı Küresel Hisse Senetleri (görece fiyat performansı, USD)
Alt Başlık: ABD hisselerinde Dünya'nın Geri Kalanına karşı 75 yılın zirvesi

Peki, DeepSeek ABD teknoloji hisselerindeki devasa borsa balonunu patlattı mı? Milyarder yatırımcı Ray Dalio öyle düşünüyor. Financial Times'a verdiği demeçte, “Fiyatlar zaten yüksek seviyelere ulaşmış durumda ve aynı anda faiz oranı riski de söz konusu. Bu ikisinin birleşimi balonu patlatabilir… Şu anda piyasa döngüsünde bulunduğumuz nokta, 1998-1999 dönemine çok benziyor” dedi. "Başka bir deyişle, dünyayı kökten değiştirecek ve kesinlikle başarılı olacak büyük bir yeni teknoloji var ortada. Ancak bazıları, bunun yatırımların da başarılı olacağı anlamına geldiğini sanıyor.”

Grafik Başlığı: Bu bir Dot-com balonu analoğu mu? 2000'de Cisco ve 2025'te Nvidia karşılaştırması

Ne var ki durum, en azından şimdilik, böyle olmayabilir. YZ çipi üreticisi Nvidia’nın hisse fiyatı bu hafta düşmüş olsa da “özel” kodlama dili Cuda hâlâ ABD’de sektör standardı olmaya devam ediyor. Hisseleri yaklaşık %17 değer kaybetmiş olsa da bu sadece fiyatının Eylül ayındaki (çok ama çok yüksek) seviyesine geri dönmesi anlamına geliyor.

Grafik Başlığı: Nvidia Hisse Senedi Fiyatı

Trump’a yaranmaya çalışan teknoloji oligarklarını asıl öfkelendirmesi gereken şey, ABD’nin Çinli şirketlere uyguladığı yaptırımların ve çip ihracatına getirdiği yasakların, Çin’in ABD ile yürüttüğü teknoloji ve çip savaşında ilerleme kaydetmesini engelleyememiş olmasıdır. Çin, Biden yönetiminin en güçlü çiplere ve bunları üretmek için gereken gelişmiş araçlara erişimini kesmek amacıyla getirdiği ihracat kontrollerine rağmen YZ alanında teknolojik sıçramalar yapmayı sürdürüyor.

Çin’in teknoloji devi Huawei, “çıkarım” çipleri konusunda Nvidia’nın Çin’deki en büyük rakibi olarak öne çıktı. Şirket, DeepSeek de dâhil olmak üzere YZ şirketleriyle iş birliği yaparak, Nvidia GPU’larında eğitilen modelleri kendi Ascend çiplerinde çıkarım yapabilecek şekilde uyarlıyor. Pekin’deki bir yarı iletken yatırımcısı, “Huawei giderek güçleniyor. Hükümet, büyük teknoloji şirketlerine kendi çiplerini satın alıp çıkarım için kullanmaları gerektiğini söylediğinden, ellerine önemli bir fırsat geçti” diyor.

Bu, Çin’in teknolojiye ve teknoloji becerilerine yönelik devlet öncülüğündeki planlı yatırımlarının, büyük sermaye sahipleri tarafından yönetilen devasa özel teknoloji devlerine bel bağlamaktan çok daha iyi sonuç verdiğinin bir başka göstergesi. Ray Dalio’nun dediği gibi: “Sistemimizde genel olarak, hükümetin zorunlu kıldığı ve yönlendirdiği faaliyetlerin yer aldığı, daha çok bir sanayi kompleksi modeline doğru ilerliyoruz, çünkü bu konu son derece önemli… Tek başına kapitalizm -yalnızca kâr dürtüsü- bu savaşı kazanamaz.”

Bununla birlikte, YZ devleri henüz Titanic gibi batmış değil. [*] Veri merkezlerine ve daha gelişmiş çiplere milyarlarca dolar akıtarak ölçek büyütmeye devam ediyorlar. Bu da bilgisayar gücünü katlanarak tüketiyor.

Grafik Başlığı: YZ modelleri giderek daha fazla işlem gücü tüketiyor
Alt Başlık: Eğitim işlem gücü, logaritmik ölçek (exaFLOP cinsinden)
Ve elbette, ana akım iktisatçıların kibarca “dışsallıklar” [bir faaliyetin çevreye veya topluma dolaylı etkileri (k.ü.)] olarak adlandırdığı unsurlar dikkate alınmıyor. Goldman Sachs’ın bir raporuna göre, bir ChatGPT sorgusu, bir Google aramasından yaklaşık 10 kat daha fazla elektrik tüketiyor. YZ sohbet botlarının enerji kullanımına dair kabaca bir hesap yapan araştırmacı Jesse Dodge, “ChatGPT’ye yapılan bir sorgu, yaklaşık 20 dakika boyunca bir ampulü yakmaya yetecek kadar elektrik kullanıyor” diyor. “Dolayısıyla, milyonlarca insanın her gün bunu kullandığını düşünürseniz, ortaya gerçekten devasa bir elektrik tüketimi çıkıyor.” Daha fazla elektrik tüketimi, daha fazla enerji üretimi ve özellikle fosil yakıt kaynaklı sera gazı emisyonlarının artması anlamına geliyor.

Google, 2030 yılına kadar net sıfır emisyona ulaşmayı hedefliyor. Şirket, 2007’den bu yana emisyonlarını dengelemek için satın aldığı karbon kredileri sayesinde operasyonlarının karbon nötr olduğunu öne sürüyordu. Ancak 2023 itibarıyla Google, sürdürülebilirlik raporunda artık “operasyonel karbon nötrlüğünü sürdürmediğini” açıkladı. Yine de şirket, 2030’daki net sıfır hedefi doğrultusunda çalışmalarına devam ettiğini belirtiyor. Dodge, “Google’ın asıl motivasyonu, mümkün olan en iyi YZ sistemlerini inşa etmek” diyor. “Ve bunun için, YZ sistemlerini giderek daha büyük veri merkezlerinde -hatta süper bilgisayarlarda- eğitmek gibi, muazzam miktarda elektrik tüketimine ve dolayısıyla yüksek CO2 emisyonlarına yol açan faaliyetlere büyük kaynaklar ayırmaya hazırlar.”

Bir de su meselesi var. ABD, kuraklık ve orman yangınlarıyla mücadele ederken, YZ şirketleri çipleri korumak için mega veri merkezlerini soğutmak amacıyla büyük miktarda yeraltı suyu çekiyor. Dahası, Silikon Vadisi şirketleri, su tedarik altyapısının kontrolünü giderek daha fazla ele geçirerek kendi ihtiyaçlarına öncelik tanıyor. Araştırmalara göre, Microsoft’un veri tesislerinde ChatGPT-3’ü eğiten makineleri soğutmak için yaklaşık 700 bin litre su kullanılmış olabilir.

YZ modellerinin eğitimi, bir Avrupa şehrinin tükettiği enerjinin 6 bin katı kadar enerji harcıyor. Ayrıca, lityum ve kobalt gibi mineraller en çok otomotiv sektöründeki bataryalarla ilişkilendiriliyor olsa da bunlar veri merkezlerinde kullanılan bataryalar için de hayati öneme sahip. Bu minerallerin çıkarılması genellikle yüksek su tüketimi gerektirir ve bu da kirliliğe yol açarak su güvenliğini tehdit edebilir.

Open AI’nin bir zamanlar kâr amacı gütmeyen kahramanı olan, ancak artık Microsoft’un kârını maksimize etmeye çalışan Sam Altman, evet, ne yazık ki kısa vadede bazı "ödünleşmeler" gerekli olacak diyor. Ancak ona göre, sözde YGZ’ye ulaşmak için bu fedakârlıklardan kaçınılamaz. Altman, YGZ’nin ileride tüm bu sorunları çözeceğini öne sürerek, ortaya çıkan “dışsallıkların” göz ardı edilmesini makul görüyor.

YGZ mi? Peki, bu ne anlama geliyor? Yapay Genel Zekâ (YGZ), YZ geliştiricileri için kutsal kâse niteliğinde bir hedef. Bu, YZ modellerinin insan zekâsını katbekat aşan bir "süper zekâ" seviyesine ulaşması anlamına gelir. Altman, bu gerçekleştiğinde YZ’nin yalnızca tek bir çalışanın işini değil, tüm çalışanların işini yapabileceğini iddia ediyor: "YZ bir organizasyonun tüm işlerini yapabilir." Bu, YZ makinelerinin her alanda işletme, geliştirme ve pazarlama süreçlerini tamamen devralarak, şirketlerdeki (hatta YZ şirketlerindeki?) çalışanları gereksiz hale getirip kârlılığı en üst düzeye çıkaracağı anlamına geliyor. Bu, sermayenin kıyamet rüyasıdır (ancak emek için bir kâbustur: iş yok, gelir yok.)

Bu nedenle, Altman ve diğer YZ devleri, DeepSeek mevcut modellerini geride bıraktı diye veri merkezlerini genişletmekten veya daha gelişmiş çipler geliştirmekten vazgeçmeyecek. Araştırma şirketi Rosenblatt, teknoloji devlerinin vereceği tepkiyi şöyle öngörüyor: “Genel olarak, harcamaları kısmaktan ziyade, yapay genel zekâya daha hızlı ilerleyerek becerilerini geliştirmeye odaklanmalarını bekliyoruz.” Süper zeki YZ hedefine giden yolda hiçbir şey onlara engel olmamalı.

Bazıları, YGZ’ye ulaşma yarışını insanlık için bir tehdit olarak görüyor. Berkeley'deki California Üniversitesi'nde bilgisayar bilimleri profesörü olan Stuart Russell şöyle diyor: “Bu yarışa katılan CEO'lar bile, kazanan kim olursa olsun, sürecin insanlığın yok olmasına neden olma ihtimalinin yüksek olduğunu söylüyor. Çünkü kendimizden daha zeki sistemleri nasıl kontrol edeceğimizi bilmiyoruz." Ve ekliyor: "Başka bir deyişle, YGZ yarışı uçurumun kenarına doğru koşulan bir yarış."

Belki öyledir; ancak insan zekâsının yerini makine zekâsının alabileceğinden hâlâ şüpheliyim, çünkü ikisi temelde farklıdır. Makineler, potansiyel ve niteliksel değişimleri kavrayamaz. Oysa yeni bilgi, mevcut bilginin genişletilmesinden (makinelerden) değil, böylesi dönüşümlerden (insandan) doğar. Yalnızca insan zekâsı toplumsaldır ve değişim potansiyelini –özellikle de insanlık ve doğa için daha iyi bir yaşama yol açan toplumsal değişimi– görebilir.

DeepSeek’in ortaya çıkışı, YZ’nin insanlığa ve toplumsal ihtiyaçlara hizmet edebilecek bir düzeye kadar geliştirilebileceğini gösterdi. Ücretsiz, açık kaynaklı ve en küçük ölçekli kullanıcılar ile yazılım geliştiricileri için erişilebilir durumda. Kâr ederek ve kâr elde etmek amacıyla geliştirilmedi. Bir yorumcunun dediği gibi: “Sanat yapabilmem ve yazı yazabilmem için YZ’nin çamaşırlarımı ve bulaşıklarımı yıkamasını istiyorum; çamaşırlarımı ve bulaşıklarımı yıkayabilmem için YZ’nin sanatımı yapmasını ve yazımı yazmasını değil.” Yöneticiler, YZ’yi "birçok insanın kullanılmaması gerektiğini düşündüğü yaratıcı işler pahasına, yönetim sorunlarını hafifletmek" amacıyla devreye sokuyor… “Eğer yapay zekâ gerçekten işe yarayacaksa, bu aşağıdan yukarıya doğru bir süreç olmalı; aksi takdirde, işyerindeki insanların büyük çoğunluğu için işe yaramaz hale gelecektir.”

Kâr sağlamak, işleri ve insanların geçim kaynaklarını ortadan kaldırmak için YZ geliştirmek yerine, ortak mülkiyet ve planlama altında geliştirilen YZ, insan emek-saati herkes için azaltabilir ve insanları yalnızca insan zekâsının başarabileceği yaratıcı işlere odaklanmaları için angaryadan kurtarabilir. Unutmayın, "kutsal kâse" Viktorya dönemi edebiyatının bir kurgusuydu ve daha sonra Dan Brown'un da işlediği bir tema haline geldi.

Kaynak: "AI going DeepSeek", Michael Roberts Blog – blogging from a Marxist economist

[*] Makalenin İngilizce orijinalinde bu cümle şöyle: “Nevertheless, the AI titans are not yet the titanic.” Michael Roberts burada bir kelime oyunu yapıyor. "Titan" kelimesi, hem "dev" anlamına gelir hem de mitolojideki güçlü tanrıları ifade eder. "Titanic" ise hem "devasa" anlamına gelir hem de 1912'de batan ünlü geminin adıdır. Yazar, YZ devlerinin henüz "batmadığını" (yani kesin olarak başarısızlığa uğramadığını) ima ederken bu kelime oyununu kullanıyor. (k.ü.)

Hiç yorum yok:

Yorum Gönder