Çinli yapay zeka laboratuvarı DeepSeek’in kendi adını taşıyan büyük dil modeli (LLM), ABD'li OpenAI firmasının ChatGPT'sinin en büyük rakiplerinden biri haline gelirken, Pazartesi günü küresel teknoloji hisselerini de sarstı.
Önceki hafta yayınlanan yayınlanan DeepSeek-R1 adlı büyük dil modelinin (LLM), daha az çip ve maliyetle ChatGPT'nin son modellerinden biri olan o1 seviyesinde performans göstermesi, yapay zeka çipleriyle ünlü Nvidia'nın deÄŸer kaybetmesine neden oldu.
ChatGPT'nin eÄŸitim verilerini iÅŸlemek için 10.000 Nvidia grafik iÅŸlem birimine (GPU) ihtiyaç duyduÄŸu düÅŸünülüyor. DeepSeek mühendisleri sadece 2.000 GPU ile benzer sonuçlara ulaÅŸtıklarını söylüyor.
Nvidia, çiplerinin yapay zeka teknolojisinin belkemiÄŸi olarak görülmesiyle yapay zeka hisse senetlerinde bir patlamaya öncülük etmiÅŸti. Kaliforniya merkezli çip firmasının hisseleri pazartesi piyasa öncesi iÅŸlemlerde yüzde 10 düÅŸtü.
Nasdaq 100 vadeli iÅŸlemleri yüzde 3,4, S&P 500 ise New York'ta sabah 5.00 itibarıyla yüzde 2 düÅŸüÅŸ gördü. Avrupa'da teknoloji hisselerinde de benzer bir tablo görüldü. Hollandalı çip ekipmanı üreticisi ASML Holding NV'nin hisseleri yüzde 11 deÄŸer kaybetti.
Bloomberg'e göre, Nasdaq 100 ve Avrupa'nın Stoxx 600 teknoloji alt endeksi, kayıplar devam ederse toplamda yaklaşık 1 trilyon dolarlık bir piyasa deÄŸeri kaybına uÄŸramış olacak.
App Store'da bir numaraya çıktı
Bu arada DeepSeek'in mobil uygulaması da pazartesi günü ChatGPT'yi geride bırakarak ABD'de Apple App Store'daki en yüksek puanlı ücretsiz uygulama oldu.Öte yandan Reuters'a göre söz konusu uygulama, giriÅŸimin bir önceki modeli olan DeepSeek-V3'le çalışıyor.
Veri araÅŸtırma ÅŸirketi Sensor Tower, 10 Ocak'ta piyasaya sürülen modelin ABD kullanıcıları arasında popülerlik kazandığını belirtiyor.
Son yayınlanan model olan DeepSeek R1 ise araÅŸtırmacılar tarafından özellikle matematik ve kodlamada karmaşık muhakeme görevlerini yerine getirme becerisiyle övülüyor. Model, ChatGPT o1 tarafından kullanılana benzer bir "düÅŸünce zinciri" yaklaşımı kullanıyor ve bu da sorguları adım adım iÅŸleyerek sorunları çözmesine olanak tanıyor.
Açık kaynaklı bir model
Üstelik DeepSeek-R1 büyük ölçüde açık kaynaklı olarak yayınlandı. Yani isteyen herkes aracın kodlarına eriÅŸebiliyor ve bu kodları kullanarak LLM'i kiÅŸiselleÅŸtirebiliyor. EÄŸitim verileri ise patentli.
Öte yandan OpenAI, o1 modelini kapalı olarak piyasaya sürmüÅŸtü ve halihazırda sadece kullanıcılara bile aylık 20 ila 200 dolarlık paketlerle satıyor.
MIT Technology Review'a konuÅŸan DeepSeek çalışanı ve Northwestern Üniversitesi'nde bilgisayar bilimi alanında doktora öÄŸrencisi Zihan Wang, Çin'in yaptırımlara karşı yenilikçi yollara baÅŸvurmak zorunda kaldığını söylüyor.
Buna göre DeepSeek, R1 modelini oluÅŸturmak için eÄŸitim sürecini yeniden düzenlemek zorunda kaldı. Çünkü çip firması Nvidia'nın Çin pazarı için satmaya izinli olduÄŸu çiplerin performansı, ÅŸirketin en iyi ürünlerinin hızının yarısı kadar ediyor. Bu yüzden Çin, Nvidia'dan satın aldığı grafik iÅŸlem birimleri (GPU) üzerindeki yükü azaltmak için eÄŸitim sürecini düzenledi.
Kaynak: Euro News




