DeepSeek haqida nimalar ma’lum?
DeepSeek — Xitoyning High-Fler investitsiya fondi tomonidan tashkil etilgan va unga tegishli startap. Kompaniya OpenAI`ning ChatGPT yoki Google`ning Gemini chat-boti kabi sun’iy intellekt (SI) texnologiyalarini ishlab chiqish bilan shug‘ullanadi. DeepSeek ham, High-Gler ham xitoylik milliarder Lyan Venfen tomonidan boshqariladi.
WIRED nashri DeepSeek`ni Xitoy sun’iy intellekt sanoatining “g‘ayriodatiy o‘yinchisi” deb atadi. Kompaniya o‘z faoliyatini Fire-Fler nomi bilan, High-Fler qoshidagi chuqur o‘rganish bo‘yicha tadqiqot bo‘limi sifatida boshlagan. Yillar davomida High-Fler grafik protsessorlarni to‘plab, moliyaviy ma’lumotlarni tahlil qilish uchun Fire-Fler superkompyuterlarini yaratgan. 2022-yilga kelib fond sun’iy intellekt tizimlarini yaratish va ishga tushirish uchun ishlatiladigan 10 ming ta yuqori unumli Nvidia A100 grafik protsessorlaridan iborat klasterni to‘plagan. Ko‘p o‘tmay, AQSh Xitoyga ushbu chiplarni sotishni taqiqlagan.
2023-yilda kompyuter fanlari bo‘yicha magistr darajasiga ega bo‘lgan Lyan Venfen umumiy sun’iy intellektga erishish maqsadida ilg‘or sun’iy intellekt modellarini ishlab chiqadigan DeepSeek`ni yaratish uchun High-Fler resurslaridan foydalanishga qaror qilgan. U o‘z qarorini tijoriy foyda olish istagi bilan emas, balki ilmiy qiziqish bilan izohlagan.
Xitoyda startap yetakchi universitetlardan yosh va iqtidorli sun’iy intellekt tadqiqotchilarini jalb qilishi bilan tanilgan. DeepSeek, shuningdek, Xitoyning Baidu, Alibaba yoki ByteDance kabi texnologik gigantlardan moliyalashtirish olmagan kam sonli sun’iy intellekt kompaniyalaridan biridir.
So‘nggi bir necha yil ichida DeepSeek sun’iy intellekt chat-botlari asosida yotuvchi bir nechta yirik til modellarini ishlab chiqdi. 10-yanvar kuni kompaniya bepul DeepSeek-V3 chat-botini taqdim etdi — bu ochiq kodli katta til modeli bo‘lib, u 671 milliard parametrni o‘z ichiga oladi va 14,8 trillion tokenga o‘rgatilgan.
Ishlab chiquvchilarning ta’kidlashicha, modelni yaratish uchun xarajatlar taxminan 5,6 million dollarni tashkil etgan. Taqqoslash uchun: OpenAI GPT-4`ni o‘qitish uchun 78 million dollar sarflagan, Gemini Ultra esa Google`ga 191 million dollarga tushgan.
Kompaniya, shuningdek, DeepSeek-V3 dasturlash va matnni qayta ishlash masalalarida OpenAI`ning GPT-4o sidan, Meta`ning Llama 3`idan va Anthropic`ning Claude 3.5 Sonnet`idan o‘zib ketganini ta’kidlaydi.
Bir hafta oldin kompaniya sun’iy intellektning yana bir modelini — DeepSeek R1 chat-botini ishlab chiqardi. Ishlab chiquvchilarning so‘zlariga ko‘ra, R1 “ta’sirchan” fikrlash qobiliyatini namoyish etadi va OpenAI`ning o1 modeli imkoniyatlaridan qolishmaydi, lekin bir necha barobar arzonroq turadi.
O1 singari R1 ham “fikrlar zanjiri” usulidan foydalanadi, bunda model yakuniy javobga kelishdan oldin bir nechta oraliq mantiqiy bosqichlardan o‘tadi. DeepSeek V3 asosida R1`ni yaratdi, bunda modelni to‘g‘ri javob va uning “tafakkurini” ko‘rsatadigan tarzda muammolarni hal qilish uchun mukofotlaydigan qo‘llab-quvvatlovchi mashg‘ulotlarni qo‘lladi.
R1 ayniqsa matematika va kodlashdagi murakkab masalalarni yechish qobiliyati uchun tadqiqotchilar va ekspertlar tomonidan yuqori baholandi. Hatto OpenAI rahbari Sem Altman ham R1`ni maqtadi va uning qobiliyati hamda yaratish narxini hisobga olgan holda uni “hayratlanarli model” deb atadi.
DeepSeek ilovasining yuklab olishlar soni R1 ishga tushirilganidan beri keskin oshdi va u hozirda AppStore do‘konida reytinglarda yetakchilik qilmoqda.
DeepSeek boshqa sun’iy intellektlardan nimasi bilan farq qiladi?
DeepSeek`ning asosiy xususiyatlaridan biri bu to‘liq ochiq koddir. Amerikaning sun’iy intellekt bilan shug‘ullanadigan (OpenAI, Anthropic va Google DeepMind) yetakchi kompaniyalaridan farqli o‘laroq, DeepSeek o‘zining barcha modellari uchun manba kodini va dasturning batafsil texnik izohini ko‘rish, yuklab olish va o‘zgartirish uchun bepul taqdim etdi. Shunday qilib, dunyoning istalgan nuqtasidan kelgan har qanday odam dasturdan foydalanishi, moslashtirishi va hatto takomillashtirishi mumkin.
AQShning ilg‘or sun’iy intellekt chiplarini yetkazib berish bo‘yicha eksport cheklovlari tufayli DeepSeek OpenAI yoki Meta bilan raqobatlashish uchun sun’iy intellekt modellarini o‘qitishning yanada samarali usullarini ishlab chiqishga majbur bo‘ldi. Kompaniya o‘z modellarining arxitekturasini optimallashtirdi, chiplar o‘rtasidagi aloqani takomillashtirdi, xotirani tejash uchun ma’lumotlar hajmini kamaytirdi va Mix-of-Models usulini qo‘lladi.
DeepSeek, shuningdek, Multi-head Latent Attention (MLA) va Mixture-of-Experts kabi hisoblash resurslariga bo‘lgan ehtiyojni kamaytiradigan va modellarni yanada tejamkor qiladigan texnologiyalarni ishlab chiqishda muvaffaqiyatga erishdi. Shu tufayli Epoch AI tadqiqot instituti ma’lumotlariga ko‘ra, DeepSeek`ning eng so‘nggi sun’iy intellekt modeli shu qadar samarali bo‘ldiki, o‘rganish uchun Meta`ning Llama 3.1`i uchun zarur bo‘lgan hisoblash quvvatining atigi o‘ndan bir qismi talab etildi.
DeepSeek chat-botining kamchiliklari orasida Xitoy hukumati bilan bog‘liq ba’zi mavzularga javoblarni senzura qilish ham bor. DeepSeek modelini sinovdan o‘tkazgan New York Times jurnalisti chat-botning Xitoy hukumati tomonidan shafqatsizlarcha bostirilgan Tyananmen maydonidagi namoyishlar haqidagi savollarga javob berishdan bosh tortganiga e’tibor qaratdi va buni bunday ma’lumotlar uning mavjud imkoniyatlaridan “chiqib ketayotgani” bilan izohladi. Xitoy Kommunistik partiyasining kamchiliklari haqidagi savollarga chat-bot “hozirda katta trafikni boshdan kechirayotganini” yozdi va jurnalistning so‘zlariga ko‘ra, bir necha soniya o‘tgach, boshqa mavzudagi savolga xotirjam javob bergan bo‘lsada, avvalgisiga javob bera olmagan.
ChatGPT, masalan, Tyananmen maydonidagi voqealar haqidagi savolga ommaviy namoyishlar tarixi, taxmin qilingan qurbonlar soni va voqea oqibatlari haqida batafsil javob berdi, deya aniqlik kiritdi Associated Press.
Aksiyalar bozori bunga qanday munosabatda bo‘ldi?
DeepSeek`ning so‘nggi ishga tushirilishi investorlar orasida vahima uyg‘otdi. An’anaga ko‘ra, sun’iy intellekt bilan shug‘ullanadigan kompaniyalarga tizimlarni o‘qitish uchun Nvidia ishlab chiqaradigan qimmatbaho ilg‘or kompyuter chiplari kerak deb hisoblangan. Bu Alphabet va Meta Platforms kabi Amerikaning eng yirik texnologik kompaniyalarining katta xarajatlarini oqladi, deb ta’kidlaydi Wall Street Journal.
Ammo DeepSeek`da ilg‘or chiplar yo‘q edi va shunga qaramay, uning modellari sun’iy intellekt imkoniyatlarini baholovchi ma’lum ko‘rsatkichlar bo‘yicha AQShning yetakchi raqobatchilariga mos keladi. Bundan tashqari, DeepSeek ochiq manbali R1`ni chiqardi, bu boshqa kompaniyalar DeepSeek yondashuvidan foydalanishlari va sun’iy intellektning boshqa arzon muqobillarini yaratishlari mumkinligini anglatadi, deb tushuntiradi WSJ.
Oxirgi DeepSeek modellari paydo bo‘lishi fonida Nvidia aksiyalari 27-yanvar savdo kuni davomida 17 foizga tushdi. Kompaniyaning bozor kapitallashuvi pasayish tufayli 600 milliard dollardan ko‘proqga qisqardi — bu kompaniya uchun fond bozori tarixidagi eng katta yo‘qotishdir.
Nvidia sun’iy intellektning eng yirik benefitsiarlaridan biriga aylandi, chunki uning chiplari deyarli faqat mavjud sun’iy intellektning eng kuchli modellarini o‘qitish va ko‘p hollarda ishlashni ta’minladi. Nvidia va kompaniya investorlari uning ilg‘or chiplarining yangi avlodlari eng kuchli sun’iy intellekt modellarini ishlab chiqishda qo‘llanilishiga garov o‘ynashdi. Biroq DeepSeek muvaffaqiyati Nvidia`ning sun’iy intellekt chiplarini ishlab chiqishdagi yetakchiligi sun’iy intellektning yangi modellarini ishlab chiqish uchun unchalik katta va muhim bo‘lmasligi mumkinligini ko‘rsatadi, deb yozadi WSJ.
Energetika bilan bog‘liq boshqa kompaniyalarning aksiyalari ham dushanba kuni sarmoyadorlarning yangi texnologiya ishlashi uchun kamroq energiya talab qilishi va bu o‘z navbatida texnologiya sektori tomonidan talabning pasayishiga olib kelishi haqidagi xavotirlari tufayli tushib ketdi. Shunday qilib, shamol va gaz turbinalarini ishlab chiqaruvchi GE Vernova aksiyalari 21 foizga, Vistra elektr generatorining aksiyalari esa 28 foizga tushdi.
DeepSeek`ning sun’iy intellekt modelini yaratishdagi muvaffaqiyati jahon bozoridagi o‘yinchilar o‘rtasidagi muvozanatni o‘zgartirishi mumkin va bu allaqachon AQShdan tashqaridagi ba’zi mamlakatlarni ilhomlantirdi, deb yozadi WSJ. Fransiya hukumati vakillarining ta’kidlashicha, DeepSeek misoli shuni ko‘rsatadiki, samarali usullarga ega “moslashuvchan” kompaniyalar hali ham kamroq mablag‘ yoki chiplarga kirish imkoniyati cheklangan holda sun’iy intellekt poygasida raqobatlashishlari mumkin. Bu shuni anglatadiki, nafaqat Xitoyda, balki Yevropa Ittifoqi va dunyoning boshqa mamlakatlarida ham Amerika texnologik gigantlariga yetib olish imkoniyati bor.