
DeepSeek ҳақида нима маълум
DeepSeek — High-Flyer номли хитой инвестиция фонди томонидан ташкил этилган ва унга тегишли стартап. Компания OpenAI’нинг ChatGPT ёки Google’нинг Gemini чат-боти намунасида сунъий интеллект (СИ) технологияларини ишлаб чиқиш билан шуғулланади. DeepSeek ҳам, High-Flyer ҳам хитойлик миллиардер Лян Вэньфэн томонидан бошқарилади.
WIRED нашри DeepSeek’ни Хитой СИ саноатида «ноодатий ўйинчи» деб атайди. Компания High-Flyer таркибида Fire-Flyer номли чуқур ўрганиш бўйича тадқиқот бўлими сифатида ўз фаолиятини бошлаган. High-Flyer йиллар давомида график процессорларни тўплаб, молиявий маълумотларни таҳлил қилиш учун Fire-Flyer суперкомпьютерларини қурган. 2022 йилга келиб, фонд Nvidia A100’нинг 10 мингта юқори самарали график процессорларидан иборат кластер тўплаган, улар СИ тизимларини яратиш ва ишга тушириш учун фойдаланилади. Бунинг ортидан АҚШ Хитойга бу чипларни сотишни тақиқлади.
2023 йилда Лян Вэньфэн — компьютер фанлари бўйича магистр — High-Flyer ресурсларидан DeepSeek’ни яратиш учун фойдаланишга қарор қилди. Ушбу компания илғор СИ моделларини ишлаб чиқиши ва умумий сунъий интеллектга эришишни мақсад қилган. У ўз қарорини тижорат фойдасига эмас, балки илмий қизиқишга асосланиб қабул қилганини таъкидлаган.
Хитойда стартап етакчи университетлардан ёш ва иқтидорли СИ тадқиқотчиларини жалб қилгани билан машҳур. Шунингдек, DeepSeek Хитойнинг Baidu, Alibaba ёки ByteDance каби технология гигантларидан молиялаштирилмайдиган саноқли СИ компанияларидан бири ҳисобланади.
Сўнгги бир неча йил ичида DeepSeek чат-ботлар учун асос бўлган бир неча йирик тил моделларини ишлаб чиқди. 2025 йил 10 январь куни компания DeepSeek-V3 номли очиқ кодли, 671 миллиард параметрга эга бўлган ва 14,8 трлн токенда ўқитилган катта тил моделини ишга туширди.
Ишлаб чиқарувчиларнинг айтишича, ушбу модель учун 5,6 миллион доллар сарфланган. Солиштириш учун, OpenAI GPT-4’ни ўқитишга 78 миллион доллар, Google эса Gemini Ultra учун 191 миллион доллар сарфлаган.
Компаниянинг таъкидлашича, DeepSeek-V3 OpenAI’нинг GPT-4o, Meta’нинг Llama 3 ва Anthropic’нинг Claude 3.5 Sonnet моделларини дастурлаш ва матнни қайта ишлаш вазифалари бўйича ортда қолдирган.
Бир ҳафта аввал компания яна бир сунъий интеллект моделини — DeepSeek R1 чат-ботини чиқарди. Ишлаб чиқувчиларнинг айтишича, R1 «таассурот қолдирадиган» тафаккур қилиш қобилиятига эга ва OpenAI’нинг o1 моделига тенг, аммо анча арзон.
O1 сингари, R1 ҳам «фикрлар занжири» усулидан фойдаланади, яъни модель якуний жавобга келгунга қадар бир нечта ўртача мантиқий босқичлардан ўтади. DeepSeek R1’ни V3 асосида яратган ва модель тўғри жавоб учун мукофотланадиган мустаҳкамлаш орқали ўқитишни қўллаган.
R1 тадқиқотчилар ва мутахассислар томонидан юқори баҳоланди. Айниқса, унинг математика ва кодлаштиришдаги тафаккур қилиш қобилияти мақталган. OpenAI раҳбари Сэм Альтман ҳам R1’ни «таассурот қолдирадиган модель» деб атаган.
DeepSeek иловасининг юклаб олиниши кескин ошди ва у AppStore рейтингларида биринчи ўринни эгаллади.
DeepSeek бошқа СИлардан нимаси билан фарқ қилади
DeepSeek’нинг асосий хусусиятларидан бири — тўлиқ очиқ кодга эга эканлигидир. OpenAI, Anthropic ва Google DeepMind каби АҚШнинг етакчи СИ компаниялари ўз тадқиқотларини деярли тўлиқ махфий сақлаган бир пайтда, DeepSeek барча моделлари учун манба кодини, дастурнинг тўлиқ техник тавсифини очиқ ва бепул қилишга қарор қилди. Шу боис, дунёнинг исталган бурчагидаги инсон DeepSeek моделларини ишлатиши, мослаштириши ва яхшилаши мумкин.
АҚШнинг юқори даражали СИ чипларини экспорт қилишга қўйган чекловлари сабабли, DeepSeek OpenAI ёки Meta билан рақобатлаша олиш учун СИ моделларини ўқитишнинг самаралироқ усулларини ишлаб чиқишига тўғри келган. Компания моделлар архитектурасини оптималлаштирди, чиплар ўртасидаги алоқаларни яхшилади, хотирани тежаш учун маълумот ҳажмини қисқартирди ва Mix-of-Models методини жорий қилди.
DeepSeek Multi-head Latent Attention (MLA) ва Mixture-of-Experts технологияларини муваффақиятли ишлаб чиқди, бу эса ҳисоблаш ресурсларига бўлган эҳтиёжни камайтириб, моделларни иқтисодий жиҳатдан самаралироқ қилди. Шу боис, сўнгги DeepSeek СИ модели Meta’нинг Llama 3.1 моделини ўқитиш учун керак бўлган ҳисоблаш қудратининг атиги ўндан бир қисмини талаб қилди.
DeepSeek’нинг камчиликларидан бири — муайян мавзуларда жавобларни цензура қилиши. The New-York Times журналисти DeepSeek’ни синаб кўрганида, модел Тяньаньмэнь воқеалари ҳақида жавоб беришдан бош тортган. У Коммунистик партиянинг камчиликлари ҳақида сўралганда, «ҳозирда катта трафик бор» дея жавоб қайтарган.
Биржа бозорларининг реакцияси
DeepSeek’нинг сўнгги моделлари ишга туширилиши инвесторлар орасида таҳлика уйғотди. 27 январь куни Nvidia акциялари бир кун ичида 17% га пасайди ва компаниянинг бозор капитали 600 миллиард долларга қисқарди. Шунингдек, GE Vernova ва Vistra каби компаниялар ҳам ўз қийматини йўқотди.
DeepSeek’нинг муваффақияти СИ бозорининг мувозанатини ўзгартириши мумкин, ва бу АҚШдан ташқаридаги мамлакатларни ҳам илҳомлантирди.