Завантаження публікації
ОГОЛОШЕННЯ

DeepSeek: як маловідома китайська компанія змінює майбутнє штучного інтелекту

Маловідома китайська стартап-компанія змусила світові ринки тремтіти, а гігантів технологічної галузі шукати відповіді. Що варто знати про DeepSeek?


Тетяна Федорів
Тетяна Федорів
Газета Дейком | 28.01.2025, 03:19 GMT+3; 20:19 GMT-4

DeepSeek: компанія, яка перевернула уявлення про АІ

У понеділок технологічний світ опинився у стані шоку через новини від маловідомої компанії DeepSeek. Цей китайський стартап, фінансований інвестиційною компанією High-Flyer, представив нову модель штучного інтелекту, яка не тільки стала конкурентом провідних західних розробок, але й перевершила їх за показниками ефективності.

DeepSeek показала, що створення потужних моделей штучного інтелекту не обов’язково потребує мільярдних інвестицій та величезної кількості спеціалізованих чипів. Ця новина викликала хвилю паніки серед інвесторів, падіння акцій технологічних гігантів і відчутне занепокоєння щодо майбутнього США у сфері штучного інтелекту.

Що таке DeepSeek і як вони досягли успіху

DeepSeek була заснована в Китаї й належить інвестиційній компанії High-Flyer. Стартап спеціалізується на розробці передових технологій штучного інтелекту, таких як великі мовні моделі (LLM), які лежать в основі чат-ботів на кшталт ChatGPT або Google Gemini. Головним ресурсом DeepSeek є молода й талановита команда дослідників, яких компанія залучає з провідних університетів, пропонуючи конкурентні зарплати та можливості працювати на передовій науки.

До кінця 2021 року DeepSeek придбала тисячі графічних процесорів Nvidia — необхідного апаратного забезпечення для тренування великих моделей АІ. Завдяки інноваційним підходам і оптимізації процесів, компанія створила свою першу чат-бот платформу DeepSeek-V3, яку представила 10 січня. Саме ця модель стала каталізатором змін у сприйнятті глобального ринку штучного інтелекту.

Чому ринки відреагували саме зараз?

Коли DeepSeek оголосила про запуск DeepSeek-V3, її результати за стандартними тестами продуктивності зрівнялися з провідними моделями від OpenAI та Google. Але справжнім проривом стало не це. Компанія оприлюднила наукову статтю, у якій пояснила, як змогла побудувати свій продукт, використовуючи лише 2 тисячі графічних процесорів Nvidia — у 8 разів менше, ніж зазвичай потрібно для таких розробок.

Головна сенсація полягала у витратах. Тренування DeepSeek-V3 обійшлося лише в 6 мільйонів доларів, тоді як аналогічні розробки компаній Meta чи Google вимагають щонайменше 60-70 мільйонів. Цей прорив став можливим завдяки унікальним підходам до аналізу даних, які дозволили оптимізувати використання апаратного забезпечення.

Як DeepSeek досягла таких результатів

Інноваційний підхід до навчання моделей

DeepSeek використала методологію, відому як "суміш експертів" (mixture of experts), яка передбачає розподіл завдань між кількома підмоделями, що працюють паралельно. У минулому цей підхід часто втрачав ефективність через потребу передавати дані між підмоделями. Однак інженери DeepSeek вирішили цю проблему, мінімізувавши втрати часу і ресурсів.

Оптимізація ресурсів

Замість стандартного підходу, де значна частина ресурсів витрачається на тестування і корекцію, DeepSeek зосередилася на тому, щоб зробити процес навчання максимально продуктивним. Вони використали інструменти з відкритим вихідним кодом, доступні в інтернеті, що додатково знизило витрати.

Талант і інновації

Ключову роль у прориві зіграла команда компанії. DeepSeek активно залучає молодих дослідників, які шукають можливостей реалізувати найсміливіші ідеї. Це дозволило компанії створити атмосферу експериментів і новаторства.

Що означає цей прорив для США та Китаю

Чи втрачають США лідерство в АІ?

Хоча США залишаються технологічним лідером, DeepSeek поставила під сумнів їхню перевагу у витратах і швидкості інновацій. Якщо раніше вважалося, що потужні системи штучного інтелекту під силу лише технологічним гігантам, таким як Google чи Microsoft, то тепер очевидно, що маленькі компанії з обмеженими ресурсами також можуть досягати великих результатів.

Відкритий код як нова зброя

DeepSeek зробила свій код відкритим, дозволивши іншим компаніям і дослідникам використовувати її технології. Це може прискорити глобальний розвиток АІ, але водночас підвищує ризики, пов’язані з неконтрольованим використанням штучного інтелекту, зокрема для дезінформації чи військових цілей.

Ефект санкцій США

Спроба обмежити доступ Китаю до потужних чипів через санкції, ймовірно, стимулювала китайських дослідників до створення інноваційних методів оптимізації. Це підкреслює складність контролю за розвитком технологій у глобалізованому світі.

Чи стане DeepSeek новим лідером у сфері АІ?

Конкуренція з гігантами

Попри досягнення, DeepSeek ще далеко до абсолютного домінування. Наприклад, OpenAI працює над моделлю o3, яка вже показала вражаючі результати у завданнях, що вимагають логічного мислення. Проте DeepSeek швидко наздоганяє: 20 січня компанія випустила свою власну логічну модель DeepSeek-R1, яка отримала схвальні відгуки експертів.

Майбутнє відкритого коду

Якщо США почнуть обмежувати відкритий код, це може дати Китаю ще більшу перевагу. У довгостроковій перспективі це означає, що багато компаній, зокрема американських, можуть почати використовувати китайські технології як основу для власних розробок.

Висновки: нова ера штучного інтелекту

DeepSeek показала, що інновації можуть переважити ресурси. Її успіх знаменує нову еру у розвитку штучного інтелекту, де ідеї та оптимізація стають важливішими за обсяги фінансування. У найближчі роки ми можемо очікувати посилення конкуренції, нових проривів і змін у глобальному розподілі сил у технологічній галузі.


Тетяна Федорів — Кореспондент, яка спеціалізується на політиці, економіці та технологіях, проживає у Вашингтоні, США, та висвітлює міжнародні новини.

Цей матеріал є частиною розгорнутої теми: DeepSeek, яка охоплює численні цікаві аспекти цієї події. Газета «Дейком» ретельно відстежує події, проводячи перевірку джерел та інформації, щоб забезпечити нашим читачам найбільш точне та актуальне інформування.

Цей матеріал опубліковано 28.01.2025 року о 03:19 GMT+3 Київ; 20:19 GMT-4 Вашингтон, розділ: Світові новини, Китай, Технології, із заголовком: "DeepSeek: як маловідома китайська компанія змінює майбутнє штучного інтелекту". Якщо в публікації з'являться зміни, про це буде зазначено та описано у кінці публікації.

Читайте щоденну газету та загальну стрічку новин газети Дейком, яка поєднує багато цікавого в понад 40 розділах з усіх куточків світу.


Save
ОГОЛОШЕННЯ

Новини, які можуть Вас зацікавити:

Штатні та позаштатні журналісти газети «Дейком» щодня готують сотні публікацій, щоб читачі отримували найоперативнішу, перевірену й глибоку інформацію. Ми працюємо для тих, хто хоче розуміти суть подій, бачити широку картину та бути на крок попереду.

Останні новини

Вибір редакції

Європейські новини: