Петко Карамочев е главен изпълнителен директор на INDUSTRIA – компания, фокусирана върху разработката на технологични решения за финансовата индустрия и базирана в Лондон.
Текстът е преведен от английски на български език и е публикуван със съгласието на автора.

Лансирането на R1 модела на DeepSeek разтърси AI индустрията и накара някои наблюдатели да го сравнят с „момента Спутник“ през 1957 г., когато изненадващото изстрелване на сателит от Съветския съюз промени глобалните представи за това какво е технологична мощ.
Независимо дали смятате, че при R1 става дума за моментно вълнение, или за истински пробив, няма съмнение, че това доведе до преосмисляне на темата кой държи ключа към бъдещето на изкуствения интелект.
Обичайните заподозрени: Claude, Gemini, GPT
Досега беше общоприето, че шепа технологични лидери може да се справят с огромните разходи и сложността около изграждането на съвременния AI.
Измежду OpenAI (която си партнира с Microsoft) и нейния GPT, Gemini на Google и Claude, създаден от Anthropic (която е подкрепена от Amazon), изглеждаше, че има само няколко играчи, които имат пари и инфраструктура, за да движат напред AI. Разработиха патентовани модели със затворен код, създадоха абонаменти за потребителите. Това беше приетият модел – малцина смятаха обратното.
Grok AI на Илън Мъск

Единственият аутсайдер, който изглеждаше способен да разбие този модел (поне конвенционално), беше Илън Мъск, който инвестира милиарди в изграждането на най-мощния клъстер за обучение на AI в САЩ (базиран в град Мемфис).
Той използва този клъстер, за да обучи модела си Grok AI. Въпреки че това може да разшири полето, все пак отговаря на обичайния наратив – трябват ти много пари и хардуер, ако искаш да се конкурираш на най-високо ниво.
Така само огромни корпорации или милиардери с космически бюджети може да се надяват, че ще успеят да поддържат темпото.
DeepSeek R1: Предизвикателство за допустимите разходи

После обаче се появи DeepSeek, основана през 2023 г. от Лиан Уенфън, и преобърна очакванията. След като пусна няколко модела – Coder, LLM, V3, V4 – компанията лансира R1 и заяви, че е успяла да го обучи само за 6 млн. долара. Още по-удивително е, че първоначални анализи показват, че R1 може да си съперничи с GPT-4 на OpenAI.
Ако това не се промени, ще противоречи на идеята, че само мащабни проекти със затворен код може да осигурят производителност на най-високо ниво. Марк Андреесен (американски tech предприемач и инвеститор – бел. ред.) направи сравнение с „момента Спутник“, именно защото може да предизвика нова вълна от конкуренция и иновации, включително извън обичайните заподозрени с дълбоки джобове.

Контраст с плановете на OpenAI
Главният продуктов директор на компанията, Кевин Уейл, наскоро очерта плана за ChatGPT за 2025 г., с което затвърди конвенционалния възглед: дайте на модела по-голяма изчислителна мощ и ще получите по-добър модел. Това мислене насърчава идеята за по-големи GPU клъстери, повече данни и по-големи бюджети.
Но R1 на DeepSeek допуска, че има и друг възможен сценарий. И не става дума само за повече GPU-та, а например за по-умен дизайн на модела, креативни стратегии за обучение и open-source колаборации, които може да постигнат сходни (или по-добри) резултати с по-малък бюджет.
Тези две визии са много различни. С едната човек вижда бъдещето на AI като една все по-нарастваща надпревара, а с другата – че можеш да направиш повече неща с по-малко средства, ако само действаш умно.
Отворен срещу затворен код
Подходът на DeepSeek за отворен код може да се окаже най-голямата заплаха за конкурентите. Ако някой има достъп до скриптовете за обучение, параметрите и дизайн решенията зад R1, тогава малки лаборатории, стартъпи и академични институции може да участват в развитието му.
Това ярко контрастира с Claude, Gemini и GPT – модели, заключени зад стени, монетизирани и контролирани от собствениците си. Ако R1 постигне успех, може да провокира серия от експерименти с отворен код, които да ускорят развитието на AI с темпове, които не сме виждали досега.
Nvidia, Cisco и притесненията за балона
Някои инвеститори и анализатори се връщат към дните на dotcom балона. Тогава Cisco стана една компаниите с най-висока пазарна оценка, преди да се срине.
В наши дни Nvidia бележи огромно покачване на цените на акциите си на фона на търсенето на AI и има съмнения дали не сме на прага на ситуация, подобна на тази преди десетилетия.

Ако традиционното мислене за масивни GPU клъстери остане (а гледната точка на Кевин Уейл от OpenAI подсказва, че ще остане), растежът на Nvidia може да продължи. Но, ако подходът на R1 се развихри или ако се появят други подобни проекти с отворен код, може ли балонът да се издуе?
Explore more
Разклонение на пътя
Появата на DeepSeek R1 е нещо повече от интересна технологична история. Тя подсказва за два възможни пътя за развитието на AI.
1. Голяма изчислителна мощ, компании със затворен код като Anthropic, Google, OpenAI, добре финансирани аутсайдери като Мъск. Моделите остават затворени и достъпът до тях се монетизира.
2. Отворен подход като този на DeepSeek (и потенциално други играчи), който цели да докаже, че може да постигнеш добри резултати, без да харчиш милиарди за GPU клъстери. Работата се споделя свободно и с това се дава възможност за повече колаборации на глобалната AI сцена.
Кой сценарий ще надделее – и дали ще виждаме и от двата – е решаващо бъдещето на AI. Ако успехът на R1 е действителен и повторяем, може да демократизира изкуствения интелект. Ако пък не, може да продължим да виждаме концентрация в ръцете на малцината, които могат да си позволят гигантски бюджети.

Чисто нова ера в AI. Защо потребителите трябва да се радват на засилената конкуренция
Изглежда, че се намираме в повратна точка за AI, в която нови играчи като DeepSeek доказват, че доброто представяне невинаги има космическа цена.
Утвърдените гиганти като Google, OpenAI и останалите все още работят в посока големи изчислителни клъстери и модели със затворен код, но става все по-ясно, че по-отворен и икономичен подход също може да доведе до силни резултати. Този контраст може да се окаже катализатор за по-големи иновации и да принуди всеки конкурент да дава повече стойност в по-кратки срокове.
Като потребител всъщност се радвам да видя, че конкуренцията се засилва. Това означава по-бърз прогрес, по-разнообразни предложения и потенциално по-ниски разходи за всички, които разчитат на инструменти с AI.
Независимо дали става дума за проекти със затворен или с отворен код, разнообразието и конкуренцията може да доведат до по-сполучливи функции и представяне.
Докато притесненията за потенциални балони на пазара и геополитическото напрежение висят във въздуха, за крайните потребители това е обещаващо време, в което този силен стремеж към иновации може да ни даде само по-добри продукти и по-голям избор.
Вижте тук оригиналния текст на английски език.