+
Вход

Въведи своя e-mail и парола за вход, ако вече имаш създаден профил в DEV.BG/Jobs

Забравена парола?
+
Създай своя профил в DEV.BG/Jobs

За да потвърдите, че не сте робот, моля отговорете на въпроса, като попълните празното поле:

113+54 =
+
Забравена парола

Въведи своя e-mail и ще ти изпратим твоята парола

DeepSeek и неговият „Спутник момент“

Източник: iStock

Петко Карамочев е главен изпълнителен директор на INDUSTRIA – компания, фокусирана върху разработката на технологични решения за финансовата индустрия и базирана в Лондон.

Текстът е преведен от английски на български език и е публикуван със съгласието на автора.


Петко Карамочев, СЕО на INDUSTRIA

Лансирането на R1 модела на DeepSeek разтърси AI индустрията и накара някои наблюдатели да го сравнят с „момента Спутник“ през 1957 г., когато изненадващото изстрелване на сателит от Съветския съюз промени глобалните представи за това какво е технологична мощ. 

Независимо дали смятате, че при R1 става дума за моментно вълнение, или за истински пробив, няма съмнение, че това доведе до преосмисляне на темата кой държи ключа към бъдещето на изкуствения интелект. 

Обичайните заподозрени: Claude, Gemini, GPT

Досега беше общоприето, че шепа технологични лидери може да се справят с огромните разходи и сложността около изграждането на съвременния AI. 

Измежду OpenAI (която си партнира с Microsoft) и нейния GPT, Gemini на Google и Claude, създаден от Anthropic (която е подкрепена от Amazon), изглеждаше, че има само няколко играчи, които имат пари и инфраструктура, за да движат напред AI. Разработиха патентовани модели със затворен код, създадоха абонаменти за потребителите. Това беше приетият модел – малцина смятаха обратното. 

Grok AI на Илън Мъск

Източник: iStock

Единственият аутсайдер, който изглеждаше способен да разбие този модел (поне конвенционално), беше Илън Мъск, който инвестира милиарди в изграждането на най-мощния клъстер за обучение на AI в САЩ (базиран в град Мемфис). 

Той използва този клъстер, за да обучи модела си Grok AI. Въпреки че това може да разшири полето, все пак отговаря на обичайния наратив – трябват ти много пари и хардуер, ако искаш да се конкурираш на най-високо ниво. 

Така само огромни корпорации или милиардери с космически бюджети може да се надяват, че ще успеят да поддържат темпото. 

DeepSeek R1: Предизвикателство за допустимите разходи

Графика на „Спутник1“. Източник: iStock

После обаче се появи DeepSeek, основана през 2023 г. от Лиан Уенфън, и преобърна очакванията. След като пусна няколко модела – Coder, LLM, V3, V4 – компанията лансира R1 и заяви, че е успяла да го обучи само за 6 млн. долара. Още по-удивително е, че първоначални анализи показват, че R1 може да си съперничи с GPT-4 на OpenAI.

Ако това не се промени, ще противоречи на идеята, че само мащабни проекти със затворен код може да осигурят производителност на най-високо ниво. Марк Андреесен (американски tech предприемач и инвеститор – бел. ред.) направи сравнение с „момента Спутник“, именно защото може да предизвика нова вълна от конкуренция и иновации, включително извън обичайните заподозрени с дълбоки джобове. 

Днес те питаме…

Коя е най-голямата трудност, с която се сблъсквате при търсенето на работа в IT сектора?
Loading ... Loading …

Контраст с плановете на OpenAI

Главният продуктов директор на компанията, Кевин Уейл, наскоро очерта плана за ChatGPT за 2025 г., с което затвърди конвенционалния възглед: дайте на модела по-голяма изчислителна мощ и ще получите по-добър модел. Това мислене насърчава идеята за по-големи GPU клъстери, повече данни и по-големи бюджети. 

Но R1 на DeepSeek допуска, че има и друг възможен сценарий. И не става дума само за повече GPU-та, а например за по-умен дизайн на модела, креативни стратегии за обучение и open-source колаборации, които може да постигнат сходни (или по-добри) резултати с по-малък бюджет.

Тези две визии са много различни. С едната човек вижда бъдещето на AI като една все по-нарастваща надпревара, а с другата – че можеш да направиш повече неща с по-малко средства, ако само действаш умно. 

Отворен срещу затворен код

Подходът на DeepSeek за отворен код може да се окаже най-голямата заплаха за конкурентите. Ако някой има достъп до скриптовете за обучение, параметрите и дизайн решенията зад R1, тогава малки лаборатории, стартъпи и академични институции може да участват в развитието му.

Това ярко контрастира с Claude, Gemini и GPT – модели, заключени зад стени, монетизирани и контролирани от собствениците си. Ако R1 постигне успех, може да провокира серия от експерименти с отворен код, които да ускорят развитието на AI с темпове, които не сме виждали досега.

Nvidia, Cisco и притесненията за балона

Някои инвеститори и анализатори се връщат към дните на dotcom балона. Тогава Cisco стана една компаниите с най-висока пазарна оценка, преди да се срине. 

В наши дни Nvidia бележи огромно покачване на цените на акциите си на фона на търсенето на AI и има съмнения дали не сме на прага на ситуация, подобна на тази преди десетилетия. 

Източник: iStock

Ако традиционното мислене за масивни GPU клъстери остане (а гледната точка на Кевин Уейл от OpenAI подсказва, че ще остане), растежът на Nvidia може да продължи. Но, ако подходът на R1 се развихри или ако се появят други подобни проекти с отворен код, може ли балонът да се издуе?

Explore more

Виж
IBM DOORS обявите
Събрани на едно място
Right Arrow
Виж
CircleCI обявите
Събрани на едно място
Right Arrow
Виж
ELK stack обявите
Събрани на едно място
Right Arrow
Виж
Informatica обявите
Събрани на едно място
Right Arrow

Разклонение на пътя

Появата на DeepSeek R1 е нещо повече от интересна технологична история. Тя подсказва за два възможни пътя за развитието на AI.

1. Голяма изчислителна мощ, компании със затворен код като Anthropic, Google, OpenAI, добре финансирани аутсайдери като Мъск. Моделите остават затворени и достъпът до тях се монетизира.

2. Отворен подход като този на DeepSeek (и потенциално други играчи), който цели да докаже, че може да постигнеш добри резултати, без да харчиш милиарди за GPU клъстери. Работата се споделя свободно и с това се дава възможност за повече колаборации на глобалната AI сцена.

Кой сценарий ще надделее – и дали ще виждаме и от двата – е решаващо бъдещето на AI. Ако успехът на R1 е действителен и повторяем, може да демократизира изкуствения интелект. Ако пък не, може да продължим да виждаме концентрация в ръцете на малцината, които могат да си позволят гигантски бюджети. 

Началната страница на DeepSeek днес.

Чисто нова ера в AI. Защо потребителите трябва да се радват на засилената конкуренция

Изглежда, че се намираме в повратна точка за AI, в която нови играчи като DeepSeek доказват, че доброто представяне невинаги има космическа цена. 

Утвърдените гиганти като Google, OpenAI и останалите все още работят в посока големи изчислителни клъстери и модели със затворен код, но става все по-ясно, че по-отворен и икономичен подход също може да доведе до силни резултати. Този контраст може да се окаже катализатор за по-големи иновации и да принуди всеки конкурент да дава повече стойност в по-кратки срокове. 

Като потребител всъщност се радвам да видя, че конкуренцията се засилва. Това означава по-бърз прогрес, по-разнообразни предложения и потенциално по-ниски разходи за всички, които разчитат на инструменти с AI. 

Независимо дали става дума за проекти със затворен или с отворен код, разнообразието и конкуренцията може да доведат до по-сполучливи функции и представяне. 

Докато притесненията за потенциални балони на пазара и геополитическото напрежение висят във въздуха, за крайните потребители това е обещаващо време, в което този силен стремеж към иновации може да ни даде само по-добри продукти и по-голям избор. 

Вижте тук оригиналния текст на английски език.