Zašto ekonomika AI pretplata zapravo funkcionira, što je telekom industrija riješila još prije desetljeća i koje poslovne odluke danas zbog toga izgledaju drukčije.
Posljednjih mjeseci pojavila se popularna teza da AI provideri masovno gube novac na pretplatama, da je vaš ChatGPT subvencioniran novcem Sequoie i SoftBanka te da će se taj model srušiti čim presuši VC kapital. Teza dobro zvuči u naslovima, ali kad se brojke razdvoje, matematika izgleda drukčije.
Krenimo od jezgre. Claude Sonnet, model na kojem se temelji najveći dio Claude Pro pretplata, ima infrastrukturni trošak inferencije od približno 1,75 dolara po milijunu tokena. API cijena tog istog modela kreće se između 3 i 15 dolara po milijunu tokena, što daje maržu od dva do osam puta. GPT-5 klasa, odnosno Claude Opus, providera košta oko 10 dolara po milijunu tokena, a naplaćuje se između 15 i 25 dolara. Jedino su Haiku i GPT-4 modeli u zoni tankih marži, ali oni funkcioniraju kao ulazna točka za freemium model.
Drugim riječima, kada postavite 30 pitanja Claude Sonnetu u svojoj Pro pretplati od 25 dolara, provideru ste vjerojatno donijeli oko 24 eura bruto marže na inferenciji. Trošak servera daleko je ispod onoga što ste platili. U tom smislu, subvencije nema.
Pa odakle dolazi OpenAI-jevih 13,7 milijardi dolara gubitka u prvoj polovici 2025. i projekcija od 115 milijardi do 2029.? Iz potpuno druge kategorije troška: treniranja novih frontier modela. Jedan novi model te klase stoji između 1 i 10 milijardi dolara samo u GPU vremenu, bez plaća inženjera, sintetičkih podataka, RLHF-a, sigurnosnih provjera i kapitalnih ulaganja u nove podatkovne centre. Taj trošak raste svake godine jer svaki sljedeći skok kvalitete traži red veličine više računalnih resursa.
I tu se gubi ključna razlika u javnoj raspravi. Treniranje modela je fiksni trošak. Plaća se jednom, model zatim postoji godinama i amortizira se kroz sve korisnike koji ga koriste. Ako Anthropic potroši 3 milijarde dolara na treniranje nove verzije Sonneta (u 2025. je potrošio ukupno 6,8 milijardi dolara na servere), a model dvije godine koristi trideset milijuna pretplatnika, trošak treninga po korisniku mjesečno pada ispod pet dolara. Ako se baza korisnika utrostruči, trošak pada ispod dva dolara. Više korisnika ne povećava gubitke, nego ih smanjuje.
To je klasična SaaS dinamika. Microsoft Office košta milijarde u razvoju, a distribucija po korisniku gotovo ništa. Spotify plaća visoke tantijeme, ali marginalni trošak po dodatnom korisniku ostaje nizak. AI provideri danas ulaze u istu fazu: visok fiksni trošak istraživanja i razvoja, nizak marginalni trošak korištenja i profitabilnost koja dolazi kad baza korisnika dosegne kritičnu masu.
Telekom analogija, koja se često koristi kao argument protiv ovog modela, zapravo govori suprotno. Telekomi su desetljećima živjeli od strukture u kojoj light useri subvencioniraju heavy usere i pritom bili vrlo profitabilni. Mreža je fiksni trošak, a svaki novi korisnik gotovo čisti rast prihoda. AI ekonomija ide istim putem, samo s drukčijim infrastrukturnim slojem.
Postoji ipak jedno područje gdje priča o subvenciji i dalje stoji: heavy useri u agentic workflowovima. Programer koji svakodnevno kroz Claude Code obradi 10 do 30 milijuna tokena ili autonomni agent koji procesuira milijarde tokena tjedno izlazi toliko iz prosjeka da njegov stvarni infrastrukturni trošak značajno premašuje ono što pretplata pokriva. Anthropicov potez iz travnja, kada su pokušali ukloniti Claude Code iz Pro pretplate i prebaciti ga u Max paket, odnosio se upravo na tu skupinu korisnika: one koji su trošili višestruko više od očekivanog. Reakcija na X-u bila je brza, Anthropic je vratio pristup u manje od jednog dana i ispričao se zbog “communication errora”, ali signal je bio jasan: agentski način korištenja jedino je područje gdje će se cjenovni modeli ozbiljnije zaoštravati.
Što to mijenja za vašu firmu?
Prvo, današnji vrhunski modeli već su dovoljno dobri za otprilike 90 posto poslovnih potreba. To mijenja cijelu logiku čekanja. Tipičnoj firmi ne treba GPT-7 da bi automatizirala obradu ponuda, transkripte sastanaka, prvu razinu korisničke podrške, kontrolu kvalitete teksta ili interno pretraživanje dokumentacije. Sve to već danas pouzdano radi klasa modela poput Claude Sonneta ili GPT-5.5. Sljedeći veliki skok kvalitete koncentrira se na uska područja poput znanstvenih istraživanja, medicinske dijagnostike, matematičkih dokaza i autonomne robotike, koja većinu firmi izravno ne dotiču. Drugim riječima, vrijednost koju AI danas može donijeti vašem poslu već postoji i ne čeka sljedeći tehnološki milestone.
Drugo, tehnološki smjer vodi prema drastično jeftinijoj inferenciji, ne skupljoj. Dolazi nova generacija ASIC čipova posebno dizajniranih za AI inferenciju, za koje se procjenjuje da bi mogli smanjiti potrošnju energije po tokenu između 15 i 50 puta u odnosu na današnje NVIDIA H100 servere. Paralelno s tim, eksperimentalni diffusion modeli za jezik već pokazuju brzinu i do deset puta veću od klasičnih autoregresivnih LLM-ova uz usporedivu kvalitetu. Inception Labs i nekoliko akademskih grupa već su objavili prve rezultate u tom smjeru, a riječ je tek o početnoj generaciji tih modela.
Treći tehnološki smjer je destilacija. Kada jednom postoji GPT-7 ili GPT-10, njegovo se znanje može komprimirati u višestruko manji model koji radi na lokalnoj radnoj stanici ili čak laptopu, uz djelić današnjeg troška. Ono što danas plaćate 25 eura mjesečno za pristup vrhunskom modelu kroz nekoliko godina vjerojatno će koštati pet do deset eura, uz bolje sposobnosti i brže odgovore. Sve tri putanje vode prema istom rezultatu, i sve tri već danas postoje u istraživačkom svijetu, nisu hipotetske.
Treće, jedina ozbiljna iznimka od te putanje su agentski workflowovi. Ako vaši procesi uključuju autonomne agente koji rade satima bez nadzora, intenzivno korištenje alata poput Claude Codea ili sustave koji obrađuju milijune dokumenata, ondje treba očekivati zaoštravanje cijena. To je jedino područje gdje današnja matematika još ne funkcionira dobro i gdje će restrukturiranje pretplata doći brzo, kroz rate limitove, premještanje alata u skuplje pakete ili nove modele naplate prema stvarnoj potrošnji. Potez s Claude Codeom u travnju bio je najava upravo tog scenarija. No važna je i vremenska komponenta: čak i agentski trošak pada s ASIC čipovima i destilacijom, samo s odmakom od godinu ili dvije u odnosu na ostatak tržišta.
Četvrto, najveća vijest u ovoj ekonomiji nije koliko provideri danas gube, nego koliko ljudi još uvijek ne koristi AI. Samo manjina profesionalne radne snage ima plaćenu AI pretplatu, a i unutar te skupine većina je još uvijek na besplatnoj razini. Svaki prijelaz na plaćeni paket poboljšava unit ekonomiku. Mobilna industrija prolazila je istu krivulju od devedesetih do 2010-ih i nije se urušila, nego proširila na praktički svaku osobu na planetu, uz dugoročnu profitabilnost.
Zaključak je drukčiji od onoga kako ga često prikazuju mediji. Vaša AI pretplata nije talac VC subvencije koja samo što nije nestala. Inferencija je profitabilna već danas, hardver i nove arhitekture čine je sve jeftinijom, trošak istraživanja i razvoja amortizira se na sve veću bazu korisnika, a destilirani modeli svake nove generacije donose vrhunske sposobnosti na sve slabiji hardver. Subvencije stvarno postoje uglavnom u agentskoj kategoriji, i jedino ondje ima smisla računati na osjetno više cijene kroz tri do pet godina.
Odluke koje danas donosite o ljudima i procesima u svojoj firmi temelje se na cijenama koje će vjerojatno padati, ne rasti. Ako otpuštate mlađeg programera zato što Codex ili Claude Code danas rade njegov posao za 30 eura mjesečno, problem nije u tome da je ta cijena umjetno niska i da će se sustav urušiti. Problem je drukčiji i tiče se znanja koje mlađi programer stječe kroz svakodnevni rad, a koje vam za pet godina možda neće imati tko prenijeti ako te ljude danas ne provedete kroz proces razvoja. To je tema za drugu kolumnu.