Usporedba tri odvojena proizvoda koja se često spominju uz lokalne velike jezične modele:

Apple Mac mini (2024.) — M4 ili M4 Pro; stolni Mac, macOS, unified memory.
GMKtec EVO-X2 AI Mini PC — AMD Ryzen AI Max+ 395 („Strix Halo“), tvornički Windows 11, do 128 GB lemljenog RAM-a.
Tiiny AI Pocket Lab — startup Tiiny AI (pisano Tiiny, s dva i); vrlo kompaktan uređaj, CES 2026 i Kickstarter (isporuka procijenjena na kolovoz 2026.). Nije Tiny Corp (tinybox / tinygrad) niti zamjena za Mac mini.

Uz usporedbu hardvera i brzina iz zajednice, provjerili smo i ideju zajedničkog kapaciteta putem Exo okvira — što službena dokumentacija danas zaista dopušta.

Tri različita kompromisa

Mac mini prodaje se kao „mali desktop“, ali za AI je zapravo priča o macOS ekosustavu i unified memory — zgodno za Ollama ili MLX, tiše od većine PC-eva, s tvrdim stropom od 64 GB na M4 Pro u ovoj generaciji.

EVO-X2 je suprotna logika: najviše lemljenog RAM-a u mini PC formi i jak integrirani GPU, ali ste na Windows / Linux / driver kombinatorici; kad čitate benchmarkove, često je riječ o Ubuntu + Ollami, ne o istom iskustvu „iz kutije“ na Windowsu.

Tiiny je treći val — portabilnost i priča o velikim modelima u malom kućištu. To može biti revolucionarno za putovanja ili demo, ali crowdfunding i agresivni marketinški opsezi znače: zanimljivo za rane usvajače, rizičnije kao jedini produkcijski stroj.

Veličina modela nije isto što „GB u katalogu“

Broj parametara (30B, 70B…) ovisi o arhitekturi (gusto vs. MoE), kvantizaciji, kontekstu (KV cache) i softveru. Zato donje tablice kombiniraju službene specifikacije i brojke koje su drugi objavili — uvijek ih usporedite s vašim modelom i promptom.

Službene i javno objavljene specifikacije

Polje	Mac mini (M4)	Mac mini (M4 Pro)	GMKtec EVO-X2 (Ryzen AI Max+ 395)	Tiiny AI Pocket Lab
Form factor	Stolni mini	Stolni mini	Mini PC (GMKtec: ~193 × 185,8 × 77 mm)	„Džepni“ format (u medijima često ~14,2 × 8 × 2,5 cm, ~300 g — npr. Geeky Gadgets)
CPU	10 jezgre (4P + 6E)	12 jezgre (8P + 4E), do 14C/20GPU	16 jezgre / 32 niti, do 5,1 GHz (GMKtec)	12 jezgre ARMv9.2 (kampanja / sažeci specifikacija)
GPU / akceleracija	10 jezgre GPU	16–20 jezgre GPU	Radeon 8060S, 40 CU RDNA 3.5 (GMKtec)	Naglasak na NPU / integrirani AI; u materijalima red veličine ~190 TOPS (provjerite što točno mjere INT8 vs. FP)
Neural / NPU	16 jezgre Neural Engine	16 jezgre Neural Engine	NPU do 50 TOPS (XDNA 2), do 126 TOPS za cijeli SoC (GMKtec)	Sličan red veličine ~190 TOPS u vendor materijalima
Memorija (maks.)	16 → 32 GB unified	24 → 64 GB unified	64 / 96 / 128 GB LPDDR5X-8000, lemljeno	80 GB LPDDR5X + 1 TB NVMe (Kickstarter, Geeky Gadgets)
Propusnost (Apple)	120 GB/s	do 273 GB/s	LPDDR5X 8000 MHz (GMKtec)	Detaljna teorijska propusnost — u službenoj dokumentaciji kad bude dostupna
OS	macOS	macOS	Windows 11 Pro (GMKtec)	Često macOS / Windows kao host uz uređaj — provjerite workflow prije kupnje

Izvori: Apple Support — Mac mini (2024), GMKtec — EVO-X2, Micro Center — EVO X2, Kickstarter — Tiiny, tiiny.ai.

Cijene koje možemo citirati

Uređaj	Izvor
Mac mini	U Appleovoj press obavijesti od 29. 10. 2024. polazno 599 USD (M4, 16 GB) i 1399 USD (M4 Pro). EUR za Hrvatsku — Apple Store za vaše tržište.
GMKtec EVO-X2	Na GMKtec stranici red veličine ~1999,99 USD za 64 GB + 1 TB; SKU-ovi 96/128 GB provjerite uživo. TechPowerUp (travanj 2026.) spominje pomicanje cijena vrhunskih konfiguracija.
Tiiny	Kickstarter: MSRP 1999 USD, tierovi tipa 1399 / 1599 / 1799 USD; isporuka kolovoz 2026. tiiny.ai — depozit i uvjeti u FAQ-u.

Nagrada na Kickstarteru nije isto što i kutija u trgovini: rokovi i detalji znaju se pomicati.

Tokeni u sekundi (tok/s) — što zajednica stvarno mjeri

Isti stroj može dati drugačiji tok/s ako promijenite samo verziju Ollame, MLX vs. Metal, kvant ili duljinu konteksta. Tablica je kompilacija tuđih mjerenja, ne ANIM-ov eksperiment — koristite je kao smjer, ne kao garanciju.

Opterećenje (primjer)	Mac mini M4 (16–24 GB u izvorima)	Mac mini M4 Pro (64 GB)	EVO-X2 (64–128 GB; često Ubuntu + Ollama)	Tiiny (pre-release / demo)
~7–8B Q4	~18–30 tok/s (vminstall, CraftRigs; YouTube Tech-Practice ~20 tok/s za Qwen2.5-Coder 7B)	Viša propusnost od baze M4 → obično brže na istom modelu	~28–45 tok/s (CraftRigs, 128 GB test)	YouTube ~~26,8 tok/s u jednom CLI testu; širi raspon ~~18–40 u press materijalima (AOL)
~14B Q4	~18–22 tok/s (CraftRigs)	Više unified RAM-a	~18–22 tok/s (CraftRigs)	—
~30–32B Q4	16 GB često premalo; 32 GB rubno	~10–16 tok/s (vminstall, Like2Byte)	~7–12 tok/s (CraftRigs)	YouTube ~19,6 tok/s u jednom „Qwen“ redu bench tablice (u transkriptu „330B“ — vjerojatna pogreška u govoru)
~70B Q4_K_M	Na 32 GB ne	~3–5 tok/s (r/LocalLLaMA, M4 Pro 64 GB)	~4–8 tok/s (CraftRigs 128 GB Ubuntu)	—
gpt-oss ~20B (MoE)	Rijetko u istim izvorima	—	~33–65 tok/s ovisno o runu (Nish Tahir)	YouTube ~22,4 tok/s
GPT-OSS ~120B (MoE)	Nije tipični Mac mini use-case	—	Nish Tahir — vrlo različite brzine ovisno o alatu i kontekstu	YouTube ~12,4 tok/s prosjek u bench UI-ju; dugi kontekst u tablici ruši brzinu

Gdje kopati dublje: Tech-Practice — M4 i Ollama, usporedba M1/M3/M4, Ollamometer + Strix Halo, ETA Prime — EVO-X2, Tiiny hands-on; forumi: r/LocalLLaMA, Hacker News — Ollama vs LM Studio; blogovi: vminstall, Like2Byte, CraftRigs, Tom's Hardware. Za Tiiny arhitekturu: remio.ai.

Osvrt: vendori vs. ono što možete osjetiti

Apple ne objavljuje službene tok/s za Mac — što je iskreno: manje lažne preciznosti u katalogu, više ovisnosti o RAM tieru i backendu. GMKtec na stranici miješa TOPS, LM Studio usporedbe i popis modela po SKU-u — korisno kao što tvrtka želi prodati, ali kupnju ipak temeljite na neovisnim testovima i vlastitom promptu.

GMKtec u tablici „LLM support“ npr. veže 32B uz 64 GB, GPT-OSS 120B uz 96 GB, 70B uz 128 GB (plus drugi nazivi kao na njihovoj stranici) — to su marketinški parovi, ne jamstvo brzine niti kvalitete odgovora.

Tiinyjev marketing oko 120B gotovo uvijek znači MoE / poseban stack (TurboSparse, PowerInfer u njihovim materijalima). Tu nije riječ o tome je li startup u pravu — nego da „120B“ na kutiji ≠ isti problem kao gusti 120B u FP16.

Koji stroj za 30B, 70B i 120B?

~30B: Mac M4 Pro 64 GB je razuman Apple odabir; M4 32 GB je rubno. EVO-X2 s 64 GB SKU-om GMKtec formalno veže uz 32B klasu; 96/128 GB daje zalihe za KV. Tiiny (80 GB) ima smisla ako vam je džep + eksperiment važniji od predvidljivosti stolnog sustava.

~70B: M4 (max 32 GB) — ne za udoban Q4 rad. M4 Pro (64 GB) — ulazi u „može, ali ovisi o modelu i strpljenju“. EVO-X2 128 GB — najviše lemljenog RAM-a u ovoj trojci; GMKtec 70B navodi uz taj SKU. Tiiny — još premalo javnih stabilnih mjerenja da bismo ga stavili uz ova dva za produkcijski 70B.

~120B: Mac mini nije prirodno odredište za gusti 120B. EVO-X2 96 GB+ spominje GPT-OSS 120B — konkretan model, ne svaki zapis „120B“ na internetu. Tiiny — ista priča: točan model i kvant, ne slogan.

Exo klasteriranje

exo spaja više strojeva u klaster za inference (MLX na Apple Silicon, automatsko otkrivanje čvorova; README spominje i RDMA preko Thunderbolt 5 između Mac čvorova). To nije zamjena za Ollama na jednom stroju ako vam model već stane — Exo ima smisla kad šardirate ono što inače ne bi ušlo u memoriju.

Uređaj	Exo danas (prema README-u)
Mac mini, macOS	Da — glavni službeni put s MLX / Metalom. Za RDMA klaster README traži da su čvorovi međusobno povezani — planirajte Thunderbolt / žičanu mrežu.
EVO-X2, Windows	Ne računajte na službeni Exo stack — Windows nije naveden kao platforma u README-u.
EVO-X2, Linux	Ograničeno: README kaže da Exo na Linuxu trenutno radi na CPU-u, a GPU podrška je u razvoju — Strix Halo iGPU ne ubrzava Exo na Linuxu dok to ne dođe.
Tiiny	Nepoznato — nije u Exo dokumentaciji; bez potvrde proizvođača / upstreama: ne planirati produkcijski Exo čvor.

Heterogeni Mac + PC: backendi moraju sjediti; ovaj DEV tekst dobro ilustrira koliko MLX CUDA ring može zakomplicirati život. Ako Exo ne paše, llama.cpp RPC je drugačija arhitektura — ne ista stvar.

Pitanja koja iskaču uz Exo

Windows i Exo? README dokumentira macOS i Linux; za Windows tražite drugi stack ili dual-boot.

Je li Exo uvijek brži od jednog Mac minija? Ne — mrežna latencija i orkestracija koštaju. Ako model stane lokalno, jedan stroj je često ugodniji za chat.

Zamjenjuju li dva Mac minija jedan s 128 GB? Exo dijeli slojeve po čvorovima; ne stvara jedan kontinuirani unified RAM pool kao jedan M4 Max / Studio.

Mreža? README i praksa: žičano (Gigabit / 10GbE) ili Thunderbolt; Wi‑Fi je loš default za decode.

Zaključak

Želite tišinu, macOS i predvidljiv stack — Mac mini; za ozbiljnije LLM-ove u Apple svijetu gledajte M4 Pro s što više unified memorije.
Želite najviše lemljenog RAM-a u Windows mini PC-u — EVO-X2, uz svijest da su driveri i OS dio cijene ulaska.
Želite portabilnost i rani pristup hardveru — Tiiny, uz Kickstarter rizik i potrebu za vlastitim provjerama kad uređaji stignu kupcima.

Metodologija: ANIM nije sam mjerio ove sustave. Članak spaja Apple i GMKtec dokumentaciju, Kickstarter/tiiny.ai, javne benchmarkove (YouTube, Reddit, blogovi), exo README i navedene analize. Prije kupnje provjerite žive cijene, PDV i carine te garanciju kod prodavača.

Mac mini (M4), GMKtec EVO-X2 i Tiiny AI Pocket Lab: usporedba za lokalne LLM-ove (30B / 70B / 120B)

Tri različita kompromisa

Veličina modela nije isto što „GB u katalogu“

Službene i javno objavljene specifikacije

Cijene koje možemo citirati

Tokeni u sekundi (tok/s) — što zajednica stvarno mjeri

Osvrt: vendori vs. ono što možete osjetiti

Koji stroj za 30B, 70B i 120B?

Exo klasteriranje

Pitanja koja iskaču uz Exo

Zaključak

Povezani članci

Claude Code i Pro pretplata: što se stvarno dogodilo i zašto je nastao kaos

5 poslovnih procesa koje možete automatizirati bez programiranja

Trebate pomoć s ovom temom?

Koristimo kolačiće