Usporedba tri odvojena proizvoda koja se često spominju uz lokalne velike jezične modele:
- Apple Mac mini (2024.) — M4 ili M4 Pro; stolni Mac, macOS, unified memory.
- GMKtec EVO-X2 AI Mini PC — AMD Ryzen AI Max+ 395 („Strix Halo“), tvornički Windows 11, do 128 GB lemljenog RAM-a.
- Tiiny AI Pocket Lab — startup Tiiny AI (pisano Tiiny, s dva i); vrlo kompaktan uređaj, CES 2026 i Kickstarter (isporuka procijenjena na kolovoz 2026.). Nije Tiny Corp (tinybox / tinygrad) niti zamjena za Mac mini.
Uz usporedbu hardvera i brzina iz zajednice, provjerili smo i ideju zajedničkog kapaciteta putem Exo okvira — što službena dokumentacija danas zaista dopušta.
Tri različita kompromisa
Mac mini prodaje se kao „mali desktop“, ali za AI je zapravo priča o macOS ekosustavu i unified memory — zgodno za Ollama ili MLX, tiše od većine PC-eva, s tvrdim stropom od 64 GB na M4 Pro u ovoj generaciji.
EVO-X2 je suprotna logika: najviše lemljenog RAM-a u mini PC formi i jak integrirani GPU, ali ste na Windows / Linux / driver kombinatorici; kad čitate benchmarkove, često je riječ o Ubuntu + Ollami, ne o istom iskustvu „iz kutije“ na Windowsu.
Tiiny je treći val — portabilnost i priča o velikim modelima u malom kućištu. To može biti revolucionarno za putovanja ili demo, ali crowdfunding i agresivni marketinški opsezi znače: zanimljivo za rane usvajače, rizičnije kao jedini produkcijski stroj.
Veličina modela nije isto što „GB u katalogu“
Broj parametara (30B, 70B…) ovisi o arhitekturi (gusto vs. MoE), kvantizaciji, kontekstu (KV cache) i softveru. Zato donje tablice kombiniraju službene specifikacije i brojke koje su drugi objavili — uvijek ih usporedite s vašim modelom i promptom.
Službene i javno objavljene specifikacije
| Polje | Mac mini (M4) | Mac mini (M4 Pro) | GMKtec EVO-X2 (Ryzen AI Max+ 395) | Tiiny AI Pocket Lab |
|---|---|---|---|---|
| Form factor | Stolni mini | Stolni mini | Mini PC (GMKtec: ~193 × 185,8 × 77 mm) | „Džepni“ format (u medijima često ~14,2 × 8 × 2,5 cm, ~300 g — npr. Geeky Gadgets) |
| CPU | 10 jezgre (4P + 6E) | 12 jezgre (8P + 4E), do 14C/20GPU | 16 jezgre / 32 niti, do 5,1 GHz (GMKtec) | 12 jezgre ARMv9.2 (kampanja / sažeci specifikacija) |
| GPU / akceleracija | 10 jezgre GPU | 16–20 jezgre GPU | Radeon 8060S, 40 CU RDNA 3.5 (GMKtec) | Naglasak na NPU / integrirani AI; u materijalima red veličine ~190 TOPS (provjerite što točno mjere INT8 vs. FP) |
| Neural / NPU | 16 jezgre Neural Engine | 16 jezgre Neural Engine | NPU do 50 TOPS (XDNA 2), do 126 TOPS za cijeli SoC (GMKtec) | Sličan red veličine ~190 TOPS u vendor materijalima |
| Memorija (maks.) | 16 → 32 GB unified | 24 → 64 GB unified | 64 / 96 / 128 GB LPDDR5X-8000, lemljeno | 80 GB LPDDR5X + 1 TB NVMe (Kickstarter, Geeky Gadgets) |
| Propusnost (Apple) | 120 GB/s | do 273 GB/s | LPDDR5X 8000 MHz (GMKtec) | Detaljna teorijska propusnost — u službenoj dokumentaciji kad bude dostupna |
| OS | macOS | macOS | Windows 11 Pro (GMKtec) | Često macOS / Windows kao host uz uređaj — provjerite workflow prije kupnje |
Izvori: Apple Support — Mac mini (2024), GMKtec — EVO-X2, Micro Center — EVO X2, Kickstarter — Tiiny, tiiny.ai.
Cijene koje možemo citirati
| Uređaj | Izvor |
|---|---|
| Mac mini | U Appleovoj press obavijesti od 29. 10. 2024. polazno 599 USD (M4, 16 GB) i 1399 USD (M4 Pro). EUR za Hrvatsku — Apple Store za vaše tržište. |
| GMKtec EVO-X2 | Na GMKtec stranici red veličine ~1999,99 USD za 64 GB + 1 TB; SKU-ovi 96/128 GB provjerite uživo. TechPowerUp (travanj 2026.) spominje pomicanje cijena vrhunskih konfiguracija. |
| Tiiny | Kickstarter: MSRP 1999 USD, tierovi tipa 1399 / 1599 / 1799 USD; isporuka kolovoz 2026. tiiny.ai — depozit i uvjeti u FAQ-u. |
Nagrada na Kickstarteru nije isto što i kutija u trgovini: rokovi i detalji znaju se pomicati.
Tokeni u sekundi (tok/s) — što zajednica stvarno mjeri
Isti stroj može dati drugačiji tok/s ako promijenite samo verziju Ollame, MLX vs. Metal, kvant ili duljinu konteksta. Tablica je kompilacija tuđih mjerenja, ne ANIM-ov eksperiment — koristite je kao smjer, ne kao garanciju.
| Opterećenje (primjer) | Mac mini M4 (16–24 GB u izvorima) | Mac mini M4 Pro (64 GB) | EVO-X2 (64–128 GB; često Ubuntu + Ollama) | Tiiny (pre-release / demo) |
|---|---|---|---|---|
| ~7–8B Q4 | ~18–30 tok/s (vminstall, CraftRigs; YouTube Tech-Practice ~20 tok/s za Qwen2.5-Coder 7B) | Viša propusnost od baze M4 → obično brže na istom modelu | ~28–45 tok/s (CraftRigs, 128 GB test) | YouTube ~~26,8 tok/s u jednom CLI testu; širi raspon ~~18–40 u press materijalima (AOL) |
| ~14B Q4 | ~18–22 tok/s (CraftRigs) | Više unified RAM-a | ~18–22 tok/s (CraftRigs) | — |
| ~30–32B Q4 | 16 GB često premalo; 32 GB rubno | ~10–16 tok/s (vminstall, Like2Byte) | ~7–12 tok/s (CraftRigs) | YouTube ~19,6 tok/s u jednom „Qwen“ redu bench tablice (u transkriptu „330B“ — vjerojatna pogreška u govoru) |
| ~70B Q4_K_M | Na 32 GB ne | ~3–5 tok/s (r/LocalLLaMA, M4 Pro 64 GB) | ~4–8 tok/s (CraftRigs 128 GB Ubuntu) | — |
| gpt-oss ~20B (MoE) | Rijetko u istim izvorima | — | ~33–65 tok/s ovisno o runu (Nish Tahir) | YouTube ~22,4 tok/s |
| GPT-OSS ~120B (MoE) | Nije tipični Mac mini use-case | — | Nish Tahir — vrlo različite brzine ovisno o alatu i kontekstu | YouTube ~12,4 tok/s prosjek u bench UI-ju; dugi kontekst u tablici ruši brzinu |
Gdje kopati dublje: Tech-Practice — M4 i Ollama, usporedba M1/M3/M4, Ollamometer + Strix Halo, ETA Prime — EVO-X2, Tiiny hands-on; forumi: r/LocalLLaMA, Hacker News — Ollama vs LM Studio; blogovi: vminstall, Like2Byte, CraftRigs, Tom's Hardware. Za Tiiny arhitekturu: remio.ai.
Osvrt: vendori vs. ono što možete osjetiti
Apple ne objavljuje službene tok/s za Mac — što je iskreno: manje lažne preciznosti u katalogu, više ovisnosti o RAM tieru i backendu. GMKtec na stranici miješa TOPS, LM Studio usporedbe i popis modela po SKU-u — korisno kao što tvrtka želi prodati, ali kupnju ipak temeljite na neovisnim testovima i vlastitom promptu.
GMKtec u tablici „LLM support“ npr. veže 32B uz 64 GB, GPT-OSS 120B uz 96 GB, 70B uz 128 GB (plus drugi nazivi kao na njihovoj stranici) — to su marketinški parovi, ne jamstvo brzine niti kvalitete odgovora.
Tiinyjev marketing oko 120B gotovo uvijek znači MoE / poseban stack (TurboSparse, PowerInfer u njihovim materijalima). Tu nije riječ o tome je li startup u pravu — nego da „120B“ na kutiji ≠ isti problem kao gusti 120B u FP16.
Koji stroj za 30B, 70B i 120B?
~30B: Mac M4 Pro 64 GB je razuman Apple odabir; M4 32 GB je rubno. EVO-X2 s 64 GB SKU-om GMKtec formalno veže uz 32B klasu; 96/128 GB daje zalihe za KV. Tiiny (80 GB) ima smisla ako vam je džep + eksperiment važniji od predvidljivosti stolnog sustava.
~70B: M4 (max 32 GB) — ne za udoban Q4 rad. M4 Pro (64 GB) — ulazi u „može, ali ovisi o modelu i strpljenju“. EVO-X2 128 GB — najviše lemljenog RAM-a u ovoj trojci; GMKtec 70B navodi uz taj SKU. Tiiny — još premalo javnih stabilnih mjerenja da bismo ga stavili uz ova dva za produkcijski 70B.
~120B: Mac mini nije prirodno odredište za gusti 120B. EVO-X2 96 GB+ spominje GPT-OSS 120B — konkretan model, ne svaki zapis „120B“ na internetu. Tiiny — ista priča: točan model i kvant, ne slogan.
Exo klasteriranje
exo spaja više strojeva u klaster za inference (MLX na Apple Silicon, automatsko otkrivanje čvorova; README spominje i RDMA preko Thunderbolt 5 između Mac čvorova). To nije zamjena za Ollama na jednom stroju ako vam model već stane — Exo ima smisla kad šardirate ono što inače ne bi ušlo u memoriju.
| Uređaj | Exo danas (prema README-u) |
|---|---|
| Mac mini, macOS | Da — glavni službeni put s MLX / Metalom. Za RDMA klaster README traži da su čvorovi međusobno povezani — planirajte Thunderbolt / žičanu mrežu. |
| EVO-X2, Windows | Ne računajte na službeni Exo stack — Windows nije naveden kao platforma u README-u. |
| EVO-X2, Linux | Ograničeno: README kaže da Exo na Linuxu trenutno radi na CPU-u, a GPU podrška je u razvoju — Strix Halo iGPU ne ubrzava Exo na Linuxu dok to ne dođe. |
| Tiiny | Nepoznato — nije u Exo dokumentaciji; bez potvrde proizvođača / upstreama: ne planirati produkcijski Exo čvor. |
Heterogeni Mac + PC: backendi moraju sjediti; ovaj DEV tekst dobro ilustrira koliko MLX CUDA ring može zakomplicirati život. Ako Exo ne paše, llama.cpp RPC je drugačija arhitektura — ne ista stvar.
Pitanja koja iskaču uz Exo
Windows i Exo? README dokumentira macOS i Linux; za Windows tražite drugi stack ili dual-boot.
Je li Exo uvijek brži od jednog Mac minija? Ne — mrežna latencija i orkestracija koštaju. Ako model stane lokalno, jedan stroj je često ugodniji za chat.
Zamjenjuju li dva Mac minija jedan s 128 GB? Exo dijeli slojeve po čvorovima; ne stvara jedan kontinuirani unified RAM pool kao jedan M4 Max / Studio.
Mreža? README i praksa: žičano (Gigabit / 10GbE) ili Thunderbolt; Wi‑Fi je loš default za decode.
Zaključak
- Želite tišinu, macOS i predvidljiv stack — Mac mini; za ozbiljnije LLM-ove u Apple svijetu gledajte M4 Pro s što više unified memorije.
- Želite najviše lemljenog RAM-a u Windows mini PC-u — EVO-X2, uz svijest da su driveri i OS dio cijene ulaska.
- Želite portabilnost i rani pristup hardveru — Tiiny, uz Kickstarter rizik i potrebu za vlastitim provjerama kad uređaji stignu kupcima.
Metodologija: ANIM nije sam mjerio ove sustave. Članak spaja Apple i GMKtec dokumentaciju, Kickstarter/tiiny.ai, javne benchmarkove (YouTube, Reddit, blogovi), exo README i navedene analize. Prije kupnje provjerite žive cijene, PDV i carine te garanciju kod prodavača.
Povezani članci
Trebate pomoć s ovom temom?
ANIM nudi besplatnu procjenu za mala i srednja poduzeća u Hrvatskoj. Javite nam se i razgovarajmo o vašim potrebama.
Besplatna procjena