Cursiv.news Tecnologia · IA · Finanças
VRAM, CUDA, ROCm, preço e inferência local: as cinco placas que fazem mais sentido para rodar modelos de IA sem fingir que todo PC gamer virou datacenter.
15 tokens por segundo, 8 mil de contexto, modelos de 8B parâmetros. A física do hardware derruba o mito do substituto local do Claude.