Yaklaşık ramin %75 kadarını gpu'ya offload edecek şekilde LLM çalıştırabilirsiniz, sonrası swap olarak diske yazılacağı için sıkıntı. Geleneksel bilgisayarların aksine mac minilerin birleşik ram yapısı sayesinde gpu cpu npu belleğe aynı anda erişebildiği için token açısından f/p bir cihaz, base...