escherize · April 24, 2026 11:49
diff --git a/2026-04-24-local-llms-on-m4-max-64gb.md b/2026-04-24-local-llms-on-m4-max-64gb.md
Model	LM Studio search	RAM	Notes
`unsloth/Qwen3.6-35B-A3B-UD-MLX-4bit`	Qwen3.6 35B	~22GB	MoE: 35B total, 3B active. Flagship quality at 3B latency.
`unsloth/Qwen3.6-27B-UD-MLX-6bit`	Qwen3.6 27B	~22-24GB	Dense 27B. Near-lossless at 6-bit. "Flagship-level coding" per HN.
`unsloth/Qwen3-Coder-30B-A3B-Instruct-MLX-4bit`	Qwen3-Coder 30B	~18-20GB	Coding-specialized MoE. Native tool-call support.
Model	LM Studio search	RAM
`unsloth/Qwen3.6-27B-MLX-8bit`	Qwen3.6 27B 8bit	~28-30GB
`unsloth/Qwen3.6-35B-A3B-MLX-8bit`	Qwen3.6 35B 8bit	~32GB
Task	Tool
Architectural changes, planning, multi-file refactors	Claude Code (real Claude)
Boilerplate, small edits, docstrings, test scaffolds	Cline + local Qwen3-Coder
Chat / brainstorm / rubber-duck	LM Studio chat UI with Qwen3.6-35B-A3B
Offline / on a plane / confidential codebase	Claude Code → LM Studio (Option 1)
Model	LM Studio search	RAM
`huihui-ai/Huihui-Qwen3.5-35B-A3B-abliterated`	Huihui Qwen3.5 35B	~22GB @ 4bit
`huihui-ai/Qwen3-30B-A3B-abliterated`	Huihui Qwen3 30B	~18-20GB
`huihui_ai/qwen3-coder-abliterated:30b`	Qwen3 Coder abliterated	~18-20GB
`huihui-ai/Huihui-Qwen3-VL-30B-A3B-Instruct-abliterated`	(vision + uncensored)	~20GB