llm | Zhaode's blog

Mar 21, 2026	MNN 任务实测：七个模型，三个梯队
Mar 21, 2026	MiMo-V2-Pro 测评：同一模型，两种结局
Mar 20, 2026	如何设计端侧高性能 Tokenizer？MNN 重构实践与思考
Mar 02, 2026	Qwen3.5 端侧小模型测评：从 0.8B 到 9B
Feb 16, 2026	MNN 模型支持：Qwen3.5
Feb 02, 2026	XGuard安全模型：评测与MNN部署
Jan 19, 2026	STEM：用“Embedding”替代“up_proj”
Dec 16, 2025	jinja.cpp：为什么我要手写一个 Jinja2 编译器
Dec 09, 2025	LLM Super Weight 实测：剪枝降智与量化思考
Nov 04, 2025	LLM训练实战手册
Nov 04, 2025	大模型训练深度实录：从SmolLM看LLM研发的理论与现实
Oct 24, 2025	MNN模型支持：Qwen3-VL
Sep 25, 2025	一图读懂Qwen
Sep 10, 2025	Qwen3-Next：下一代MoE模型架构解析
Sep 05, 2025	MNN模型支持：面壁小钢炮MiniCPM-V-4
Sep 02, 2025	端侧LLM硬件系列（一）：内存带宽
Aug 18, 2025	CoreML踩坑记：慎用Conv1D
Aug 08, 2025	深入 gpt-oss-20b 架构：MNN 移动端性能实践
Aug 05, 2025	混元端侧模型分析
Oct 11, 2023	mlc-llm android 测试
Aug 03, 2023	基于tiny-llama2训练