llm
an archive of posts in this category
| Mar 21, 2026 | MNN 任务实测:七个模型,三个梯队 |
|---|---|
| Mar 21, 2026 | MiMo-V2-Pro 测评:同一模型,两种结局 |
| Mar 20, 2026 | 如何设计端侧高性能 Tokenizer?MNN 重构实践与思考 |
| Mar 02, 2026 | Qwen3.5 端侧小模型测评:从 0.8B 到 9B |
| Feb 16, 2026 | MNN 模型支持:Qwen3.5 |
| Feb 02, 2026 | XGuard安全模型:评测与MNN部署 |
| Jan 19, 2026 | STEM:用“Embedding”替代“up_proj” |
| Dec 16, 2025 | jinja.cpp:为什么我要手写一个 Jinja2 编译器 |
| Dec 09, 2025 | LLM Super Weight 实测:剪枝降智与量化思考 |
| Nov 04, 2025 | LLM训练实战手册 |
| Nov 04, 2025 | 大模型训练深度实录:从SmolLM看LLM研发的理论与现实 |
| Oct 24, 2025 | MNN模型支持:Qwen3-VL |
| Sep 25, 2025 | 一图读懂Qwen |
| Sep 10, 2025 | Qwen3-Next:下一代MoE模型架构解析 |
| Sep 05, 2025 | MNN模型支持:面壁小钢炮MiniCPM-V-4 |
| Sep 02, 2025 | 端侧LLM硬件系列(一):内存带宽 |
| Aug 18, 2025 | CoreML踩坑记:慎用Conv1D |
| Aug 08, 2025 | 深入 gpt-oss-20b 架构:MNN 移动端性能实践 |
| Aug 05, 2025 | 混元端侧模型分析 |
| Oct 11, 2023 | mlc-llm android 测试 |
| Aug 03, 2023 | 基于tiny-llama2训练 |