国产大模型 - 标签 - DeepBlog 博客

DeepSeek V4 Pro、GLM-5.1、MiniMax M2.7：国产三大模型前端生成网页真实测评

2026年，国产大模型卷出了新高度。MiniMax-M2.7、GLM-5.1、DeepSeek V4 Pro，三家都拿出了看家本领。但开发者面临的问题没变：到底选哪个？参数跑分网上到处都是，但前端生成这种真实场景的对比，几乎没人做过。这次我用 Claude Code 2.1.144 最新版，分别接入三款模型，用完全相同的提示词，看谁生成的页面最好用。...

2026-05-21 09:39 • AI编程 • 浏览 964

DeepSeek-V4-Pro vs GLM-5.1：实测两款热门大模型谁更适合AI编程

DeepSeek推出V4系列预览版，将1M上下文设为官方服务标配，旗舰版DeepSeek-V4-Pro推理能力追平顶级闭源模型。近期智谱发布的GLM-5.1也宣称代码能力对标顶级海外大模型，作者开展三个前端开发场景实测，还邀请专业点评，对比了两款模型的表现差异。...

2026-04-27 08:34 • 开源生态 • 浏览 1330

全球OpenClaw用量第一的模型竟是国产？MiniMax M2.5深度实测

国产MiniMax M2.5模型在OpenRouter和OpenClaw使用量登顶全球。该模型在编程、工具调用等生产力场景达到SOTA水平，SWE-Bench Verified得分80.2%，且具备Spec架构设计能力。实测显示，其极速版响应速度提升1.5-2倍，成本仅需0.3-1美元/小时。作者通过Claude Code和OpenClaw接入M2.5，成功开发知网文献插件、个人读书站点、Markdown阅读器及数据可视化工具，验证了其代码生成、多语言适配和复杂任务处理能力。...

2026-04-16 15:19 • 养龙虾 • 浏览 250

国产大模型编程能力登顶全球：GLM-5.1与Qwen3.6-Plus双杀，价格仅为GPT九分之一

智谱GLM-5.1与阿里Qwen3.6-Plus相继发布，在编程能力上实现全球领先。GLM-5.1在SWE-bench Pro榜单以58.4%成绩位居开源模型第一，超越Claude Opus 4.5和GPT-5.4；Qwen3.6-Plus则在Terminal-Bench 2.0和OmniDocBench双榜夺冠，中文编程场景表现突出。更关键的是价格优势，Qwen3.6-Plus调用成本仅为GPT-5.4的九分之一...

2026-04-15 20:37 • AI资讯 • 浏览 232

OpenClaw部署风险预警：数据出境、责任黑洞与合规生存指南

核心风险点包括：依赖境外模型导致数据违规出境；AI自主行为引发的责任归属问题，使用者需承担替代责任；利用其提供对外服务可能因算法未备案而构成非法经营；以及开源版本混乱带来的供应链安全与后门隐患。为合规使用，文章提出了四项关键原则：优先采用已备案的国产大模型实现数据闭环；实施权限最小化与沙箱隔离；建立高风险操作的人机回环审核机制；以及对输入数据进行严格脱敏与隔离处理。...

2026-03-27 16:13 • AI资讯 • 浏览 225