Claude Design vs Google Stitch：用两个真实甲方项目，让两个 AI UI 工具正面打一架

Anthropic 的 Claude Design 和 Google 的 Stitch，是目前最被讨论的两个 AI 设计工具。我用两个真实甲方项目（一个 toC iOS 食材详情页，一个 toB 仓库后台）让它们正面打一架。同一份 prompt、首版直出、各两次迭代、7 个维度打分。第一题 36:25 Claude 完胜，第二题 34:32 几乎打平但方向不同。最后给出一套不需要二选一的「按场景挑工具」方案。

Anthropic 在 2026 年 4 月推出了 Claude Design（Opus 4.7 的视觉旗舰能力），Google 这边 Stitch 也在 3 月做了 2.0 大改版。两个工具都瞄准 AI UI 设计这个口子，但风格完全不同——一个走「写真代码 + 套品牌系统」，一个走「免费 + 多框架导出」。看参数对比意义不大，真正能决定选谁的是把它们丢进真实项目里跑。我手上正好有两个不同方向的甲方需求，于是做了这次正面对决。

01　纸面参数：两条不同的路

开打之前先看牌。Claude Design 走的是 Anthropic 一贯的「专业付费 + 真代码」路线：需要 Pro / Max / Team / Enterprise 订阅，没有免费版。换来的是实时可交互的 HTML 输出——不是设计稿，是真前端，Claude Code 能一键 handoff，自动读你的代码库 + 设计文件来建 Design System。

Google Stitch 走的是 「完全免费 + 多框架导出」路线：Google Labs beta，每天 400 credits，按复杂度扣。底层可以在 Gemini 3.1 Pro 和 3 Flash 之间切换。代码导出格式覆盖最广——HTML / Tailwind / React / Vue / Flutter / SwiftUI 都能导。

迭代方式上两家也完全不同：Claude 是 inline 评论 + 自动生成调节滑块，Stitch 是 Voice Canvas（语音对话）+ Annotate 注释 + 多屏 Play 预览。交付路径：Claude 主要走自家的 Claude Code 生态（含 Canva / PDF / PPTX 导出），Stitch 走的是 Figma 粘贴 + 多 IDE 集成（AI Studio、Antigravity、MCP server）。

纸面看下来 Stitch 在「免费 + 灵活」上有明显优势，Claude 在「真代码 + Design System」上更深。但这只是参数表，真正定胜负的是放到具体项目里跑出来什么。

02　比赛规则：三条死规矩 + 7 维度打分

为了让对比公平，我事先定了三条规矩，全程一字不改：

① 同一份 prompt 复制粘贴两次，不为任何一边特殊优化。② 首版直出，第一版决定基本印象，再各给两次迭代。③ 全程录屏，翻车不剪。加速可以，裁剪关键过程不行。

评分用 7 个维度：品牌一致性、信息层级、视觉吸引力、交互合理性、平台规范、状态传达、可直接交付。每个维度 5 分，两题各 35 分满分（最后总分按 ×2 算成 40 分制，方便快速看输赢）。

03　两道题面：一个 toC 一个 toB

Round 1：BEEBOX 食材详情页（iOS · toC）。用户碰 NFC 标签触发，看食材剩几天 → 问 AI 怎么做。布局要求：温度 → 食材主图 → 进度条 → AI 入口 → 三按钮 + Tab。视觉要求现代清新、食物诱人、浅色主调、大圆角、SF Pro 字体。状态色严格按 iOS 系统色：≥5 天绿、2-4 天黄、≤1 天红。约束是单手操作，临近过期要醒目但不刺眼。

Round 2：3PL 仓库可视化后台（Web · toB）。一屏看全库位、按客户筛、点位查详情、批量操作。桌面 1440×900 不滚动。布局：顶部 KPI → 左筛选 → 中网格 → 右详情 → 底部批量栏。网格 10 行 × 20 列，每格 60×60px，客户色块编码。视觉要求数据密集、专业冷静、中性色、弱化装饰。

第二题里我故意加了一个隐藏题：色盲友好——颜色 + 纹理双通道。看哪个工具会主动处理这个 accessibility 细节。

04　Round 1 准备：toC 场景考的是「诱人感」

C 端、移动端，考的不是好不好看——是用户想不想用。

这一题的核心元素：① Hero 食材主视觉 + 入箱日期；② 状态保质期进度条（绿/黄/红）；③ AI 入口浮动卡片（要会发光，让人想点）；④ 底部三按钮（拇指可触达）。

评分重点是品牌一致性、AI 人格的塑造、状态色的落地准确度。

05　Round 1 首版：同一 prompt，同时按下回车

首版直出。两个工具拿到同样的 prompt，第一版的差距已经很明显。

Claude Design 那张图：进度条颜色精确卡到 iOS 系统色，AI 入口卡片做了发光描边，整体气质就像一个有自己设计语言的真实 app；

Google Stitch 那张图：基础元素都齐了，构图也合理，但视觉语言更像 Material 模板的微调，少了那种「这是 BEEBOX 这个品牌」的辨识度。

06　Round 1 迭代：一样的修改，谁改得更对

我给两边发了同一组修改请求：① 进度条上方加一行「还能放 3 天」；② AI 引导文案换得更有趣、像在跟人说话。

Claude V2：进度条上方加了精确的剩余天数文字，文案直接改成口语化的拟人风（像在跟你说话），整体风格保持稳定，只动了该动的地方。

Stitch V2：剩余天数也加了，但加在了一个新的灰色 chip 里，破坏了原来的节奏感；AI 文案改了，但语气还是偏官方。局部精修能力上明显弱一档。

07　Round 1 打分：Claude 36 vs Stitch 25

7 个维度逐项打分：

品牌一致性 5:2、信息层级 4:4、视觉吸引力 3:4、交互合理性 5:4、iOS 规范 4:4、状态传达 5:4、可直接交付 5:3。

总分 Claude Design 36 / 40，Google Stitch 25 / 40。C 端「诱人感」场景，Claude 完胜——它同时把品牌、AI 人格、局部精修做对了。

Stitch 唯一赢的是「视觉吸引力」一项——它做的图本身漂亮，但拼到这个具体业务里，缺品牌识别、缺 iOS 系统色精度、缺细节迭代能力。

08　Round 2 准备：toB 场景考的是「数据密度」

B 端、Web 后台、数据密集。要的不是好看——是看得清、点得到、改得动。

核心是 10×20 的网格（每格 60px），骨架是顶部 KPI + 左筛选 + 右详情，约束是多客户色块 + 一屏不滚动。

隐藏题：色盲友好——颜色 + 纹理双通道。这条故意没强调，看哪边会主动处理。

09　Round 2 首版：真功夫藏在三个魔鬼细节里

这一题两边的图乍一看都不错，但真正的差距在三个细节：

魔鬼 01 网格密度：Claude 的格子尺寸严格按 60px 来；Stitch 把格子放大了，导致一屏装不下 200 格。

魔鬼 02 客户色系：Claude 给每个客户做了独立色系（同色相多明度），数据量再大也分得清；Stitch 用饱和度高的彩虹色，色多就乱。

魔鬼 03 色盲约束：Claude 主动给每个客户色块加了独立纹理（斜线、点阵、网格），双通道编码命中隐藏题；Stitch 完全跳过了这条——只用颜色区分，色盲用户看不出来。

10　Round 2 代码考验：能不能直接塞进 Next.js

光看图不算数，能跑的才叫「可直接交付」。我把两边的代码塞进了一个真实的 Next.js 项目。

Claude（React/JSX）：直接 PASS。组件已经拆好——<BinCell> 接 status 和 client.color 两个 props，用 bins.map 渲染整个 grid，开发拿到就能往 props 里塞数据。

Stitch（HTML+Tailwind）：PARTIAL。格子是用静态 HTML 硬编码 200 次写出来的（每个 bin 一个 div），需要开发自己重写成组件再上数据。能用，但是要返工。

这就是 Claude 「真代码」路线和 Stitch 「视觉导出」路线的核心差异——前者交付的是工程师能直接接手的东西，后者交付的是设计师的图加上代码壳。

11　Round 2 打分：34 vs 32，质量打平方向不同

7 个维度：品牌一致性 4:4、信息层级 5:4、视觉吸引力 4:4、交互合理性 4:4、Web 规范 4:4、状态传达 5:4、可直接交付 4:4。

总分 Claude 34 vs Stitch 32，这一题不是质量之争，是方向之争。

Claude 走深度：客户色系做得细致、命中色盲隐藏题、信息层级更清晰，但视觉风格偏专业冷峻。Stitch 走清爽：界面观感更现代轻盈、装饰留白更舒服，但少做了一些 B 端会要的工程细节。

12　总结：两题打完，到底该选谁

两题最终成绩：Round 1 BEEBOX 36 vs 25，Round 2 3PL WMS 34 vs 32。总分上 Claude 领先，但真正的选择不应该按总分来——应该按业务场景来。

选 Claude Design 的人：做垂直行业项目、客户要求多；需要真代码可直接交付给开发；有自己的品牌系统要套；愿意为 Pro / Max 订阅付费。

选 Google Stitch 的人：做通用场景、要多版方案给客户挑；看重清爽现代的视觉风格；主要走 Figma 设计交付路径；预算紧——它完全免费。

如果两类项目都有，把这两个工具同时挂在工作流里——按客户类型路由，比纠结「哪个更好」省事得多。

13　结语

真正决定胜负的不是模型本身，是你的项目类型。Claude Design 和 Google Stitch 不是替代关系，是分工关系——一个是「带工程能力的设计师」，一个是「能出多套方案的视觉助手」。做 toC 高品牌项目找 Claude，做 toB 数据密集型也找 Claude，做通用场景比稿、做免费快速出图找 Stitch。不要二选一，按场景挑工具。

01 纸面参数：两条不同的路

02 比赛规则：三条死规矩 + 7 维度打分

03 两道题面：一个 toC 一个 toB

04 Round 1 准备：toC 场景考的是「诱人感」

05 Round 1 首版：同一 prompt，同时按下回车

06 Round 1 迭代：一样的修改，谁改得更对

07 Round 1 打分：Claude 36 vs Stitch 25

08 Round 2 准备：toB 场景考的是「数据密度」

09 Round 2 首版：真功夫藏在三个魔鬼细节里

10 Round 2 代码考验：能不能直接塞进 Next.js

11 Round 2 打分：34 vs 32，质量打平方向不同

12 总结：两题打完，到底该选谁

13 结语