Playwright MCP
GitHub - microsoft/playwright-mcp
Playwright MCP 是 Microsoft 提供的一个 MCP Server,用来把 浏览器自动化能力 暴露给 AI 编程助手。
和传统“截图 + 视觉识别 + 猜按钮”的方式相比,它更偏结构化:主要依赖 Playwright 提供的页 面可访问性树和浏览器能力,让 AI 直接做导航、点击、输入、截图、抓日志、看网络请求这些动作。
我理解它适合的场景有三类:
- 让 AI 在真实浏览器里复现问题
- 做带状态的网页操作或测试
- 跑需要多轮观察、再决策、再操作的 agent 工作流
核心特点
1. 不是纯视觉自动化
它的一个关键点是:优先走结构化页面信息,而不是纯靠截图理解页面。
这样做的好处:
- 更稳定,少一点“看错按钮”
- 更省模型成本,不一定依赖视觉模型
- 更适合需要连续多步推理的场景
2. 浏览器能力比较完整
常见能力基本都覆盖了:
- 页面导航
- 点击、输入、拖拽等交互
- 截图
- 读取控制台日志
- 观察网络请求
- 保存 trace / video
如果是做页面排查、自动化回归、表单流转这类任务,已经够用了。