市面上给浏览器加 AI 助手的工具不少,但大多数要么把 API Key 存在扩展存储里(安全隐患),要么只能泛泛聊天(不懂你在看什么)。最近体验的
Chromex(github.com/GENEXIS-AI/chromex)在架构和体验上做了几件非常”反常识”的事。
一、本地桥接:密钥绝不上云,扩展里”零秘密”
Chromex 最大的工程亮点是它的三层本地桥接架构:
Chrome 扩展 → Native Messaging Host → 本地桥接服务 → Codex app-server
这意味着你的 OpenAI OAuth 令牌、API Key、ChatGPT Session 全由本地 Codex CLI 处理,扩展本身不存储任何凭证。对比那些把 Key 存在 chrome.storage 里的插件,这从根本上消除了扩展被脱库后的密钥泄露风险。官方甚至把 “No secrets in the extension bundle” 写进了 README 标题。

Chromex 网站截图
二、页面上下文 + 视觉路由:它真知道你正在看什么
Chromex 不是浮层弹窗,而是 Chrome MV3 原生的 Side Panel(侧边栏),常驻在浏览器右侧。它支持两种内容读取策略:
这意味着你可以选中一段论文里的公式,右键”Ask Chromex”,它会结合上下文解释;也可以同时 @ 选多个打开的标签页,让它帮你对比三篇新闻稿的差异。甚至对 YouTube 视频,它能读取当前时间戳上下文并执行跳转操作。
三、从”聊天”到”执行”:Plan Mode + 浏览器控制
很多 AI 插件止于问答,Chromex 则支持通过 Chrome Content Scripts 直接控制浏览器——点击、滚动、填表,且会在页面上显示可见的活动指示器,让你知道 AI 正在操作哪里。
更实用的是 Plan Mode:当你输入一个模糊指令(比如”帮我整理这页资料”),它不会直接瞎干,而是先给你列出一个可编辑的执行计划,确认后再分步操作。这种”先对齐、再动手”的设计,大幅降低了多步骤任务的翻车率。
四、多模态工作流:语音、图片、文档全打通
Chromex 的附件支持相当全面:图片、PDF、DOCX、CSV、XLSX 都能直接拖进侧边栏分析。它还支持:
五、站点感知:不同网站,不同策略
Chromex 内置了针对不同站点的适配器:YouTube、新闻站、arXiv、邮件、协作工具、笔记软件、甚至韩国本土工作服务。打开不同页面时,侧边栏会自动推荐最相关的操作(比如看论文时推荐”总结方法部分”,看邮件时推荐”起草回复”)。这种”场景化智能”比通用聊天体验高出一个维度。
适合谁用?
-
对安全敏感的技术/金融从业者:本地凭证管理 + 最小权限请求
-
重度浏览器研究者:需要同时对比多标签页、分析论文、总结视频
-
多语言工作者:15+ 语言 UI 支持 + 实时翻译转录
-
不想把数据交给 SaaS 的隐私主义者:开源、MIT 协议、可自托管
一句话总结:Chromex 用”本地桥接”解决了 AI 浏览器插件的安全顽疾,用”页面上下文 + 多模态 + 浏览器控制”解决了”AI 不懂我在看什么”的体验顽疾。如果你已经在用 Codex CLI,这几乎是当前把它和浏览器结合得最好的方案。