Chromex

Chromex 用一种极其克制、安全且全能的方式，证明了未来的 AI 浏览器助手该有的样子：侧边栏优先、多模态融合、本地主权掌控。

收录时间：

2026-05-17

市面上给浏览器加 AI 助手的工具不少，但大多数要么把 API Key 存在扩展存储里（安全隐患），要么只能泛泛聊天（不懂你在看什么）。最近体验的 Chromex（github.com/GENEXIS-AI/chromex）在架构和体验上做了几件非常”反常识”的事。

一、本地桥接：密钥绝不上云，扩展里”零秘密”

Chromex 最大的工程亮点是它的三层本地桥接架构：

plain

Chrome 扩展 → Native Messaging Host → 本地桥接服务 → Codex app-server

这意味着你的 OpenAI OAuth 令牌、API Key、ChatGPT Session 全由本地 Codex CLI 处理，扩展本身不存储任何凭证。对比那些把 Key 存在 chrome.storage 里的插件，这从根本上消除了扩展被脱库后的密钥泄露风险。官方甚至把 “No secrets in the extension bundle” 写进了 README 标题。

Chromex 网站截图

二、页面上下文 + 视觉路由：它真知道你正在看什么

Chromex 不是浮层弹窗，而是 Chrome MV3 原生的 Side Panel（侧边栏），常驻在浏览器右侧。它支持两种内容读取策略：

DOM 路由：直接解析页面结构，提取文字、表格、链接
Vision 路由：对当前页面或选中区域截图，用视觉模型理解

这意味着你可以选中一段论文里的公式，右键”Ask Chromex”，它会结合上下文解释；也可以同时 @ 选多个打开的标签页，让它帮你对比三篇新闻稿的差异。甚至对 YouTube 视频，它能读取当前时间戳上下文并执行跳转操作。

三、从”聊天”到”执行”：Plan Mode + 浏览器控制

很多 AI 插件止于问答，Chromex 则支持通过 Chrome Content Scripts 直接控制浏览器——点击、滚动、填表，且会在页面上显示可见的活动指示器，让你知道 AI 正在操作哪里。

更实用的是 Plan Mode：当你输入一个模糊指令（比如”帮我整理这页资料”），它不会直接瞎干，而是先给你列出一个可编辑的执行计划，确认后再分步操作。这种”先对齐、再动手”的设计，大幅降低了多步骤任务的翻车率。

四、多模态工作流：语音、图片、文档全打通

Chromex 的附件支持相当全面：图片、PDF、DOCX、CSV、XLSX 都能直接拖进侧边栏分析。它还支持：

语音输入：实时语音或转录模式，解放双手
图片编辑：基于 Codex 图像工作流生成或修改图片，预览保存在本地
实时翻译/转录模式：开启后自动捕获页面音频或麦克风输入，实时转录并可选实时翻译，转录历史还能作为后续对话的上下文

五、站点感知：不同网站，不同策略

Chromex 内置了针对不同站点的适配器：YouTube、新闻站、arXiv、邮件、协作工具、笔记软件、甚至韩国本土工作服务。打开不同页面时，侧边栏会自动推荐最相关的操作（比如看论文时推荐”总结方法部分”，看邮件时推荐”起草回复”）。这种”场景化智能”比通用聊天体验高出一个维度。

适合谁用？

对安全敏感的技术/金融从业者：本地凭证管理 + 最小权限请求
重度浏览器研究者：需要同时对比多标签页、分析论文、总结视频
多语言工作者：15+ 语言 UI 支持 + 实时翻译转录
不想把数据交给 SaaS 的隐私主义者：开源、MIT 协议、可自托管

一句话总结：Chromex 用”本地桥接”解决了 AI 浏览器插件的安全顽疾，用”页面上下文 + 多模态 + 浏览器控制”解决了”AI 不懂我在看什么”的体验顽疾。如果你已经在用 Codex CLI，这几乎是当前把它和浏览器结合得最好的方案。

暂无评论

暂无评论...

Chromex

一、本地桥接：密钥绝不上云，扩展里”零秘密”

二、页面上下文 + 视觉路由：它真知道你正在看什么

三、从”聊天”到”执行”：Plan Mode + 浏览器控制

四、多模态工作流：语音、图片、文档全打通

五、站点感知：不同网站，不同策略

适合谁用？

相关导航

Edit Mind

Bazaart

Topfreeprompts

BRIA RMBG

Shepherd

Conductor

WebDev Arena

Codev

暂无评论

加入收藏夹

设为首页

网址

厂长资源

读漫屋

拷贝漫画

SoBooks

磁力多

追剧狂人

热门网站推荐

Chromex

一、本地桥接：密钥绝不上云，扩展里”零秘密”

二、页面上下文 + 视觉路由：它真知道你正在看什么

三、从”聊天”到”执行”：Plan Mode + 浏览器控制

四、多模态工作流：语音、图片、文档全打通

五、站点感知：不同网站，不同策略

适合谁用？

相关导航

Edit Mind

Bazaart

Topfreeprompts

BRIA RMBG

Shepherd

Conductor

WebDev Arena

Codev

暂无评论

加入收藏夹

设为首页

网址

厂长资源

读漫屋

拷贝漫画

SoBooks

磁力多

追剧狂人

热门网站推荐

标签云