返回博客列表

腾讯 Marvis 跨应用案例拆解:Word、Excel、浏览器为什么开始被一个 AI 指令串起来了?

Marvis腾讯跨应用协同WordExcel浏览器AI 助手

Marvis 跨应用协同公开配图

如果说前几篇 Marvis 文章讨论的是:

  • 它能不能接管电脑
  • 它能不能读本地文件
  • 它能不能把图像、语音、文档揉成一条多模态工作流

那这一篇更想回答一个更接近“桌面 Agent”本质的问题:

Marvis 能不能不只帮你做一件事,而是把几款应用真正串成一整套流程?

我把腾讯云开发者社区那篇《Marvis保姆级教程(六·完结)|应用操作大师——一个指令串起Word、Excel、浏览器》重新过了一遍。我的结论很明确:

Marvis 在跨应用协同这条线上最值得看的,不是它会不会点按钮,而是它已经开始把 Excel、浏览器、Word、文件保存这些本来分散的动作,收成一个完整任务。

这件事一旦跑顺,意义就不再是“AI 会帮我写一段”,而是:

AI 终于开始替你串流程。

先说结论

  • 截至 2026 年 6 月 29 日,公开资料里,Marvis 在跨应用协同方向最有说服力的公开场景,集中在四步:

    1. Excel 读取与数据分析
    2. 浏览器检索参考信息
    3. Word 报告组织与写作
    4. 文件保存与归档
  • 这条线最关键的,不是“多开了几个窗口”,而是:

    • 数据能不能在应用之间连续流动
    • 中间能不能少复制粘贴
    • 结果能不能直接变成可交付文件
  • 如果你做的是:

    • 周报 / 月报
    • 教务 / 行政 / 教研
    • 运营分析
    • 轻量数据总结
    • 需要“读表 -> 查资料 -> 写报告”一条龙的人

    这条线的参考价值会比普通聊天型 AI 高很多。

为什么跨应用协同比“单点自动化”更值钱

很多 AI 助手今天已经能帮你:

  • 总结一段文字
  • 解释一个文件
  • 改写一封邮件

但真实工作最耗时间的部分,通常不是这些单点动作,而是:

  • Excel 里找数据
  • 切到浏览器搜参考
  • 再切到 Word 里写东西
  • 最后还得手动保存、命名、归档

也就是说,最浪费时间的往往不是“某一步不会做”,而是:

你得在不同软件之间来回搬运信息。

Marvis 在公开案例里最值得看的突破,就是它不再只帮你做某一步,而是开始试图:

把这些步骤收进一个总指令。

公开案例 1:成绩分析报告,最能看出它到底是不是“真 Agent”

腾讯云开发者社区那篇公开稿,给了一个特别适合拿来理解跨应用协同的例子:

任务场景

  • 做一份“本学期语文成绩分析报告”

传统流程

  • 打开 Excel
  • 找出成绩表
  • 手动算平均分、及格率、优秀率
  • 找出进步最大和退步最大的学生
  • 打开 Word
  • 写分析报告
  • Excel 复制数据表格到 Word
  • 打开浏览器搜一段范文参考
  • 对照着写完并调格式

公开稿件给的结论很直接:

  • 耗时:2 小时

这很真实。 因为真正花时间的并不只是“分析数据”,而是应用之间的切换和复制粘贴。

公开案例 2:Marvis 的做法,不是更快做一步,而是一个指令串四步

同一个场景里,公开稿件给出的 Marvis 指令非常像真实用户会说的话:

打开 D 盘成绩表.xlsx,统计分析这学期的语文成绩:计算班级平均分、及格率、优秀率,找出进步最大的 3 个学生和退步最大的 3 个学生。然后在网上搜索一篇小学语文成绩分析报告范文作为参考。最后打开 Word,新建一个文档,把分析结果写成一份 500 字左右的成绩分析报告,包含数据表格和文字分析,参考网上范文的框架。

公开稿件里,Marvis 依次完成的是:

  • 打开 Excel
  • 分析数据
  • 打开浏览器搜索范文
  • 打开 Word
  • 撰写报告
  • 插入数据表格

最后给出的公开口径是:

  • 耗时:3 分钟

我不会把这个数字机械当成任何人的稳定结果,但它足够说明产品想解决的方向:

不是提升单步效率,而是压缩整条应用切换链。

公开案例 3:最有价值的,不是“开了四个软件”,而是数据没有中途断掉

公开稿件里最关键的一句话,其实是这句:

Excel 算出来的数据直接带进 Word,不需要你手动复制粘贴。

这为什么重要?

因为很多所谓“AI 办公自动化”做来做去,最后还是会卡在这里:

  • 数据在一个软件里
  • 结果在另一个软件里
  • 你自己负责搬运

一旦还是要人工手动搬,这条链就没有真正闭环。

Marvis 在这个公开场景里最值得看的地方,就是它至少已经在公开口径上把这件事说清楚了:

  • 数据不是看完就丢
  • 检索不是搜完就结束
  • 报告不是从空白开始写
  • 文件也不是最后还要自己另存为

它在尝试做的是:

把应用间的数据流连续起来。

公开案例 4:跨应用协同的核心,不是“会打开软件”,而是“知道数据从哪来、往哪去”

这篇公开稿里,我很喜欢它对“跨应用指令”的一个解释:

让 Marvis 明确知道数据在哪个软件里,要流向哪个软件。

这句话其实把跨应用协同的核心说透了。

也就是说,真正高价值的指令不是:

  • 帮我打开这个软件

而是:

  • 打开 应用 A
  • 取出数据
  • 应用 B 做处理
  • 再在 应用 C 里输出结果

公开稿甚至已经把这种思路写成了模板:

  • 打开【应用 A】+ 做什么
  • 在【应用 B】+ 做什么
  • 在【应用 C】+ 输出结果

这就说明它已经不只是教你“怎么问”,而是在往:

流程模板化

走。

公开案例 5:这条线一旦模板化,就开始像真正的工作流资产

同一篇公开稿里,另一个很关键的点是:

月报模板工作流

作者给出的示例是:

  • 打开本月教研活动记录 Excel
  • 统计活动次数、参与人数、覆盖年级
  • 打开本月教学检查 Word
  • 提取共性问题
  • 再在 Word 里生成月报

这为什么重要?

因为一旦这类流程能重复跑,它就不再只是一个“聪明的助手”,而是开始变成:

可复用的工作流资产。

这对企业、学校、行政团队、轻运营团队都很关键,因为真正能提升效率的从来不是一次炫技,而是:

  • 下个月还能继续用
  • 别人也能继续用
  • 新人也能照着跑

公开案例 6:中间加“刹车点”,说明它开始考虑真实协作感

这篇公开稿里还有一个很像真实使用环境的细节:

  • 先在 Excel 里分析数据
  • 分析完先让我看一下结果
  • 确认后再在 Word 里写报告

这个设计为什么我特别看重?

因为真正的桌面 Agent,不应该只有“全自动”和“全手动”两个极端。

很多真实任务里,你需要的是:

  • 先自动跑一段
  • 在关键节点人工确认
  • 再继续往下走

这也是为什么我觉得,这条线更像“协作型 AI 工作流”,而不是单纯脚本自动化。

从这个公开案例里,我看到的真实生产环境长什么样

把这篇公开稿拆开看,Marvis 在跨应用协同方向里,已经有了比较典型的真实生产环境特征:

  • 有真实应用组合
    • Excel
    • 浏览器
    • Word
    • 文件系统
  • 有真实任务链
    • 读表
    • 算指标
    • 搜参考
    • 写报告
    • 存归档
  • 有真实人工介入点
    • 中间确认
  • 有真实复用可能
    • 模板化指令
    • 月报类重复流程

这就是为什么我觉得,它更像:

桌面级跨应用工作流协调器

而不是:

会操作一下某个软件的演示型 AI。

它现在最适合哪些人先试

适合马上试的人

  • 需要频繁处理 Excel -> Word 报告的人
  • 经常写周报、月报、分析材料的人
  • 教务、教研、行政、运营、项目助理类岗位
  • 需要网页参考 + 本地文档 + 报告输出一起跑的人
  • 想把重复桌面流程模板化的人

可以先观望的人

  • 只做纯聊天问答,不碰本地应用
  • 任务非常短,不需要跨软件切换
  • 对中间确认和模板化还没有需求的人
  • 只偶尔做一次报告,不需要复用流程的人

如果你想自己测,我建议这样测

  1. 不要先测“会不会开软件”,直接测完整任务。
  2. 最适合先试的切口通常是:
    • 成绩分析报告
    • 周报 / 月报
    • Excel 数据总结 + Word 输出
    • 网页范文参考 + 本地报告生成
    • 模板化重复流程
  3. 不只看它快不快,重点看:
    • 应用间切换有没有减少
    • 复制粘贴次数有没有下降
    • 数据有没有在链路里断掉
    • 结果是不是更接近“直接可交付”
  4. 如果你本来就在看桌面 AI,也可以顺手比较:
    • Marvis 更适合哪些跨应用任务
    • 哪些任务继续让脚本、RPA 或手工更稳

如果你现在更关心的是:怎样把腾讯系、GLM、Kimi、DeepSeek、StepFun 等模型统一接进自己的桌面工作流,可以先看:

最后结论

如果只用一句话总结我对 Marvis 这条跨应用协同路线的看法,那就是:

它真正有意思的,不是“会开 Word、Excel、浏览器”,而是它开始把这些软件之间本来断开的步骤收成了一条任务链。

一旦这件事做顺,价值就不再只是:

  • 帮你点一下
  • 帮你看一下
  • 帮你写一段

而是更接近:

  • 读数据
  • 查资料
  • 写报告
  • 存文件
  • 模板复用

也就是说,Marvis 这条线最值得测的,不是“会不会操作应用”,而是:

它能不能开始接管那些你每天都得在多个软件之间来回搬运的信息流。

参考资料