Project Mariner是什么?一文让你看懂Project Mariner的技术原理、主要功能、应用场景

来源:卓商AI
发布时间:2025-04-05

Project Mariner概述简介

Project Mariner 是谷歌 DeepMind 推出的浏览器助手。Project Mariner基于 Gemini 2.0 技术,用 Chrome 扩展程序实现浏览器自动化,理解和执行网页任务。Project Mariner能理解和推理浏览器屏幕上的信息,包括像素和网页元素,基于 Chrome 扩展程序使用这些信息完成任务。Project Mariner 能控制 Chrome 浏览器、移动屏幕上的光标、点击按钮和填写表格,像人类一样使用和浏览网站。Project Mariner在 WebVoyager 基准测试中达到 83.5% 的高分成绩。目前,Project Mariner 只能在浏览器的活动选项卡中执行键入、滚动和点击操作,在执行某些敏感操作(如购买物品)之前,会要求用户进行最终确认。

Project Mariner的功能特色

多模态理解:理解浏览器屏幕上的所有内容,包括像素、文本、代码、图像和表单等数据。

浏览器交互:实时导航和操作复杂的网站,自动执行浏览器中的任务,保持用户的控制权。

自动化任务:自动与浏览器进行交互操作,将数据整理、填充到网页其他区域,同时将数据按照用户的要求整理好。

复杂指令处理:理解、执行复杂的用户指令,分解为可执行的步骤。

关系理解:理解不同网页元素之间的关系及其功能。

视觉反馈:在执行任务时提供视觉反馈和更新,让用户了解进度。

安全性:在执行敏感操作(如购物和付款)之前,会要求用户进行最终确认,确保安全性。

如何使用Project Mariner

Project Mariner目前处于早期测试阶段,仅对少数测试者开放,访问Project Mariner的官方网站,加入等候名单。

Project Mariner能做什么?

数据整理与复制:将网页上的数据复制到电子表格中进行整理,例如从存储大量数据的网页提取信息,整理到Excel等表格软件中。

在线购物:根据用户给出的购物清单,自动在电子商务网站上搜索商品添加到购物车。

旅行规划:帮助用户查找航班和酒店信息,自动化旅行规划过程中的网页浏览和信息比较。

日常购物:为用户在零售网站上购物,如搜索、购买家庭用品。

食谱查找:在食谱网站上根据用户需求自动搜索和选择食谱。

© 版权声明:本站所有原创文章版权均归卓商AI工具集及原创作者所有,未经允许任何个人、媒体、网站不得转载或以其他方式抄袭本站任何文章。
卓商AI
卓商AI

AI爱好者的一站式人工智能AI工具箱,累计收录全球10,000⁺好用的AI工具软件和网站,方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用,力争做全球排名前三的AI网址导航网站,欢迎您成为我们的一员。

猜你喜欢
  • BackPack
    BackPack BackPack是一个创新的音乐创作平台,允许用户将他们的图片和视频通过Discord转换成歌曲。它提供了一个独特的方式,让用户可以将自己的社交媒体帖...
  • FLUX.1-dev-LoRA-Text-Poster
    FLUX.1-dev-LoRA-Text-Poster FLUX.1-dev-LoRA-Text-Poster是由Shakker-Labs开发的文本到图像生成模型,专门用于艺术文本海报的生成。该模型利用Lo...
  • sayme ai
    sayme ai sayme.ai是一种多功能的AI工具,它使用文本进行语音技术来提供100多种语言的专业配音服务。对于需要高质量和准确叙述的任何项目,它是500多个可...
  • Qwen2.5-Coder-0.5B
    Qwen2.5-Coder-0.5B Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,该系列模型通过增加训练令牌至...
  • 伏羲AIPPT
    伏羲AIPPT 伏羲AIPPT是一款集成了AI技术的产品,能够一键生成PPT、思维导图、专业写作和学术论文。它利用先进的人工智能算法,帮助用户快速完成文档的创建和编辑...
  • Edits
    Edits Edits 是 Instagram 推出的视频创作应用,专为创作者设计。它集成了多种强大的视频编辑工具,支持单帧精度编辑、AI 动画、绿幕背景替换等功...
  • ReportPDF
    ReportPDF ReportPDF是一个可以将CSV文件生成PDF报告的工具。它可以快速将您的数据转化为报告,支持的文件格式包括XLS、XLSX和CSV。您可以通过拖...
  • UI2Code AI
    UI2Code AI UI2Code AI是一款基于先进AI技术的在线工具,能够将UI设计图像快速转换为多种编程语言的代码。它极大地提高了开发效率,减少了手动编码的时间和成...