功能

首页 > 功能

豆包3D生成模型是什么？一文让你看懂豆包3D生成模型的技术原理、主要功能、应用场景

豆包3D生成模型概述简介豆包3D生成模型是豆包推出的3D生成模型，属于豆包大模型家族。模型基于3D-DiT 架构，能生成高质量 3D 模块。与火山...
MV-Adapter是什么？一文让你看懂MV-Adapter的技术原理、主要功能、应用场景

MV-Adapter概述简介 MV-Adapter是多视图一致图像生成模型，是北京航空航天大学、VAST和上海交通大学的研究团队推出的。MV-Ada...
FACTS Grounding是什么？一文让你看懂FACTS Grounding的技术原理、主要功能、应用场景

FACTS Grounding概述简介 FACTS Grounding是谷歌DeepMind推出的评估大型语言大模型（LLMs）能力的基准测试，衡量...
MarkItDown是什么？一文让你看懂MarkItDown的技术原理、主要功能、应用场景

MarkItDown概述简介 MarkItDown是微软开源的多功能文档转换工具，能将PDF、PPT、Word、Excel、图像、音频、HTML等多...
EMMA-X是什么？一文让你看懂EMMA-X的技术原理、主要功能、应用场景

EMMA-X概述简介 EMMA-X是新加坡科技设计大学推出的具有70亿参数的具身多模态动作模型，在有根据的链式思维（CoT）推理数据上微调OpenV...
WeaveFox是什么？一文让你看懂WeaveFox的技术原理、主要功能、应用场景

WeaveFox概述简介 WeaveFox是蚂蚁团队推出的AI前端智能研发平台，基于蚂蚁自研的百灵多模态大模型，能直接根据设计图生成前端源代码。工具...
UniReal是什么？一文让你看懂UniReal的技术原理、主要功能、应用场景

UniReal概述简介 UniReal是香港大学和Adobe研究院一起推出的框架，专注于实现多种图像生成和编辑任务。框架基于模拟现实世界动态，能在单...
X-AnyLabeling是什么？一文让你看懂X-AnyLabeling的技术原理、主要功能、应用场景

X-AnyLabeling概述简介 X-AnyLabeling是集成多种深度学习算法的图像标注软件，专注于提升标注效率和精度。X-AnyLabeli...
Explorer是什么？一文让你看懂Explorer的技术原理、主要功能、应用场景

Explorer概述简介 Explorer是Odyssey公司推出的生成性世界模型，能将任何图像转化为详细的3D世界。Explorer模型擅长生成真...
Gemini 2.0 Flash Thinking是什么？一文让你看懂Gemini 2.0 Flash Thinking的技术原理、主要功能、应用场景

Gemini 2.0 Flash Thinking概述简介 Gemini 2.0 Flash Thinking 是谷歌最新发布的推理增强型 AI 模...
Genesis是什么？一文让你看懂Genesis的技术原理、主要功能、应用场景

Genesis概述简介 Genesis是卡内基梅隆大学、马里兰大学、斯坦福大学、麻省理工学院等研究机构联合推出的开源生成式物理引擎，能模拟世界万物。...
AniDoc是什么？一文让你看懂AniDoc的技术原理、主要功能、应用场景

AniDoc概述简介 AniDoc是香港科技大学、蚂蚁集团、南京大学、浙江大学和香港大学一起推出的简化2D动画上色AI大模型，基于视频扩散模型自动将...
ElevenLabs Flash是什么？一文让你看懂ElevenLabs Flash的技术原理、主要功能、应用场景

ElevenLabs Flash概述简介 ElevenLabs Flash是ElevenLabs推出的低延迟语音合成模型，专为快速对话型AI设计。E...
OpenAI o3是什么？一文让你看懂OpenAI o3的技术原理、主要功能、应用场景

OpenAI o3概述简介 OpenAI o3模型是继o1之后的新一代推理模型，包括o3和o3-mini两个版本。o3在某些条件下接近于通用人工智能...
StyleStudio是什么？一文让你看懂StyleStudio的技术原理、主要功能、应用场景

StyleStudio概述简介 StyleStudio是西湖大学AI实验室、复旦大学、南洋理工大学和香港科技大学（广州）联合推出的，文本驱动的风格迁...
RWKV-7是什么？一文让你看懂RWKV-7的技术原理、主要功能、应用场景

RWKV-7概述简介 RWKV-7是RWKV系列的最新大模型架构版本，超越了传统的attention和linear attention范式，具有更灵...
PromptWizard是什么？一文让你看懂PromptWizard的技术原理、主要功能、应用场景

PromptWizard PromptWizard是微软推出的自动化提示优化框架，改进大型语言大模型（LLMs）在特定任务中的表现。基于自我演变和自...
INFP是什么？一文让你看懂INFP的技术原理、主要功能、应用场景

INFP概述简介 INFP是音频驱动的头部生成框架，专为双人对话交互设计。能自动在对话音频引导下进行角色的转换，无需手动分配角色和角色切换。INFP...
VisionFM是什么？一文让你看懂VisionFM的技术原理、主要功能、应用场景

VisionFM概述简介 VisionFM（伏羲慧眼）是多模态多任务的视觉基础模型，专为通用眼科人工智能而设计。通过预训练3.4百万张来自560,4...
MetaMorph是什么？一文让你看懂MetaMorph的技术原理、主要功能、应用场景

MetaMorph概述简介 MetaMorph是多模态大模型（MLLM），通过指令微调（Instruction Tuning）实现视觉理解和生成。它...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL