收集全球10,000⁺个好用的AI软件
-
豆包3D生成模型是什么?一文让你看懂豆包3D生成模型的技术原理、主要功能、应用场景豆包3D生成模型概述简介 豆包3D生成模型是豆包推出的3D生成模型,属于豆包大模型家族。模型基于3D-DiT 架构,能生成高质量 3D 模块。与火山...
-
MV-Adapter是什么?一文让你看懂MV-Adapter的技术原理、主要功能、应用场景MV-Adapter概述简介 MV-Adapter是多视图一致图像生成模型,是北京航空航天大学、VAST和上海交通大学的研究团队推出的。MV-Ada...
-
FACTS Grounding是什么?一文让你看懂FACTS Grounding的技术原理、主要功能、应用场景FACTS Grounding概述简介 FACTS Grounding是谷歌DeepMind推出的评估大型语言大模型(LLMs)能力的基准测试,衡量...
-
MarkItDown是什么?一文让你看懂MarkItDown的技术原理、主要功能、应用场景MarkItDown概述简介 MarkItDown是微软开源的多功能文档转换工具,能将PDF、PPT、Word、Excel、图像、音频、HTML等多...
-
EMMA-X是什么?一文让你看懂EMMA-X的技术原理、主要功能、应用场景EMMA-X概述简介 EMMA-X是新加坡科技设计大学推出的具有70亿参数的具身多模态动作模型,在有根据的链式思维(CoT)推理数据上微调OpenV...
-
WeaveFox是什么?一文让你看懂WeaveFox的技术原理、主要功能、应用场景WeaveFox概述简介 WeaveFox是蚂蚁团队推出的AI前端智能研发平台,基于蚂蚁自研的百灵多模态大模型,能直接根据设计图生成前端源代码。工具...
-
UniReal是什么?一文让你看懂UniReal的技术原理、主要功能、应用场景UniReal概述简介 UniReal是香港大学和Adobe研究院一起推出的框架,专注于实现多种图像生成和编辑任务。框架基于模拟现实世界动态,能在单...
-
X-AnyLabeling是什么?一文让你看懂X-AnyLabeling的技术原理、主要功能、应用场景X-AnyLabeling概述简介 X-AnyLabeling是集成多种深度学习算法的图像标注软件,专注于提升标注效率和精度。X-AnyLabeli...
-
Explorer是什么?一文让你看懂Explorer的技术原理、主要功能、应用场景Explorer概述简介 Explorer是Odyssey公司推出的生成性世界模型,能将任何图像转化为详细的3D世界。Explorer模型擅长生成真...
-
Gemini 2.0 Flash Thinking是什么?一文让你看懂Gemini 2.0 Flash Thinking的技术原理、主要功能、应用场景Gemini 2.0 Flash Thinking概述简介 Gemini 2.0 Flash Thinking 是谷歌最新发布的推理增强型 AI 模...
-
Genesis是什么?一文让你看懂Genesis的技术原理、主要功能、应用场景Genesis概述简介 Genesis是卡内基梅隆大学、马里兰大学、斯坦福大学、麻省理工学院等研究机构联合推出的开源生成式物理引擎,能模拟世界万物。...
-
AniDoc是什么?一文让你看懂AniDoc的技术原理、主要功能、应用场景AniDoc概述简介 AniDoc是香港科技大学、蚂蚁集团、南京大学、浙江大学和香港大学一起推出的简化2D动画上色AI大模型,基于视频扩散模型自动将...
-
ElevenLabs Flash是什么?一文让你看懂ElevenLabs Flash的技术原理、主要功能、应用场景ElevenLabs Flash概述简介 ElevenLabs Flash是ElevenLabs推出的低延迟语音合成模型,专为快速对话型AI设计。E...
-
OpenAI o3是什么?一文让你看懂OpenAI o3的技术原理、主要功能、应用场景OpenAI o3概述简介 OpenAI o3模型是继o1之后的新一代推理模型,包括o3和o3-mini两个版本。o3在某些条件下接近于通用人工智能...
-
StyleStudio是什么?一文让你看懂StyleStudio的技术原理、主要功能、应用场景StyleStudio概述简介 StyleStudio是西湖大学AI实验室、复旦大学、南洋理工大学和香港科技大学(广州)联合推出的,文本驱动的风格迁...
-
RWKV-7是什么?一文让你看懂RWKV-7的技术原理、主要功能、应用场景RWKV-7概述简介 RWKV-7是RWKV系列的最新大模型架构版本,超越了传统的attention和linear attention范式,具有更灵...
-
PromptWizard是什么?一文让你看懂PromptWizard的技术原理、主要功能、应用场景PromptWizard PromptWizard是微软推出的自动化提示优化框架,改进大型语言大模型(LLMs)在特定任务中的表现。基于自我演变和自...
-
INFP是什么?一文让你看懂INFP的技术原理、主要功能、应用场景INFP概述简介 INFP是音频驱动的头部生成框架,专为双人对话交互设计。能自动在对话音频引导下进行角色的转换,无需手动分配角色和角色切换。INFP...
-
VisionFM是什么?一文让你看懂VisionFM的技术原理、主要功能、应用场景VisionFM概述简介 VisionFM(伏羲慧眼)是多模态多任务的视觉基础模型,专为通用眼科人工智能而设计。通过预训练3.4百万张来自560,4...
-
MetaMorph是什么?一文让你看懂MetaMorph的技术原理、主要功能、应用场景MetaMorph概述简介 MetaMorph是多模态大模型(MLLM),通过指令微调(Instruction Tuning)实现视觉理解和生成。它...