功能

首页 > 功能

TPDM是什么？一文让你看懂TPDM的技术原理、主要功能、应用场景

TPDM概述简介 TPDM（Time Prediction Diffusion Model）是西湖大学MAPLE实验室、南方科技大学、北京大学及西湖...
ConsisID是什么？一文让你看懂ConsisID的技术原理、主要功能、应用场景

ConsisID概述简介 ConsisID是北京大学和鹏城实验室等机构推出的文本到视频（Text-to-Video, IPT2V）生成模型，基于频率...
Perplexideez是什么？一文让你看懂Perplexideez的技术原理、主要功能、应用场景

Perplexideez概述简介 Perplexideez是本地AI助手，支持用户在网络和自托管应用中快速搜索信息。Perplexideez项目以P...
Micro LLAMA是什么？一文让你看懂Micro LLAMA的技术原理、主要功能、应用场景

Micro LLAMA概述简介 Micro LLAMA是精简的教学版LLAMA 3模型实现，能帮助学习者理解大型语言大模型架构。整个项目仅约180行...
GenCast是什么？一文让你看懂GenCast的技术原理、主要功能、应用场景

GenCast概述简介 GenCast是DeepMind推出的革命性AI气象预测模型，基于扩散模型技术，提供长达15天的全球天气预报。GenCast...
FullStack Bench是什么？一文让你看懂FullStack Bench的技术原理、主要功能、应用场景

FullStack Bench概述简介 FullStack Bench是字节跳动豆包大模型团队与M-A-P社区联合推出的全新代码评估基准，专注于全栈...
Motion Prompting是什么？一文让你看懂Motion Prompting的技术原理、主要功能、应用场景

Motion Prompting概述简介 Motion Prompting是 Google DeepMind、密歇根大学和布朗大学联合推出的视频生成...
Fish Speech 1.5是什么？一文让你看懂Fish Speech 1.5的技术原理、主要功能、应用场景

Fish Speech 1.5概述简介 Fish Speech 1.5 是Fish Audio 推出的文本到语音（TTS）模型，基于深度学习技术如T...
ClearerVoice-Studio是什么？一文让你看懂ClearerVoice-Studio的技术原理、主要功能、应用场景

ClearerVoice-Studio概述简介 ClearerVoice-Studio 是阿里巴巴达摩院通义实验室开源的语音处理框架，集成语音增强、...
PaliGemma 2是什么？一文让你看懂PaliGemma 2的技术原理、主要功能、应用场景

PaliGemma 2概述简介 PaliGemma 2是Google DeepMind基于Gemma 2语言大模型家族推出的新一代视觉语言大模型（V...
Optimus-1是什么？一文让你看懂Optimus-1的技术原理、主要功能、应用场景

Optimus-1概述简介 Optimus-1是哈尔滨工业大学（深圳）和鹏城实验室推出的智能体框架，能解决在开放世界环境中完成长期任务的挑战。框架结...
Fox-1是什么？一文让你看懂Fox-1的技术原理、主要功能、应用场景

Fox-1概述简介 Fox-1是TensorOpera推出的一系列小型语言大模型（SLMs），包括Fox-1-1.6B和Fox-1-1.6B-Ins...
Llama 3.3是什么？一文让你看懂Llama 3.3的技术原理、主要功能、应用场景

Llama 3.3概述简介 Llama 3.3是Meta AI推出的70B 参数模型，大型多语言预训练语言大模型，性能与40B参数的Llama 3....
Aurora是什么？一文让你看懂Aurora的技术原理、主要功能、应用场景

Aurora概述简介 Aurora是xAI为AI助手Grok新增的图像生成模型。Aurora擅长创建逼真的图像，擅长人物肖像。Aurora能生成包括...
One Shot, One Talk是什么？一文让你看懂One Shot, One Talk的技术原理、主要功能、应用场景

One Shot, One Talk概述简介 One Shot, One Talk是先进的图像生成技术，能从单张图片中生成具有个性化细节的全身动态说...
GLM-4V-Flash是什么？一文让你看懂GLM-4V-Flash的技术原理、主要功能、应用场景

GLM-4V-Flash概述简介 GLM-4V-Flash 是智谱AI推出的首个免费多模态模型API，GLM-4V-Flash 模型拥有图像描述生成...
clone-voice是什么？一文让你看懂clone-voice的技术原理、主要功能、应用场景

clone-voice概述简介 Clone-voice是开源的声音克隆工具，基于深度学习技术分析和模拟人类声音，实现声音的高质量克隆。工具支持包括中...
SNOOPI是什么？一文让你看懂SNOOPI的技术原理、主要功能、应用场景

SNOOPI概述简介 SNOOPI是创新的文本到图像生成框架，基于增强单步扩散模型的指导提升模型性能和控制力。SNOOPI包括PG-SB（适当指导 ...
MEMO是什么？一文让你看懂MEMO的技术原理、主要功能、应用场景

MEMO概述简介 MEMO（Memory-Guided EMOtionaware diffusion）是Skywork AI、南洋理工大学和新加坡国...
NVILA是什么？一文让你看懂NVILA的技术原理、主要功能、应用场景

NVILA概述简介 NVILA是NVIDIA推出的系列视觉语言大模型，能平衡效率和准确性。模型用“先扩展后压缩”策略，有效处理高分辨率图像和长视频。...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL