收集全球10,000⁺个好用的AI软件
-
TPDM是什么?一文让你看懂TPDM的技术原理、主要功能、应用场景TPDM概述简介 TPDM(Time Prediction Diffusion Model)是西湖大学MAPLE实验室、南方科技大学、北京大学及西湖...
-
ConsisID是什么?一文让你看懂ConsisID的技术原理、主要功能、应用场景ConsisID概述简介 ConsisID是北京大学和鹏城实验室等机构推出的文本到视频(Text-to-Video, IPT2V)生成模型,基于频率...
-
Perplexideez是什么?一文让你看懂Perplexideez的技术原理、主要功能、应用场景Perplexideez概述简介 Perplexideez是本地AI助手,支持用户在网络和自托管应用中快速搜索信息。Perplexideez项目以P...
-
Micro LLAMA是什么?一文让你看懂Micro LLAMA的技术原理、主要功能、应用场景Micro LLAMA概述简介 Micro LLAMA是精简的教学版LLAMA 3模型实现,能帮助学习者理解大型语言大模型架构。整个项目仅约180行...
-
GenCast是什么?一文让你看懂GenCast的技术原理、主要功能、应用场景GenCast概述简介 GenCast是DeepMind推出的革命性AI气象预测模型,基于扩散模型技术,提供长达15天的全球天气预报。GenCast...
-
FullStack Bench是什么?一文让你看懂FullStack Bench的技术原理、主要功能、应用场景FullStack Bench概述简介 FullStack Bench是字节跳动豆包大模型团队与M-A-P社区联合推出的全新代码评估基准,专注于全栈...
-
Motion Prompting是什么?一文让你看懂Motion Prompting的技术原理、主要功能、应用场景Motion Prompting概述简介 Motion Prompting是 Google DeepMind、密歇根大学和布朗大学联合推出的视频生成...
-
Fish Speech 1.5是什么?一文让你看懂Fish Speech 1.5的技术原理、主要功能、应用场景Fish Speech 1.5概述简介 Fish Speech 1.5 是Fish Audio 推出的文本到语音(TTS)模型,基于深度学习技术如T...
-
ClearerVoice-Studio是什么?一文让你看懂ClearerVoice-Studio的技术原理、主要功能、应用场景ClearerVoice-Studio概述简介 ClearerVoice-Studio 是阿里巴巴达摩院通义实验室开源的语音处理框架,集成语音增强、...
-
PaliGemma 2是什么?一文让你看懂PaliGemma 2的技术原理、主要功能、应用场景PaliGemma 2概述简介 PaliGemma 2是Google DeepMind基于Gemma 2语言大模型家族推出的新一代视觉语言大模型(V...
-
Optimus-1是什么?一文让你看懂Optimus-1的技术原理、主要功能、应用场景Optimus-1概述简介 Optimus-1是哈尔滨工业大学(深圳)和鹏城实验室推出的智能体框架,能解决在开放世界环境中完成长期任务的挑战。框架结...
-
Fox-1是什么?一文让你看懂Fox-1的技术原理、主要功能、应用场景Fox-1概述简介 Fox-1是TensorOpera推出的一系列小型语言大模型(SLMs),包括Fox-1-1.6B和Fox-1-1.6B-Ins...
-
Llama 3.3是什么?一文让你看懂Llama 3.3的技术原理、主要功能、应用场景Llama 3.3概述简介 Llama 3.3是Meta AI推出的70B 参数模型,大型多语言预训练语言大模型,性能与40B参数的Llama 3....
-
Aurora是什么?一文让你看懂Aurora的技术原理、主要功能、应用场景Aurora概述简介 Aurora是xAI为AI助手Grok新增的图像生成模型。Aurora擅长创建逼真的图像,擅长人物肖像。Aurora能生成包括...
-
One Shot, One Talk是什么?一文让你看懂One Shot, One Talk的技术原理、主要功能、应用场景One Shot, One Talk概述简介 One Shot, One Talk是先进的图像生成技术,能从单张图片中生成具有个性化细节的全身动态说...
-
GLM-4V-Flash是什么?一文让你看懂GLM-4V-Flash的技术原理、主要功能、应用场景GLM-4V-Flash概述简介 GLM-4V-Flash 是智谱AI推出的首个免费多模态模型API,GLM-4V-Flash 模型拥有图像描述生成...
-
clone-voice是什么?一文让你看懂clone-voice的技术原理、主要功能、应用场景clone-voice概述简介 Clone-voice是开源的声音克隆工具,基于深度学习技术分析和模拟人类声音,实现声音的高质量克隆。工具支持包括中...
-
SNOOPI是什么?一文让你看懂SNOOPI的技术原理、主要功能、应用场景SNOOPI概述简介 SNOOPI是创新的文本到图像生成框架,基于增强单步扩散模型的指导提升模型性能和控制力。SNOOPI包括PG-SB(适当指导 ...
-
MEMO是什么?一文让你看懂MEMO的技术原理、主要功能、应用场景MEMO概述简介 MEMO(Memory-Guided EMOtionaware diffusion)是Skywork AI、南洋理工大学和新加坡国...
-
NVILA是什么?一文让你看懂NVILA的技术原理、主要功能、应用场景NVILA概述简介 NVILA是NVIDIA推出的系列视觉语言大模型,能平衡效率和准确性。模型用“先扩展后压缩”策略,有效处理高分辨率图像和长视频。...