收集全球10,000⁺个好用的AI软件
-
DELIFT是什么?一文让你看懂DELIFT的技术原理、主要功能、应用场景DELIFT概述简介 DELIFT(Data Efficient Language model Instruction Fine-Tuning)是基...
-
Flex3D是什么?一文让你看懂Flex3D的技术原理、主要功能、应用场景Flex3D概述简介 Flex3D是Meta的GenAI团队和牛津大学研究团队推出的创新的两阶段3D生成框架,能基于任意数量的高质量输入视图,解决从...
-
Frames是什么?一文让你看懂Frames的技术原理、主要功能、应用场景Frames概述简介 Frames是Runway推出的最新AI图像生成模型,在风格控制和视觉保真度方面取得巨大进步。Frames能维持风格一致性,支...
-
Fugatto是什么?一文让你看懂Fugatto的技术原理、主要功能、应用场景Fugatto概述简介 Fugatto是英伟达(NVIDIA)推出的音频合成和转换模型,全称为”Foundational Generative Au...
-
Find3D是什么?一文让你看懂Find3D的技术原理、主要功能、应用场景Find3D概述简介 Find3D是加州理工学院推出的3D部件分割模型,能根据任意文本查询分割任意对象的任何部分。Find3D用一个强大的数据引擎自...
-
Fancy123是什么?一文让你看懂Fancy123的技术原理、主要功能、应用场景Fancy123概述简介 Fancy123是华中科技大学和华南理工大学推出的3D网格生成技术,基于即插即用的变形技术从单张图片生成高质量的3D网格。...
-
Qwen2vl-Flux是什么?一文让你看懂Qwen2vl-Flux的技术原理、主要功能、应用场景Qwen2vl-Flux概述简介 Qwen2VL-Flux是多模态图像生成模型,结合Qwen2VL的视觉语言理解和FLUX框架,基于文本提示和图像参...
-
FlagevalMM是什么?一文让你看懂FlagevalMM的技术原理、主要功能、应用场景FlagevalMM概述简介 FlagEvalMM是北京智源人工智能研究院开源的多模态模型评测框架,能全面评估处理文本、图像、视频等多种模态的模型,...
-
NSFW Detector是什么?一文让你看懂NSFW Detector的技术原理、主要功能、应用场景NSFW Detector概述简介 NSFW Detector(Not Safe For Work,简称 NSFW)是开源的检测不适宜内容工具,NS...
-
MultiFoley是什么?一文让你看懂MultiFoley的技术原理、主要功能、应用场景MultiFoley概述简介 MultiFoley是Adobe Research和密歇根大学一起推出的音效生成系统,能基于文本、音频和视频的多模态控...
-
HiFiVFS是什么?一文让你看懂HiFiVFS的技术原理、主要功能、应用场景HiFiVFS概述简介 HiFiVFS(High Fidelity Video Face Swapping)是腾讯和VIVO公司推出的高保真视频换脸...
-
FullStack Bench是什么?一文让你看懂FullStack Bench的技术原理、主要功能、应用场景FullStack Bench概述简介 FullStack Bench是字节跳动豆包大模型团队与M-A-P社区联合推出的全新代码评估基准,专注于全栈...
-
Fish Speech 1.5是什么?一文让你看懂Fish Speech 1.5的技术原理、主要功能、应用场景Fish Speech 1.5概述简介 Fish Speech 1.5 是Fish Audio 推出的文本到语音(TTS)模型,基于深度学习技术如T...
-
Fox-1是什么?一文让你看懂Fox-1的技术原理、主要功能、应用场景Fox-1概述简介 Fox-1是TensorOpera推出的一系列小型语言大模型(SLMs),包括Fox-1-1.6B和Fox-1-1.6B-Ins...
-
GLM-4V-Flash是什么?一文让你看懂GLM-4V-Flash的技术原理、主要功能、应用场景GLM-4V-Flash概述简介 GLM-4V-Flash 是智谱AI推出的首个免费多模态模型API,GLM-4V-Flash 模型拥有图像描述生成...
-
Florence-VL是什么?一文让你看懂Florence-VL的技术原理、主要功能、应用场景Florence-VL概述简介 Florence-VL是创新的多模态大型语言大模型(MLLMs),是马里兰大学和微软研究院一起推出的。Florenc...
-
FineWeb 2是什么?一文让你看懂FineWeb 2的技术原理、主要功能、应用场景FineWeb 2概述简介 FineWeb 2是Hugging Face推出的多语言预训练数据集,覆盖超过1000种语言。FineWeb 2基于定制...
-
FLOAT是什么?一文让你看懂FLOAT的技术原理、主要功能、应用场景FLOAT概述简介 FLOAT是DeepBrain AI 和韩国先进科技研究院推出的音频驱动说话人头像生成模型,基于流匹配生成模型,学习运动潜在空间...
-
FreeScale是什么?一文让你看懂FreeScale的技术原理、主要功能、应用场景FreeScale概述简介 FreeScale是南洋理工大学、阿里集团和复旦大学推出无需微调的推理框架,提升预训练扩散模型生成高分辨率图像和视频的能...
-
Freestyler是什么?一文让你看懂Freestyler的技术原理、主要功能、应用场景Freestyler概述简介 Freestyler是西北工业大学计算机科学学院音频、语音与语言处理小组(ASLP@NPU)、微软及香港中文大学深圳研...