收集全球10,000⁺个好用的AI软件
-
MIP-Adapter是什么?一文让你看懂MIP-Adapter的技术原理、主要功能、应用场景MIP-Adapter概述简介 MIP-Adapter是一种个性化图像生成技术,由阿里集团推出并开源。基于IP-Adapter模型,进一步扩展其能力...
-
CapsWriter-Offline是什么?一文让你看懂CapsWriter-Offline的技术原理、主要功能、应用场景CapsWriter-Offline概述简介 CapsWriter-Offline是一款高效的PC端离线语音输入和字幕转录工具,支持用户通过简单的按...
-
HelloBench是什么?一文让你看懂HelloBench的技术原理、主要功能、应用场景HelloBench概述简介 HelloBench是一个用于评估大型语言大模型(LLMs)长文本生成能力的开源基准测试。HelloBench包含五个...
-
VirtualWife是什么?一文让你看懂VirtualWife的技术原理、主要功能、应用场景VirtualWife概述简介 VirtualWife是一个创新的虚拟数字人项目,专注于开发具有AI的虚拟角色。角色设计用于在B站等直播平台上进行互...
-
MMSearch是什么?一文让你看懂MMSearch的技术原理、主要功能、应用场景MMSearch概述简介 MMSearch是一个用于评估大型多模态模型(LMMs)作为AI搜索引擎能力的基准测试。包括一个MMSearch-Engi...
-
anime.gf是什么?一文让你看懂anime.gf的技术原理、主要功能、应用场景anime.gf概述简介 Anime.gf 是一个开源的本地应用程序,支持用户创建和互动自己的虚拟角色。工具提供一个用户友好的界面,用户与各种具有独...
-
ChopperBot是什么?一文让你看懂ChopperBot的技术原理、主要功能、应用场景ChopperBot概述简介 ChopperBot是一款智能化的直播视频剪辑和发布机器人,ChopperBot能自动化地管理和分发直播内容。支持多个...
-
FineZip是什么?一文让你看懂FineZip的技术原理、主要功能、应用场景FineZip概述简介 FineZip 是一种基于大型语言大模型(LLMs)的无损文本压缩系统,结合在线记忆和动态上下文大小技术,提高文本压缩的速度...
-
Depth Pro是什么?一文让你看懂Depth Pro的技术原理、主要功能、应用场景Depth Pro概述简介 Depth Pro是苹果公司开发的一种先进的单目深度估计模型,能从单个2D图像快速生成高分辨率的3D深度图。模型不仅速度...
-
VideoLingo是什么?一文让你看懂VideoLingo的技术原理、主要功能、应用场景VideoLingo概述简介 VideoLingo 是一款一键全自动视频翻译工具,能将视频进行字幕切割、翻译、对齐和配音,最终生成 Netflix ...
-
CatVTON是什么?一文让你看懂CatVTON的技术原理、主要功能、应用场景CatVTON概述简介 CatVTON是一种先进的虚拟试衣技术,由中山大学和Pixocial联合推出。基于轻量化的架构和高效的训练策略,实现高质量的...
-
ScribbleDiff是什么?一文让你看懂ScribbleDiff的技术原理、主要功能、应用场景ScribbleDiff概述简介 ScribbleDiff是一种先进的文本到图像生成技术,基于用户简单涂鸦的视觉提示指导图像的生成过程。通过分析涂鸦...
-
Boow-VTON是什么?一文让你看懂Boow-VTON的技术原理、主要功能、应用场景Boow-VTON概述简介 Boow-VTON是阿里巴巴推出的一种先进的虚拟试衣技术。能在野外场景中实现高质量的虚拟试衣效果,无需依赖精确的遮罩或修...
-
LiveKit Agents是什么?一文让你看懂LiveKit Agents的技术原理、主要功能、应用场景LiveKit Agents概述简介 LiveKit Agents 是一个强大的框架,用于创建能实时通过语音、视频和数据与用户互动的多模态AI代理。...
-
Matryoshka Diffusion Models是什么?一文让你看懂Matryoshka Diffusion Models的技术原理、主要功能、应用场景Matryoshka Diffusion Models概述简介 Matryoshka Diffusion Models(MDM)是苹果公司推出的一种...
-
IFAdapter是什么?一文让你看懂IFAdapter的技术原理、主要功能、应用场景IFAdapter概述简介 IFAdapter是一种新型的文本到图像生成模型,由腾讯和新加坡国立大学一起推出。提升生成含有多个实例的图像时的位置和特...
-
TinyVLA是什么?一文让你看懂TinyVLA的技术原理、主要功能、应用场景TinyVLA概述简介 TinyVLA是一种面向机器人操控的视觉-语言-动作(VLA)模型,由华东师范大学和上海大学团队推出。针对现有VLA模型的不...
-
Inverse Painting是什么?一文让你看懂Inverse Painting的技术原理、主要功能、应用场景Inverse Painting概述简介 Inverse Painting 是一种AI技术,由华盛顿大学的开发人员推出,能逆向重现绘画过程。通过分析...
-
Playground v3是什么?一文让你看懂Playground v3的技术原理、主要功能、应用场景Playground v3概述简介 Playground v3(PGv3)是由Playground Research推出的最新文本到图像模型,基于深...
-
Reverb ASR是什么?一文让你看懂Reverb ASR的技术原理、主要功能、应用场景Reverb ASR概述简介 Reverb ASR是Rev公司推出的开源自动语音识别和说话人分离模型,基于20万小时的人工转录英语数据训练而成。模型...