收集全球10,000⁺个好用的AI软件
-
CogVideoX-Flash是什么?一文让你看懂CogVideoX-Flash的技术原理、主要功能、应用场景CogVideoX-Flash概述简介 CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型,继承CogVideoX自研的端到端视频...
-
Uni-AdaFocus是什么?一文让你看懂Uni-AdaFocus的技术原理、主要功能、应用场景Uni-AdaFocus概述简介 Uni-AdaFocus是清华大学自动化系的研究团队推出的通用的高效视频理解框架,框架通过自适应聚焦机制,动态调整...
-
GameFactory是什么?一文让你看懂GameFactory的技术原理、主要功能、应用场景GameFactory概述简介 GameFactory 是香港大学和快手科技联合提出的创新框架,解决游戏视频生成中的场景泛化难题。框架基于预训练的视...
-
FramePainter是什么?一文让你看懂FramePainter的技术原理、主要功能、应用场景FramePainter概述简介 FramePainter 是基于 AI 的交互式图像编辑工具,通过结合视频扩散模型和直观的草图控制,让用户能通过简...
-
3DIS-FLUX是什么?一文让你看懂3DIS-FLUX的技术原理、主要功能、应用场景3DIS-FLUX概述简介 3DIS-FLUX是基于深度学习的多实例生成框架,通过解耦实例合成实现高质量的图像生成。结合3DIS框架的深度驱动场景构...
-
VideoChat-Flash是什么?一文让你看懂VideoChat-Flash的技术原理、主要功能、应用场景VideoChat-Flash概述简介 VideoChat-Flash 是上海人工智能实验室和南京大学等机构联合开发的针对长视频建模的多模态大语言大...
-
FilmAgent是什么?一文让你看懂FilmAgent的技术原理、主要功能、应用场景FilmAgent概述简介 FilmAgent是哈尔滨工业大学(深圳)的研究团队开发的基于多智能体协作框架的虚拟电影制作工具,通过自动化流程实现虚拟...
-
Fast3R是什么?一文让你看懂Fast3R的技术原理、主要功能、应用场景Fast3R概述简介 Fast3R是Meta和密歇根大学的开发人员提出的新型的多视图3D重建方法,基于Transformer架构,能在一个前向传播过...
-
OCRmyPDF是什么?一文让你看懂OCRmyPDF的技术原理、主要功能、应用场景OCRmyPDF概述简介 OCRmyPDF 是开源的命令行工具,专为将扫描的 PDF 文件转换为可搜索、可复制的文档。通过添加 OCR 文本层,将无...
-
DynamicFace是什么?一文让你看懂DynamicFace的技术原理、主要功能、应用场景DynamicFace概述简介 DynamicFace是小红书团队推出新型的视频换脸技术,技术通过结合扩散模型和即插即用的时间层,基于3D面部先验知...
-
RAG-FiT是什么?一文让你看懂RAG-FiT的技术原理、主要功能、应用场景RAG-FiT概述简介 RAG-FiT(曾用名RAG Foundry)是英特尔实验室推出的开源框架,用在微调(fine-tuning)增强大型语言大...
-
FluxSR是什么?一文让你看懂FluxSR的技术原理、主要功能、应用场景FluxSR概述简介 FluxSR是新型的单步扩散模型,是上海交通大学、哈佛大学、华南理工大学和华为诺亚方舟实验室推出的专门用在真实世界图像超分辨率...
-
FireRedASR是什么?一文让你看懂FireRedASR的技术原理、主要功能、应用场景FireRedASR概述简介 FireRedASR 是小红书开源的工业级自动语音识别(ASR)模型家族,支持普通话、中文方言和英语,在普通话 ASR...
-
DynVFX是什么?一文让你看懂DynVFX的技术原理、主要功能、应用场景DynVFX概述简介 DynVFX是创新的视频增强技术,能根据简单的文本指令将动态内容无缝集成到真实视频中。通过结合预训练的文本到视频扩散模型和视觉...
-
FlashVideo是什么?一文让你看懂FlashVideo的技术原理、主要功能、应用场景FlashVideo概述简介 FlashVideo是字节跳动团队提出的高效的高分辨率视频生成框架,通过两阶段方法解决了传统单阶段扩散模型在高分辨率视...
-
PDF to Podcast是什么?一文让你看懂PDF to Podcast的技术原理、主要功能、应用场景PDF to Podcast概述简介 PDF to Podcast是NVIDIA推出的PDF转音频的AI工具,基于NVIDIA NIM微服务架构的,...
-
AuraFusion360是什么?一文让你看懂AuraFusion360的技术原理、主要功能、应用场景AuraFusion360概述简介 AuraFusion360是用于360°无边界场景修复的新型基于参考的方法,主要用于虚拟现实和建筑可视化等领域的...
-
Data Formulator是什么?一文让你看懂Data Formulator的技术原理、主要功能、应用场景Data Formulator概述简介 Data Formulator是微软研究院推出的开源 AI 驱动的数据可视化工具,帮助用户通过简单交互和指令...
-
Magic 1-For-1是什么?一文让你看懂Magic 1-For-1的技术原理、主要功能、应用场景Magic 1-For-1概述简介 Magic 1-For-1是北京大学、Hedra Inc. 和 Nvidia 推出的高效视频生成模型,基于优化内...
-
FoloUp是什么?一文让你看懂FoloUp的技术原理、主要功能、应用场景FoloUp概述简介 FoloUp 是开源的AI语音面试平台,能帮助企业高效地进行招聘面试。FoloUp能根据职位描述自动生成定制化的面试问题,基于...