F

首页 > F

CogVideoX-Flash是什么？一文让你看懂CogVideoX-Flash的技术原理、主要功能、应用场景

CogVideoX-Flash概述简介 CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型，继承CogVideoX自研的端到端视频...
Uni-AdaFocus是什么？一文让你看懂Uni-AdaFocus的技术原理、主要功能、应用场景

Uni-AdaFocus概述简介 Uni-AdaFocus是清华大学自动化系的研究团队推出的通用的高效视频理解框架，框架通过自适应聚焦机制，动态调整...
GameFactory是什么？一文让你看懂GameFactory的技术原理、主要功能、应用场景

GameFactory概述简介 GameFactory 是香港大学和快手科技联合提出的创新框架，解决游戏视频生成中的场景泛化难题。框架基于预训练的视...
FramePainter是什么？一文让你看懂FramePainter的技术原理、主要功能、应用场景

FramePainter概述简介 FramePainter 是基于 AI 的交互式图像编辑工具，通过结合视频扩散模型和直观的草图控制，让用户能通过简...
3DIS-FLUX是什么？一文让你看懂3DIS-FLUX的技术原理、主要功能、应用场景

3DIS-FLUX概述简介 3DIS-FLUX是基于深度学习的多实例生成框架，通过解耦实例合成实现高质量的图像生成。结合3DIS框架的深度驱动场景构...
VideoChat-Flash是什么？一文让你看懂VideoChat-Flash的技术原理、主要功能、应用场景

VideoChat-Flash概述简介 VideoChat-Flash 是上海人工智能实验室和南京大学等机构联合开发的针对长视频建模的多模态大语言大...
FilmAgent是什么？一文让你看懂FilmAgent的技术原理、主要功能、应用场景

FilmAgent概述简介 FilmAgent是哈尔滨工业大学（深圳）的研究团队开发的基于多智能体协作框架的虚拟电影制作工具，通过自动化流程实现虚拟...
Fast3R是什么？一文让你看懂Fast3R的技术原理、主要功能、应用场景

Fast3R概述简介 Fast3R是Meta和密歇根大学的开发人员提出的新型的多视图3D重建方法，基于Transformer架构，能在一个前向传播过...
OCRmyPDF是什么？一文让你看懂OCRmyPDF的技术原理、主要功能、应用场景

OCRmyPDF概述简介 OCRmyPDF 是开源的命令行工具，专为将扫描的 PDF 文件转换为可搜索、可复制的文档。通过添加 OCR 文本层，将无...
DynamicFace是什么？一文让你看懂DynamicFace的技术原理、主要功能、应用场景

DynamicFace概述简介 DynamicFace是小红书团队推出新型的视频换脸技术，技术通过结合扩散模型和即插即用的时间层，基于3D面部先验知...
RAG-FiT是什么？一文让你看懂RAG-FiT的技术原理、主要功能、应用场景

RAG-FiT概述简介 RAG-FiT（曾用名RAG Foundry）是英特尔实验室推出的开源框架，用在微调（fine-tuning）增强大型语言大...
FluxSR是什么？一文让你看懂FluxSR的技术原理、主要功能、应用场景

FluxSR概述简介 FluxSR是新型的单步扩散模型，是上海交通大学、哈佛大学、华南理工大学和华为诺亚方舟实验室推出的专门用在真实世界图像超分辨率...
FireRedASR是什么？一文让你看懂FireRedASR的技术原理、主要功能、应用场景

FireRedASR概述简介 FireRedASR 是小红书开源的工业级自动语音识别（ASR）模型家族，支持普通话、中文方言和英语，在普通话 ASR...
DynVFX是什么？一文让你看懂DynVFX的技术原理、主要功能、应用场景

DynVFX概述简介 DynVFX是创新的视频增强技术，能根据简单的文本指令将动态内容无缝集成到真实视频中。通过结合预训练的文本到视频扩散模型和视觉...
FlashVideo是什么？一文让你看懂FlashVideo的技术原理、主要功能、应用场景

FlashVideo概述简介 FlashVideo是字节跳动团队提出的高效的高分辨率视频生成框架，通过两阶段方法解决了传统单阶段扩散模型在高分辨率视...
PDF to Podcast是什么？一文让你看懂PDF to Podcast的技术原理、主要功能、应用场景

PDF to Podcast概述简介 PDF to Podcast是NVIDIA推出的PDF转音频的AI工具，基于NVIDIA NIM微服务架构的，...
AuraFusion360是什么？一文让你看懂AuraFusion360的技术原理、主要功能、应用场景

AuraFusion360概述简介 AuraFusion360是用于360°无边界场景修复的新型基于参考的方法，主要用于虚拟现实和建筑可视化等领域的...
Data Formulator是什么？一文让你看懂Data Formulator的技术原理、主要功能、应用场景

Data Formulator概述简介 Data Formulator是微软研究院推出的开源 AI 驱动的数据可视化工具，帮助用户通过简单交互和指令...
Magic 1-For-1是什么？一文让你看懂Magic 1-For-1的技术原理、主要功能、应用场景

Magic 1-For-1概述简介 Magic 1-For-1是北京大学、Hedra Inc. 和 Nvidia 推出的高效视频生成模型，基于优化内...
FoloUp是什么？一文让你看懂FoloUp的技术原理、主要功能、应用场景

FoloUp概述简介 FoloUp 是开源的AI语音面试平台，能帮助企业高效地进行招聘面试。FoloUp能根据职位描述自动生成定制化的面试问题，基于...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL