收集全球10,000⁺个好用的AI软件
        
        
        
       
        
        
        
        
    - 
                    
                        
                            OmniBooth是什么?一文让你看懂OmniBooth的技术原理、主要功能、应用场景OmniBooth概述简介 OmniBooth是华为诺亚方舟实验室和港科大研究团队一起推出的图像生成框架,支持基于文本提示或图像参考进行空间控制和实... - 
                    
                        
                            DynaMem是什么?一文让你看懂DynaMem的技术原理、主要功能、应用场景DynaMem概述简介 DynaMem是纽约大学和Hello Robot推出的动态空间语义记忆系统,专为开放世界中的移动操作设计。基于维护一个特征点... - 
                    
                        
                            MVPaint是什么?一文让你看懂MVPaint的技术原理、主要功能、应用场景MVPaint概述简介 MVPaint是腾讯PCG 、上海AI LAB、南洋理工大学S-Lab、清华大学一起推出的3D纹理生成框架,基于同步多视角扩... - 
                    
                        
                            LTX Video是什么?一文让你看懂LTX Video的技术原理、主要功能、应用场景LTX Video概述简介 LTX Video是Lightricks推出的开源AI视频生成模型,能在4秒内生成5秒的高质量视频,速度超过观看速度。基... - 
                    
                        
                            BALROG是什么?一文让你看懂BALROG的技术原理、主要功能、应用场景BALROG概述简介 BALROG是评估大型语言大模型(LLMs)和视觉语言大模型(VLMs)在游戏上的推理能力,特别是模型在动态环境中的规划、空间... - 
                    
                        
                            AutoVFX是什么?一文让你看懂AutoVFX的技术原理、主要功能、应用场景AutoVFX概述简介 AutoVFX是先进的物理特效框架,是伊利诺伊大学香槟分校研究团队推出的,能根据自然语言指令自动创建真实感和动态的视觉特效(... - 
                    
                        
                            Markdown-to-Image是什么?一文让你看懂Markdown-to-Image的技术原理、主要功能、应用场景Markdown-to-Image概述简介 Markdown-to-Image是开源的Markdown 转海报编辑器,作为React组件能将Mark... - 
                    
                        
                            TÜLU 3是什么?一文让你看懂TÜLU 3的技术原理、主要功能、应用场景TÜLU 3概述简介 TÜLU 3是艾伦人工智能研究所(Ai2)推出的一系列开源指令遵循模型,包括8B和70B两个版本,未来计划推出405B版本。模... - 
                    
                        
                            EchoMimicV2是什么?一文让你看懂EchoMimicV2的技术原理、主要功能、应用场景EchoMimicV2概述简介 EchoMimicV2是阿里蚂蚁集团推出的半身人体AI数字人项目,基于参考图片、音频剪辑和手部姿势序列生成高质量动画... - 
                    
                        
                            FlipSketch是什么?一文让你看懂FlipSketch的技术原理、主要功能、应用场景FlipSketch概述简介 FlipSketch 是萨里大学推出的创新系统,能将静态绘图转变为文本引导的草图动画。技术基于三个关键创新实现:微调草... - 
                    
                        
                            StoryTeller是什么?一文让你看懂StoryTeller的技术原理、主要功能、应用场景StoryTeller概述简介 StoryTeller是字节跳动、上海交通大学和北京大学一起推出的系统,能基于音频视觉角色识别技术改善长视频描述的质... - 
                    
                        
                            DELIFT是什么?一文让你看懂DELIFT的技术原理、主要功能、应用场景DELIFT概述简介 DELIFT(Data Efficient Language model Instruction Fine-Tuning)是基... - 
                    
                        
                            HART是什么?一文让你看懂HART的技术原理、主要功能、应用场景HART概述简介 HART(Hybrid Autoregressive Transformer)是麻省理工学院研究团队推出的自回归视觉生成模型。能直... - 
                    
                        
                            WebDreamer是什么?一文让你看懂WebDreamer的技术原理、主要功能、应用场景WebDreamer概述简介 WebDreamer是俄亥俄州立大学和Orby AI研究团队推出的基于模型规划的网络智能体,基于大型语言大模型(LLM... - 
                    
                        
                            Kandinsky-3是什么?一文让你看懂Kandinsky-3的技术原理、主要功能、应用场景Kandinsky-3概述简介 Kandinsky-3是基于潜在扩散模型的文本到图像(T2I)生成框架,支持高质量和逼真度在图像合成。Kandins... - 
                    
                        
                            CAVIA是什么?一文让你看懂CAVIA的技术原理、主要功能、应用场景CAVIA概述简介 CAVIA是苹果公司、得克萨斯大学奥斯汀分校、谷歌联合推出的多视角视频生成框架,能将单一输入图像转换成多个时空一致的视频序列。框... - 
                    
                        
                            Flex3D是什么?一文让你看懂Flex3D的技术原理、主要功能、应用场景Flex3D概述简介 Flex3D是Meta的GenAI团队和牛津大学研究团队推出的创新的两阶段3D生成框架,能基于任意数量的高质量输入视图,解决从... - 
                    
                        
                            EvolveDirector是什么?一文让你看懂EvolveDirector的技术原理、主要功能、应用场景EvolveDirector概述简介 EvolveDirector是阿里巴巴和南洋理工大学联合推出的创新框架,用公开资源和高级模型的API接口训练一... - 
                    
                        
                            MCP是什么?一文让你看懂MCP的技术原理、主要功能、应用场景MCP概述简介 MCP(Model Context Protocol,模型上下文协议)是一个开放协议,是Anthropic开源的,能实现大型语言大模... - 
                    
                        
                            LazyGraphRAG是什么?一文让你看懂LazyGraphRAG的技术原理、主要功能、应用场景LazyGraphRAG概述简介 LazyGraphRAG是微软研究院推出的图形增强生成增强检索(RAG)框架,是GraphRAG的迭代版本。Laz...