收集全球10,000⁺个好用的AI软件
        
        
        
       
        
        
        
        
    - 
                    
                         FreeScale是什么?一文让你看懂FreeScale的技术原理、主要功能、应用场景FreeScale概述简介 FreeScale是南洋理工大学、阿里集团和复旦大学推出无需微调的推理框架,提升预训练扩散模型生成高分辨率图像和视频的能... FreeScale是什么?一文让你看懂FreeScale的技术原理、主要功能、应用场景FreeScale概述简介 FreeScale是南洋理工大学、阿里集团和复旦大学推出无需微调的推理框架,提升预训练扩散模型生成高分辨率图像和视频的能...
- 
                    
                         Freestyler是什么?一文让你看懂Freestyler的技术原理、主要功能、应用场景Freestyler概述简介 Freestyler是西北工业大学计算机科学学院音频、语音与语言处理小组(ASLP@NPU)、微软及香港中文大学深圳研... Freestyler是什么?一文让你看懂Freestyler的技术原理、主要功能、应用场景Freestyler概述简介 Freestyler是西北工业大学计算机科学学院音频、语音与语言处理小组(ASLP@NPU)、微软及香港中文大学深圳研...
- 
                    
                         SnapGen是什么?一文让你看懂SnapGen的技术原理、主要功能、应用场景SnapGen概述简介 SnapGen是Snap Inc、香港科技大学、墨尔本大学等机构联合推出的文本到图像(T2I)扩散模型,能在移动设备上快速生... SnapGen是什么?一文让你看懂SnapGen的技术原理、主要功能、应用场景SnapGen概述简介 SnapGen是Snap Inc、香港科技大学、墨尔本大学等机构联合推出的文本到图像(T2I)扩散模型,能在移动设备上快速生...
- 
                    
                         CosyVoice 2.0是什么?一文让你看懂CosyVoice 2.0的技术原理、主要功能、应用场景CosyVoice 2.0概述简介 CosyVoice 2.0 是阿里巴巴通义实验室推出的CosyVoice语音生成大模型升级版,模型用有限标量量化... CosyVoice 2.0是什么?一文让你看懂CosyVoice 2.0的技术原理、主要功能、应用场景CosyVoice 2.0概述简介 CosyVoice 2.0 是阿里巴巴通义实验室推出的CosyVoice语音生成大模型升级版,模型用有限标量量化...
- 
                    
                         Megrez-3B-Omni是什么?一文让你看懂Megrez-3B-Omni的技术原理、主要功能、应用场景Megrez-3B-Omni概述简介 Megrez-3B-Omni是无问芯穹推出的全球首个端侧全模态理解开源模型,能处理图像、音频和文本三种模态数据... Megrez-3B-Omni是什么?一文让你看懂Megrez-3B-Omni的技术原理、主要功能、应用场景Megrez-3B-Omni概述简介 Megrez-3B-Omni是无问芯穹推出的全球首个端侧全模态理解开源模型,能处理图像、音频和文本三种模态数据...
- 
                    
                         Veo 2是什么?一文让你看懂Veo 2的技术原理、主要功能、应用场景Veo 2概述简介 Veo 2 是 Google DeepMind 推出的 AI 视频生成模型,能根据文本或图像提示生成高质量视频内容。Veo 2支... Veo 2是什么?一文让你看懂Veo 2的技术原理、主要功能、应用场景Veo 2概述简介 Veo 2 是 Google DeepMind 推出的 AI 视频生成模型,能根据文本或图像提示生成高质量视频内容。Veo 2支...
- 
                    
                         RDT是什么?一文让你看懂RDT的技术原理、主要功能、应用场景RDT概述简介 RDT(Robotics Diffusion Transformer)是清华大学AI研究院TSAIL团队推出的全球最大的双臂机器人操... RDT是什么?一文让你看懂RDT的技术原理、主要功能、应用场景RDT概述简介 RDT(Robotics Diffusion Transformer)是清华大学AI研究院TSAIL团队推出的全球最大的双臂机器人操...
- 
                    
                         Apollo是什么?一文让你看懂Apollo的技术原理、主要功能、应用场景Apollo概述简介 Apollo是Meta和斯坦福大学合作推出的大型多模态模型(LMMs),专注于视频理解。Apollo基于系统研究,揭示视频理解... Apollo是什么?一文让你看懂Apollo的技术原理、主要功能、应用场景Apollo概述简介 Apollo是Meta和斯坦福大学合作推出的大型多模态模型(LMMs),专注于视频理解。Apollo基于系统研究,揭示视频理解...
- 
                    
                         BrushEdit是什么?一文让你看懂BrushEdit的技术原理、主要功能、应用场景BrushEdit概述简介 BrushEdit是腾讯、北京大学、香港中文大学及清华大学联合推出的先进图像编辑框架,是BrushNet模型的高级迭代版... BrushEdit是什么?一文让你看懂BrushEdit的技术原理、主要功能、应用场景BrushEdit概述简介 BrushEdit是腾讯、北京大学、香港中文大学及清华大学联合推出的先进图像编辑框架,是BrushNet模型的高级迭代版...
- 
                    
                         Bocha Semantic Reranker是什么?一文让你看懂Bocha Semantic Reranker的技术原理、主要功能、应用场景Bocha Semantic Reranker概述简介 Bocha Semantic Reranker是博查AI推出的语义排序模型,能提升搜索应用和... Bocha Semantic Reranker是什么?一文让你看懂Bocha Semantic Reranker的技术原理、主要功能、应用场景Bocha Semantic Reranker概述简介 Bocha Semantic Reranker是博查AI推出的语义排序模型,能提升搜索应用和...
- 
                    
                         Ruyi是什么?一文让你看懂Ruyi的技术原理、主要功能、应用场景Ruyi概述简介 Ruyi是图森未来推出的图生视频大模型,专为在消费级显卡上运行设计,支持多分辨率、多时长视频生成,具备首帧、首尾帧控制、运动幅度控... Ruyi是什么?一文让你看懂Ruyi的技术原理、主要功能、应用场景Ruyi概述简介 Ruyi是图森未来推出的图生视频大模型,专为在消费级显卡上运行设计,支持多分辨率、多时长视频生成,具备首帧、首尾帧控制、运动幅度控...
- 
                    
                         Large Action Models是什么?一文让你看懂Large Action Models的技术原理、主要功能、应用场景Large Action Models概述简介 Large Action Models(LAMs)是微软推出大型行动模型的开发框架,能执行真实世界行... Large Action Models是什么?一文让你看懂Large Action Models的技术原理、主要功能、应用场景Large Action Models概述简介 Large Action Models(LAMs)是微软推出大型行动模型的开发框架,能执行真实世界行...
- 
                    
                         Leffa是什么?一文让你看懂Leffa的技术原理、主要功能、应用场景Leffa概述简介 Leffa(Learning Flow Fields in Attention)是 Meta AI推出的用在可控人物图像生成框架... Leffa是什么?一文让你看懂Leffa的技术原理、主要功能、应用场景Leffa概述简介 Leffa(Learning Flow Fields in Attention)是 Meta AI推出的用在可控人物图像生成框架...
- 
                    
                         LatentLM是什么?一文让你看懂LatentLM的技术原理、主要功能、应用场景LatentLM概述简介 LatentLM是微软研究院和清华大学一起推出的多模态生成模型,能统一处理离散数据(如文本)和连续数据(如图像、音频)。模... LatentLM是什么?一文让你看懂LatentLM的技术原理、主要功能、应用场景LatentLM概述简介 LatentLM是微软研究院和清华大学一起推出的多模态生成模型,能统一处理离散数据(如文本)和连续数据(如图像、音频)。模...
- 
                    
                         Lyra是什么?一文让你看懂Lyra的技术原理、主要功能、应用场景Lyra概述简介 Lyra是香港中文大学、SmartMore和香港科技大学推出的高效多模态大型语言大模型(MLLM),专注于提升语音、视觉和语言模态... Lyra是什么?一文让你看懂Lyra的技术原理、主要功能、应用场景Lyra概述简介 Lyra是香港中文大学、SmartMore和香港科技大学推出的高效多模态大型语言大模型(MLLM),专注于提升语音、视觉和语言模态...
- 
                    
                         Manga Image Translator是什么?一文让你看懂Manga Image Translator的技术原理、主要功能、应用场景Manga Image Translator概述简介 Manga Image Translator是开源的漫画图片文字翻译工具,能一键翻译漫画和图片... Manga Image Translator是什么?一文让你看懂Manga Image Translator的技术原理、主要功能、应用场景Manga Image Translator概述简介 Manga Image Translator是开源的漫画图片文字翻译工具,能一键翻译漫画和图片...
- 
                    
                         Ivy-VL是什么?一文让你看懂Ivy-VL的技术原理、主要功能、应用场景Ivy-VL概述简介 Ivy-VL是AI Safeguard联合卡内基梅隆大学和斯坦福大学推出的轻量级多模态AI大模型,专为移动端和边缘设备设计。模... Ivy-VL是什么?一文让你看懂Ivy-VL的技术原理、主要功能、应用场景Ivy-VL概述简介 Ivy-VL是AI Safeguard联合卡内基梅隆大学和斯坦福大学推出的轻量级多模态AI大模型,专为移动端和边缘设备设计。模...
- 
                    
                         ColorFlow是什么?一文让你看懂ColorFlow的技术原理、主要功能、应用场景ColorFlow概述简介 ColorFlow是清华大学和腾讯ARC实验室一起推出的图像序列着色模型,能精细化地保持图像序列中个体身份的同时进行着色... ColorFlow是什么?一文让你看懂ColorFlow的技术原理、主要功能、应用场景ColorFlow概述简介 ColorFlow是清华大学和腾讯ARC实验室一起推出的图像序列着色模型,能精细化地保持图像序列中个体身份的同时进行着色...
- 
                    
                         NodeTool是什么?一文让你看懂NodeTool的技术原理、主要功能、应用场景NodeTool概述简介 NodeTool是开源的AI工作流可视化构建器。NodeTool集成广泛的AI工具和模型,基于简单、可视化的界面,让用户无... NodeTool是什么?一文让你看懂NodeTool的技术原理、主要功能、应用场景NodeTool概述简介 NodeTool是开源的AI工作流可视化构建器。NodeTool集成广泛的AI工具和模型,基于简单、可视化的界面,让用户无...
- 
                    
                         VMB是什么?一文让你看懂VMB的技术原理、主要功能、应用场景VMB概述简介 VMB(Visuals Music Bridge)是中国科学院信息工程研究所、中国科学院大学网络空间安全学院、上海人工智能实验室、上... VMB是什么?一文让你看懂VMB的技术原理、主要功能、应用场景VMB概述简介 VMB(Visuals Music Bridge)是中国科学院信息工程研究所、中国科学院大学网络空间安全学院、上海人工智能实验室、上...
 
                    