收集全球10,000⁺个好用的AI软件
-
CSM是什么?一文让你看懂CSM的技术原理、主要功能、应用场景CSM概述简介 CSM(Conversational Speech Model)是Sesame团队推出的新型语音对话模型,提升语音助手的自然度和情感...
-
LCVD是什么?一文让你看懂LCVD的技术原理、主要功能、应用场景LCVD概述简介 LCVD(Lighting Controllable Video Diffusion Model)是四川大学推出的高保真、光照可控...
-
CogView4是什么?一文让你看懂CogView4的技术原理、主要功能、应用场景CogView4概述简介 CogView4 是智谱推出的开源文生图模型,具有60亿参数,支持原生中文输入和中文文字生成。模型在 DPG-Bench ...
-
GaussianCity是什么?一文让你看懂GaussianCity的技术原理、主要功能、应用场景GaussianCity概述简介 GaussianCity 是南洋理工大学 S-Lab 团队推出的高效无边界3D城市生成框架,基于3D高斯绘制(3D...
-
Chat2SVG是什么?一文让你看懂Chat2SVG的技术原理、主要功能、应用场景Chat2SVG概述简介 Chat2SVG 是创新的文本到矢量图形(SVG)生成框架,通过结合大型语言大模型(LLMs)和图像扩散模型,实现高质量 ...
-
GEN3C是什么?一文让你看懂GEN3C的技术原理、主要功能、应用场景GEN3C概述简介 GEN3C 是NVIDIA、多伦多大学和向量研究所推出的新型生成式视频模型,基于精确的相机控制和时空一致性生成高质量的 3D 视...
-
Mercury Coder是什么?一文让你看懂Mercury Coder的技术原理、主要功能、应用场景Mercury Coder概述简介 Mercury Coder 是 Inception Labs 推出的首个扩散型大语言大模型(dLLM),是 Me...
-
GCDance是什么?一文让你看懂GCDance的技术原理、主要功能、应用场景GCDance概述简介 GCDance(Genre-Controlled 3D Full Body Dance Generation Driven ...
-
DoraCycle是什么?一文让你看懂DoraCycle的技术原理、主要功能、应用场景DoraCycle概述简介 DoraCycle 是新加坡国立大学 Show Lab 推出多模态领域适应的统一生成模型,通过两个多模态循环(text-...
-
COMET是什么?一文让你看懂COMET的技术原理、主要功能、应用场景COMET概述简介 COMET是字节跳动推出的针对Mixture-of-Experts(MoE)模型的优化系统,能解决分布式训练中通信开销过大的问题...
-
TrajectoryCrafter是什么?一文让你看懂TrajectoryCrafter的技术原理、主要功能、应用场景TrajectoryCrafter概述简介 TrajectoryCrafter 是腾讯PCG ARC Lab和香港中文大学推出的,用在单目视频的相机...
-
VACE是什么?一文让你看懂VACE的技术原理、主要功能、应用场景VACE概述简介 VACE(Video Creation and Editing)是阿里巴巴通义实验室推出的一站式视频生成与编辑框架。基于整合多种视...
-
赤兔Chitu是什么?一文让你看懂赤兔Chitu的技术原理、主要功能、应用场景Chitu概述简介 Chitu(赤兔)是清华大学高性能计算研究所与清程极智联合开源的高性能大模型推理引擎,专为解决大模型在推理阶段的高成本和低效率问...
-
Command A是什么?一文让你看懂Command A的技术原理、主要功能、应用场景Command A概述简介 Command A 是 Cohere 推出的最新生成式 AI 模型,专为企业级应用设计。Command A用高性能和低硬...
-
Claude 3.7 Max是什么?一文让你看懂Claude 3.7 Max的技术原理、主要功能、应用场景Claude 3.7 Max概述简介 Claude 3.7 Max 是 Cursor 推出的专为复杂代码任务设计的最新 AI 模型,称为史上最强代码...
-
Chirp 3是什么?一文让你看懂Chirp 3的技术原理、主要功能、应用场景Chirp 3概述简介 Chirp 3 是谷歌云推出的高清语音合成模型,专为生成自然、生动的语音而设计。支持 248 种声音和 31 种语言,能捕捉...
-
Cube 3D是什么?一文让你看懂Cube 3D的技术原理、主要功能、应用场景Cube 3D概述简介 Cube 3D 是 Roblox 推出的AI 3D生成大模型,基于 AI 技术高效生成 3D 模型和环境。Cube 3D支持...
-
ReCamMaster是什么?一文让你看懂ReCamMaster的技术原理、主要功能、应用场景ReCamMaster概述简介 ReCamMaster 是浙江大学、快手科技等联合推出的视频重渲染框架,能根据新的相机轨迹重新生成视频内容。通过预训...
-
Stable Virtual Camera是什么?一文让你看懂Stable Virtual Camera的技术原理、主要功能、应用场景Stable Virtual Camera概述简介 Stable Virtual Camera 是 Stability AI 推出的 AI 模型,能...
-
Umi-OCR是什么?一文让你看懂Umi-OCR的技术原理、主要功能、应用场景Umi-OCR概述简介 Umi-OCR 是免费开源的离线 OCR 文字识别软件。无需联网,解压即用,支持截图、批量图片、PDF 扫描件的文字识别,能...