功能

首页 > 功能

百聆是什么？一文让你看懂百聆的技术原理、主要功能、应用场景

百聆概述简介百聆(Bailing)是开源的语音对话助手，基于语音识别（ASR）、语音活动检测（VAD）、大语言大模型（LLM）和语音合成（TTS）...
LineArt是什么？一文让你看懂LineArt的技术原理、主要功能、应用场景

LineArt概述简介 LineArt是吉林大学、瑞典皇家理工学院、东京工业大学等机构推出的，无需训练的高质量设计绘图外观迁移框架，能将复杂外观特征...
SynthLight是什么？一文让你看懂SynthLight的技术原理、主要功能、应用场景

SynthLight概述简介 SynthLight 是耶鲁大学和 Adobe Research 联合推出的基于扩散模型的人像重照明技术，通过模拟不同...
X-Dyna是什么？一文让你看懂X-Dyna的技术原理、主要功能、应用场景

X-Dyna概述简介 X-Dyna 是基于扩散模型的动画生成框架，基于驱动视频中的面部表情和身体动作，将单张人类图像动画化，生成具有真实感和环境感知...
DeepSeek-R1是什么？一文让你看懂DeepSeek-R1的技术原理、主要功能、应用场景

DeepSeek-R1概述简介 DeepSeek-R1是杭州深度求索公司 DeepSeek 推出的高性能AI推理模型，对标OpenAI的o1正式版。...
k1.5是什么？一文让你看懂k1.5的技术原理、主要功能、应用场景

k1.5概述简介 k1.5 是月之暗面Kimi推出的最新多模态思考模型，具备强大的推理和多模态处理能力。模型在 short-CoT（短链思维）模式下...
OmniThink是什么？一文让你看懂OmniThink的技术原理、主要功能、应用场景

OmniThink概述简介 OmniThink是浙江大学和阿里巴巴通义实验室联合开发的创新的机器写作框架，通过模拟人类的迭代扩展和反思过程，突破大型...
H-Optimus-0是什么？一文让你看懂H-Optimus-0的技术原理、主要功能、应用场景

H-Optimus-0概述简介 H-Optimus-0是法国初创公司Bioptimus发布的世界上最大的开源病理学AI基础模型。模型拥有11亿参数，...
Roop-Unleashed是什么？一文让你看懂Roop-Unleashed的技术原理、主要功能、应用场景

Roop-Unleashed概述简介 Roop-Unleashed 是基于 Roop 的开源项目，专注于深度伪造（Deepfake）技术的实现与优化...
书生·浦像是什么？一文让你看懂书生·浦像的技术原理、主要功能、应用场景

书生·浦像概述简介书生·浦像是上海人工智能实验室联合香港中文大学、浙江大学等机构研发的超高动态成像算法，核心为浦像HDR（UltraFusion ...
DeepSeek R1-Zero是什么？一文让你看懂DeepSeek R1-Zero的技术原理、主要功能、应用场景

DeepSeek R1-Zero概述简介 DeepSeek R1-Zero 是 DeepSeek 团队开发的完全依赖纯强化学习（RL）训练的推理模型...
VideoWorld是什么？一文让你看懂VideoWorld的技术原理、主要功能、应用场景

VideoWorld概述简介 VideoWorld是北京交通大学、中国科学技术大学和字节跳动合作开展的一项研究项目，探索深度生成模型是否能仅通过未标...
Step-1o Vision是什么？一文让你看懂Step-1o Vision的技术原理、主要功能、应用场景

Step-1o Vision概述简介 Step-1o Vision 是阶跃星辰最新研发的原生端到端多模态生成与理解一体化模型中的视觉版本。专注于视觉...
3DIS-FLUX是什么？一文让你看懂3DIS-FLUX的技术原理、主要功能、应用场景

3DIS-FLUX概述简介 3DIS-FLUX是基于深度学习的多实例生成框架，通过解耦实例合成实现高质量的图像生成。结合3DIS框架的深度驱动场景构...
DITTO-2是什么？一文让你看懂DITTO-2的技术原理、主要功能、应用场景

DITTO-2概述简介 DITTO-2 是 Adobe 和加州大学开发人员联合推出的新型音乐生成模型，通过优化扩散模型的推理时间，实现快速且可控的音...
DiffEditor是什么？一文让你看懂DiffEditor的技术原理、主要功能、应用场景

DiffEditor概述简介 DiffEditor是北京大学深圳研究生院与腾讯PCG的研究团队提出的基于扩散模型（Diffusion Model）的...
Textoon是什么？一文让你看懂Textoon的技术原理、主要功能、应用场景

Textoon概述简介 Textoon是阿里集团通义实验室推出的创新项目，首个能根据文本提示生成Live2D格式2D卡通角色的方法。基于先进的语言和...
子曰-o1是什么？一文让你看懂子曰-o1的技术原理、主要功能、应用场景

子曰-o1概述简介子曰-o1是网易有道发布的国内首个输出分步式讲解的推理模型。模型采用14B轻量级架构，专为消费级显卡设计，能在低显存设备上稳定运...
豆包大模型1.5是什么？一文让你看懂豆包大模型1.5的技术原理、主要功能、应用场景

豆包大模型1.5概述简介豆包大模型1.5 是字节跳动推出的最新版本大模型。采用大规模稀疏MoE架构，等效于7倍激活参数的Dense模型性能，综合得...
OmniManip是什么？一文让你看懂OmniManip的技术原理、主要功能、应用场景

OmniManip概述简介 OmniManip 是北京大学与智元机器人联合实验室开发的通用机器人操作框架，通过结合视觉语言大模型（VLM）的高层次推...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL