功能

首页 > 功能

Step-1o Audio是什么？一文让你看懂Step-1o Audio的技术原理、主要功能、应用场景

Step-1o Audio概述简介 Step-1o Audio是阶跃星辰推出的国内首个千亿参数端到端语音大模型。具备强大的情绪感知能力，能精准识别用...
360gpt2-o1是什么？一文让你看懂360gpt2-o1的技术原理、主要功能、应用场景

360gpt2-o1概述简介 360gpt2-o1是 360 自研的 AI 大模型，在推理能力上有显著提升，特别是在数学和逻辑推理任务上表现出色。模...
POINTS 1.5是什么？一文让你看懂POINTS 1.5的技术原理、主要功能、应用场景

POINTS 1.5概述简介 POINTS 1.5 是腾讯微信发布的多模态大模型，是POINTS 1.0的升级版本。模型继续沿用了POINTS 1...
k1 视觉思考模型是什么？一文让你看懂k1 视觉思考模型的技术原理、主要功能、应用场景

k1 视觉思考模型概述简介 k1 视觉思考模型是kimi推出的k1系列强化学习AI大模型，原生支持端到端图像理解和思维链技术，将能力扩展到数学之外的...
FreeScale是什么？一文让你看懂FreeScale的技术原理、主要功能、应用场景

FreeScale概述简介 FreeScale是南洋理工大学、阿里集团和复旦大学推出无需微调的推理框架，提升预训练扩散模型生成高分辨率图像和视频的能...
Freestyler是什么？一文让你看懂Freestyler的技术原理、主要功能、应用场景

Freestyler概述简介 Freestyler是西北工业大学计算机科学学院音频、语音与语言处理小组（ASLP@NPU）、微软及香港中文大学深圳研...
SnapGen是什么？一文让你看懂SnapGen的技术原理、主要功能、应用场景

SnapGen概述简介 SnapGen是Snap Inc、香港科技大学、墨尔本大学等机构联合推出的文本到图像（T2I）扩散模型，能在移动设备上快速生...
CosyVoice 2.0是什么？一文让你看懂CosyVoice 2.0的技术原理、主要功能、应用场景

CosyVoice 2.0概述简介 CosyVoice 2.0 是阿里巴巴通义实验室推出的CosyVoice语音生成大模型升级版，模型用有限标量量化...
Megrez-3B-Omni是什么？一文让你看懂Megrez-3B-Omni的技术原理、主要功能、应用场景

Megrez-3B-Omni概述简介 Megrez-3B-Omni是无问芯穹推出的全球首个端侧全模态理解开源模型，能处理图像、音频和文本三种模态数据...
Veo 2是什么？一文让你看懂Veo 2的技术原理、主要功能、应用场景

Veo 2概述简介 Veo 2 是 Google DeepMind 推出的 AI 视频生成模型，能根据文本或图像提示生成高质量视频内容。Veo 2支...
RDT是什么？一文让你看懂RDT的技术原理、主要功能、应用场景

RDT概述简介 RDT（Robotics Diffusion Transformer）是清华大学AI研究院TSAIL团队推出的全球最大的双臂机器人操...
Apollo是什么？一文让你看懂Apollo的技术原理、主要功能、应用场景

Apollo概述简介 Apollo是Meta和斯坦福大学合作推出的大型多模态模型（LMMs），专注于视频理解。Apollo基于系统研究，揭示视频理解...
BrushEdit是什么？一文让你看懂BrushEdit的技术原理、主要功能、应用场景

BrushEdit概述简介 BrushEdit是腾讯、北京大学、香港中文大学及清华大学联合推出的先进图像编辑框架，是BrushNet模型的高级迭代版...
Bocha Semantic Reranker是什么？一文让你看懂Bocha Semantic Reranker的技术原理、主要功能、应用场景

Bocha Semantic Reranker概述简介 Bocha Semantic Reranker是博查AI推出的语义排序模型，能提升搜索应用和...
Ruyi是什么？一文让你看懂Ruyi的技术原理、主要功能、应用场景

Ruyi概述简介 Ruyi是图森未来推出的图生视频大模型，专为在消费级显卡上运行设计，支持多分辨率、多时长视频生成，具备首帧、首尾帧控制、运动幅度控...
Large Action Models是什么？一文让你看懂Large Action Models的技术原理、主要功能、应用场景

Large Action Models概述简介 Large Action Models（LAMs）是微软推出大型行动模型的开发框架，能执行真实世界行...
Leffa是什么？一文让你看懂Leffa的技术原理、主要功能、应用场景

Leffa概述简介 Leffa（Learning Flow Fields in Attention）是 Meta AI推出的用在可控人物图像生成框架...
LatentLM是什么？一文让你看懂LatentLM的技术原理、主要功能、应用场景

LatentLM概述简介 LatentLM是微软研究院和清华大学一起推出的多模态生成模型，能统一处理离散数据（如文本）和连续数据（如图像、音频）。模...
Lyra是什么？一文让你看懂Lyra的技术原理、主要功能、应用场景

Lyra概述简介 Lyra是香港中文大学、SmartMore和香港科技大学推出的高效多模态大型语言大模型（MLLM），专注于提升语音、视觉和语言模态...
Manga Image Translator是什么？一文让你看懂Manga Image Translator的技术原理、主要功能、应用场景

Manga Image Translator概述简介 Manga Image Translator是开源的漫画图片文字翻译工具，能一键翻译漫画和图片...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL