功能

首页 > 功能

AgentScope是什么？一文让你看懂AgentScope的技术原理、主要功能、应用场景

AgentScope概述简介 AgentScope是阿里集团开源的多智能体开发平台，帮助开发者轻松构建和部署多智能体应用。AgentScope提供高...
LeviTor是什么？一文让你看懂LeviTor的技术原理、主要功能、应用场景

LeviTor概述简介 LeviTor是南京大学、蚂蚁集团、浙江大学等机构推出的图像到视频合成技术，结合深度信息和K-means聚类点控制视频中3D...
3D-Speaker是什么？一文让你看懂3D-Speaker的技术原理、主要功能、应用场景

3D-Speaker概述简介 3D-Speaker是阿里巴巴通义实验室语音团队推出的多模态开源项目，基于结合声学、语义、视觉信息，实现高精度的说话人...
ERA-42是什么？一文让你看懂ERA-42的技术原理、主要功能、应用场景

ERA-42概述简介 ERA-42是北京星动纪元推出的端到端原生机器人大模型，与自研的五指灵巧手星动XHAND1结合，能完成100多种复杂灵巧操作任...
Baichuan4-Finance是什么？一文让你看懂Baichuan4-Finance的技术原理、主要功能、应用场景

Baichuan4-Finance概述简介 Baichuan4-Finance是百川智能推出的全链路金融领域增强大模型，包括Baichuan4-Fi...
VSI-Bench是什么？一文让你看懂VSI-Bench的技术原理、主要功能、应用场景

VSI-Bench概述简介 VSI-Bench（Visual-Spatial Intelligence Benchmark）是李飞飞、谢赛宁及他们的...
Bamba-9B是什么？一文让你看懂Bamba-9B的技术原理、主要功能、应用场景

Bamba-9B概述简介 Bamba-9B是IBM、普林斯顿大学、卡内基梅隆大学和伊利诺伊大学香槟分校联合推出的，基于Mamba2架构的仅解码语言大...
Univer是什么？一文让你看懂Univer的技术原理、主要功能、应用场景

Univer概述简介 Univer是开源的全栈框架，支持创建和编辑电子表格、文档及幻灯片，为用户提供统一且强大的办公解决方案。Univer能在浏览器...
Kheish是什么？一文让你看懂Kheish的技术原理、主要功能、应用场景

Kheish概述简介 Kheish是基于大型语言大模型（LLM）的多智能体编排开源平台，用多个专门的角色（智能体）和灵活的工作流协调复杂任务的各个步...
HelloMeme是什么？一文让你看懂HelloMeme的技术原理、主要功能、应用场景

HelloMeme概述简介 HelloMeme是基于最新的Diffusion生成技术的框架，实现表情与姿态的迁移，HelloMeme集成空间编织注意...
InvSR是什么？一文让你看懂InvSR的技术原理、主要功能、应用场景

InvSR概述简介 InvSR是创新的图像超分辨率模型，基于扩散模型的逆过程恢复高分辨率图像。用大型预训练扩散模型中丰富的图像先验，改善超分辨率的效...
CLEAR是什么？一文让你看懂CLEAR的技术原理、主要功能、应用场景

CLEAR概述简介 CLEAR是新加坡国立大学推出新型线性注意力机制，能提升预训练扩散变换器（DiTs）生成高分辨率图像的效率。基于将每个查询的注意...
DisPose是什么？一文让你看懂DisPose的技术原理、主要功能、应用场景

DisPose概述简介 DisPose是北京大学、中国科学技术大学、清华大学和香港科技大学的研究团队一起推出的，提高人物图像动画质量的控制技术，基于...
OCTAVE是什么？一文让你看懂OCTAVE的技术原理、主要功能、应用场景

OCTAVE 概述简介 OCTAVE（Omni-Capable Text and Voice Engine）是Hume AI推出的新一代语音语言大模...
Granite 3.1是什么？一文让你看懂Granite 3.1的技术原理、主要功能、应用场景

Granite 3.1概述简介 Granite 3.1是IBM推出的新一代语言大模型，具有强大的性能和更长的上下文处理能力。Granite 3.1模...
Sketch2Sound是什么？一文让你看懂Sketch2Sound的技术原理、主要功能、应用场景

Sketch2Sound概述简介 Sketch2Sound是Adobe 研究院和西北大学推出的AI音频生成技术，能基于声音模仿和文本提示生成高品质音...
OmniAudio-2.6B是什么？一文让你看懂OmniAudio-2.6B的技术原理、主要功能、应用场景

OmniAudio-2.6B概述简介 OmniAudio-2.6B是Nexa AI推出的音频语言大模型，专为边缘部署设计，能实现快速且高效的音频文本...
DreamOmni是什么？一文让你看懂DreamOmni的技术原理、主要功能、应用场景

DreamOmni概述简介 DreamOmni 是香港中文大学、字节跳动和香港科技大学一起推出的统一图像生成和编辑模型。模型整合文本到图像（T2I）...
QVQ是什么？一文让你看懂QVQ的技术原理、主要功能、应用场景

QVQ概述简介 QVQ是阿里基于Qwen2-VL-72B构建的开源多模态推理模型，结合视觉理解和复杂问题解决能力，提升人工智能的认知能力。QVQ在视...
Open Notebook是什么？一文让你看懂Open Notebook的技术原理、主要功能、应用场景

Open Notebook概述简介 Open Notebook是开源、注重隐私的谷歌NotebookLM替代工具，能帮助用户管理研究工作流程，生成A...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL