功能

首页 > 功能

sCM是什么？一文让你看懂sCM的技术原理、主要功能、应用场景

sCM概述简介 sCM是OpenAI推出的连续时间一致性模型，基于扩散模型原理进行改进。sCM简化理论框架和优化采样过程，实现图像生成速度的显著提升...
Moonshine是什么？一文让你看懂Moonshine的技术原理、主要功能、应用场景

Moonshine概述简介 Moonshine是专为资源受限设备优化的语音识别模型，提供快速且准确的实时语音转文本服务。适于需要即时响应的应用场景，...
Time-MoE是什么？一文让你看懂Time-MoE的技术原理、主要功能、应用场景

Time-MoE概述简介 Time-MoE是创新的时间序列基础模型，基于混合专家（Mixture of Experts, MoE）架构，将时间序列预...
SynthID是什么？一文让你看懂SynthID的技术原理、主要功能、应用场景

SynthID概述简介 SynthID 是 DeepMind 推出的技术工具，基于在 AI 生成的内容中嵌入数字水印帮助识别内容。水印对人类是不可感...
Whispo是什么？一文让你看懂Whispo的技术原理、主要功能、应用场景

Whispo概述简介 Whispo是AI驱动的语音转录工具，支持用户按住Ctrl键录制语音，在释放键时自动将转录的文本插入到正在用的任何支持文本输入...
AutoGLM-Web是什么？一文让你看懂AutoGLM-Web的技术原理、主要功能、应用场景

AutoGLM-Web概述简介 AutoGLM-Web是模拟用户操作的AI浏览器助手，基于大型语言大模型构建，能执行网页访问、信息检索、内容总结等任...
OmniGen是什么？一文让你看懂OmniGen的技术原理、主要功能、应用场景

OmniGen概述简介 OmniGen是用于统一图像生成的新扩散模型，能在单一框架内处理多种图像生成任务，如文本到图像的生成、图像编辑、主题驱动生成...
CogAgent是什么？一文让你看懂CogAgent的技术原理、主要功能、应用场景

CogAgent概述简介 CogAgent是清华大学与智谱AI联合推出的多模态视觉大模型，专注于图形用户界面（GUI）的理解和导航。通过视觉模态对G...
OMNE Multiagent是什么？一文让你看懂OMNE Multiagent的技术原理、主要功能、应用场景

OMNE Multiagent概述简介 OMNE Multiagent是天桥脑科学研究院（Tianqiao and Chrissy Chen Ins...
DuoAttention是什么？一文让你看懂DuoAttention的技术原理、主要功能、应用场景

DuoAttention概述简介 DuoAttention是新型的框架，由MIT韩松团队提出，用在提高大型语言大模型（LLMs）在处理长上下文时的推...
HuggingChat macOS是什么？一文让你看懂HuggingChat macOS的技术原理、主要功能、应用场景

HuggingChat macOS概述简介 HuggingChat macOS是Hugging Face推出的开源聊天应用程序，专为macOS用户设...
OmniParser是什么？一文让你看懂OmniParser的技术原理、主要功能、应用场景

OmniParser概述简介 OmniParser是微软研究院推出的屏幕解析工具，将用户界面的屏幕截图转换成结构化数据。工具专门设计用在提高基于大型...
Ditto是什么？一文让你看懂Ditto的技术原理、主要功能、应用场景

Ditto概述简介 Ditto是基于Flask的应用程序生成器，用户基于简单的自然语言描述创建多文件的Web应用程序。工具用一个简单的LLM循环和一...
Flux.1 Lite是什么？一文让你看懂Flux.1 Lite的技术原理、主要功能、应用场景

Flux.1 Lite概述简介 Flux.1 Lite是Freepik团队推出的轻量级AI大模型，目前处于alpha版本。Flux.1 Lite是基...
Phidata是什么？一文让你看懂Phidata的技术原理、主要功能、应用场景

Phidata概述简介 Phidata是开源的AI智能体框架，帮助开发者构建具有记忆、知识、工具和推理能力的智能代理系统。支持创建能协同工作的代理团...
Allegro是什么？一文让你看懂Allegro的技术原理、主要功能、应用场景

Allegro概述简介 Allegro是由Rhymes AI推出的先进的文本到视频生成模型，能将简单的文本输入转换成高达720p分辨率、每秒15帧、...
FakeShield是什么？一文让你看懂FakeShield的技术原理、主要功能、应用场景

FakeShield概述简介 FakeShield是北京大学开发人员推出的多模态大型语言大模型框架，能检测和定位图像伪造。框架能评估图像的真实性，生...
MaskGCT是什么？一文让你看懂MaskGCT的技术原理、主要功能、应用场景

MaskGCT概述简介 MaskGCT是趣丸科技与香港中文大学（深圳）合作推出的语音合成大模型，基于掩码生成模型与语音表征解耦编码的技术，实现在声音...
GLM-4-Voice是什么？一文让你看懂GLM-4-Voice的技术原理、主要功能、应用场景

GLM-4-Voice概述简介 GLM-4-Voice是智谱AI推出的端到端情感语音模型，能直接理解和生成中英文语音，支持实时语音对话，能根据用户指...
Unbounded是什么？一文让你看懂Unbounded的技术原理、主要功能、应用场景

Unbounded概述简介 Unbounded是谷歌和北卡罗来纳大学教堂山分校一起推出的无限人生模拟游戏。游戏突破传统视频游戏的局限，用生成模型，如...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL