收集全球10,000⁺个好用的AI软件
-
sCM是什么?一文让你看懂sCM的技术原理、主要功能、应用场景sCM概述简介 sCM是OpenAI推出的连续时间一致性模型,基于扩散模型原理进行改进。sCM简化理论框架和优化采样过程,实现图像生成速度的显著提升...
-
Moonshine是什么?一文让你看懂Moonshine的技术原理、主要功能、应用场景Moonshine概述简介 Moonshine是专为资源受限设备优化的语音识别模型,提供快速且准确的实时语音转文本服务。适于需要即时响应的应用场景,...
-
Time-MoE是什么?一文让你看懂Time-MoE的技术原理、主要功能、应用场景Time-MoE概述简介 Time-MoE是创新的时间序列基础模型,基于混合专家(Mixture of Experts, MoE)架构,将时间序列预...
-
SynthID是什么?一文让你看懂SynthID的技术原理、主要功能、应用场景SynthID概述简介 SynthID 是 DeepMind 推出的技术工具,基于在 AI 生成的内容中嵌入数字水印帮助识别内容。水印对人类是不可感...
-
Whispo是什么?一文让你看懂Whispo的技术原理、主要功能、应用场景Whispo概述简介 Whispo是AI驱动的语音转录工具,支持用户按住Ctrl键录制语音,在释放键时自动将转录的文本插入到正在用的任何支持文本输入...
-
AutoGLM-Web是什么?一文让你看懂AutoGLM-Web的技术原理、主要功能、应用场景AutoGLM-Web概述简介 AutoGLM-Web是模拟用户操作的AI浏览器助手,基于大型语言大模型构建,能执行网页访问、信息检索、内容总结等任...
-
OmniGen是什么?一文让你看懂OmniGen的技术原理、主要功能、应用场景OmniGen概述简介 OmniGen是用于统一图像生成的新扩散模型,能在单一框架内处理多种图像生成任务,如文本到图像的生成、图像编辑、主题驱动生成...
-
CogAgent是什么?一文让你看懂CogAgent的技术原理、主要功能、应用场景CogAgent概述简介 CogAgent是清华大学与智谱AI联合推出的多模态视觉大模型,专注于图形用户界面(GUI)的理解和导航。通过视觉模态对G...
-
OMNE Multiagent是什么?一文让你看懂OMNE Multiagent的技术原理、主要功能、应用场景OMNE Multiagent概述简介 OMNE Multiagent是天桥脑科学研究院(Tianqiao and Chrissy Chen Ins...
-
DuoAttention是什么?一文让你看懂DuoAttention的技术原理、主要功能、应用场景DuoAttention概述简介 DuoAttention是新型的框架,由MIT韩松团队提出,用在提高大型语言大模型(LLMs)在处理长上下文时的推...
-
HuggingChat macOS是什么?一文让你看懂HuggingChat macOS的技术原理、主要功能、应用场景HuggingChat macOS概述简介 HuggingChat macOS是Hugging Face推出的开源聊天应用程序,专为macOS用户设...
-
OmniParser是什么?一文让你看懂OmniParser的技术原理、主要功能、应用场景OmniParser概述简介 OmniParser是微软研究院推出的屏幕解析工具,将用户界面的屏幕截图转换成结构化数据。工具专门设计用在提高基于大型...
-
Ditto是什么?一文让你看懂Ditto的技术原理、主要功能、应用场景Ditto概述简介 Ditto是基于Flask的应用程序生成器,用户基于简单的自然语言描述创建多文件的Web应用程序。工具用一个简单的LLM循环和一...
-
Flux.1 Lite是什么?一文让你看懂Flux.1 Lite的技术原理、主要功能、应用场景Flux.1 Lite概述简介 Flux.1 Lite是Freepik团队推出的轻量级AI大模型,目前处于alpha版本。Flux.1 Lite是基...
-
Phidata是什么?一文让你看懂Phidata的技术原理、主要功能、应用场景Phidata概述简介 Phidata是开源的AI智能体框架,帮助开发者构建具有记忆、知识、工具和推理能力的智能代理系统。支持创建能协同工作的代理团...
-
Allegro是什么?一文让你看懂Allegro的技术原理、主要功能、应用场景Allegro概述简介 Allegro是由Rhymes AI推出的先进的文本到视频生成模型,能将简单的文本输入转换成高达720p分辨率、每秒15帧、...
-
FakeShield是什么?一文让你看懂FakeShield的技术原理、主要功能、应用场景FakeShield概述简介 FakeShield是北京大学开发人员推出的多模态大型语言大模型框架,能检测和定位图像伪造。框架能评估图像的真实性,生...
-
MaskGCT是什么?一文让你看懂MaskGCT的技术原理、主要功能、应用场景MaskGCT概述简介 MaskGCT是趣丸科技与香港中文大学(深圳)合作推出的语音合成大模型,基于掩码生成模型与语音表征解耦编码的技术,实现在声音...
-
GLM-4-Voice是什么?一文让你看懂GLM-4-Voice的技术原理、主要功能、应用场景GLM-4-Voice概述简介 GLM-4-Voice是智谱AI推出的端到端情感语音模型,能直接理解和生成中英文语音,支持实时语音对话,能根据用户指...
-
Unbounded是什么?一文让你看懂Unbounded的技术原理、主要功能、应用场景Unbounded概述简介 Unbounded是谷歌和北卡罗来纳大学教堂山分校一起推出的无限人生模拟游戏。游戏突破传统视频游戏的局限,用生成模型,如...