收集全球10,000⁺个好用的AI软件
-
VITRON是什么?一文让你看懂VITRON的技术原理、主要功能、应用场景VITRON概述简介 VITRON是Skywork AI、新加坡国立大学和南洋理工大学联合推出的像素级视觉大型语言大模型(LLM),能全面理解和处理... -
TryOffAnyone是什么?一文让你看懂TryOffAnyone的技术原理、主要功能、应用场景TryOffAnyone概述简介 TryOffAnyone是能将穿着服装的人物照片转换成平铺的服装展示图的AI工具。基于先进的Latent Diff... -
Inf-DiT是什么?一文让你看懂Inf-DiT的技术原理、主要功能、应用场景Inf-DiT概述简介 Inf-DiT 是清华大学、智谱AI 推出基于扩散模型的图像上采样方法,能生成超高分辨率图像。Inf-DiT引入单向块注意力... -
Inf-DiT是什么?一文让你看懂Inf-DiT的技术原理、主要功能、应用场景Inf-DiT概述简介 Inf-DiT 是清华大学、智谱AI 推出基于扩散模型的图像上采样方法,能生成超高分辨率图像。Inf-DiT引入单向块注意力... -
NMT是什么?一文让你看懂NMT的技术原理、主要功能、应用场景NMT概述简介 NMT(No More Tuning)是UC Berkeley和阿里集团联合推出的多任务学习框架,能解决多任务学习中不同任务优先级优... -
TradingAgents是什么?一文让你看懂TradingAgents的技术原理、主要功能、应用场景TradingAgents概述简介 TradingAgents是加利福尼亚大学洛杉矶分校和麻省理工学院推出的多代理LLM金融交易框架,能模拟现实世界... -
SPRIGHT是什么?一文让你看懂SPRIGHT的技术原理、主要功能、应用场景SPRIGHT概述简介 SPRIGHT(SPatially RIGHT)是亚利桑那州立大学 、Intel 实验室 、Hugging Face 、华盛... -
TransPixar是什么?一文让你看懂TransPixar的技术原理、主要功能、应用场景TransPixar概述简介 TransPixar是香港中文大学、Adobe研究院 、香港科技大学和智能摩尔联合开源的,先进的文本到视频生成方法,扩... -
STAR是什么?一文让你看懂STAR的技术原理、主要功能、应用场景STAR概述简介 STAR是南京大学、字节跳动、西南大学联合推出的,创新的现实世界视频超分辨率(VSR)框架,能从低分辨率(LR)视频生成高分辨率(... -
PPTAgent是什么?一文让你看懂PPTAgent的技术原理、主要功能、应用场景PPTAgent概述简介 PPTAgent是中国科学院软件研究所中文信息处理实验室推出的创新框架,基于模仿人类工作流程的两阶段编辑方法,从文档自动生... -
Sky-T1是什么?一文让你看懂Sky-T1的技术原理、主要功能、应用场景Sky-T1概述简介 Sky-T1是加州大学伯克利分校Sky Computing实验室的研究团队NovaSky发布的开源推理AI大模型,名为Sky-... -
TimesFM 2.0是什么?一文让你看懂TimesFM 2.0的技术原理、主要功能、应用场景TimesFM 2.0概述简介 TimesFM 2.0是谷歌研究团队推出的开源时间序列预测模型。具备强大的预测能力,可处理长达2048个时间点的单变... -
ViTPose是什么?一文让你看懂ViTPose的技术原理、主要功能、应用场景ViTPose概述简介 ViTPose 是基于 Transformer 架构的人体姿态估计模型。以普通视觉 Transformer 作为骨干网络,通... -
GR00T-Teleop是什么?一文让你看懂GR00T-Teleop的技术原理、主要功能、应用场景GR00T-Teleop概述简介 GR00T-Teleop是NVIDIA Isaac GR00T的一部分,用在捕获远程操作数据的关键技术。基于NVI... -
Titans是什么?一文让你看懂Titans的技术原理、主要功能、应用场景Titans概述简介 Titans是谷歌推出的新型神经网络架构,能突破Transformer在处理长序列数据时的记忆瓶颈。Titans引入神经长期记... -
Kokoro-TTS是什么?一文让你看懂Kokoro-TTS的技术原理、主要功能、应用场景Kokoro-TTS概述简介 Kokoro-TTS 是 hexgrad 开发的轻量级文本转语音(TTS)模型,具有 8200 万参数。基于 Styl... -
RealtimeSTT是什么?一文让你看懂RealtimeSTT的技术原理、主要功能、应用场景RealtimeSTT概述简介 RealtimeSTT是开源的实时语音转文本库,专为低延迟应用设计。有强大的语音活动检测功能,可自动识别说话的开始与... -
Seaweed APT是什么?一文让你看懂Seaweed APT的技术原理、主要功能、应用场景Seaweed APT概述简介 Seaweed APT是字节跳动推出的对抗性后训练(Adversarial Post-Training)模型,能实现... -
T2A-01-HD是什么?一文让你看懂T2A-01-HD的技术原理、主要功能、应用场景T2A-01-HD概述简介 T2A-01-HD是海螺AI海外版推出新的语音模型。支持声音克隆,仅需10秒音频即可精准克隆声音,保留情感底色。模型具备... -
SHMT是什么?一文让你看懂SHMT的技术原理、主要功能、应用场景SHMT概述简介 SHMT(Self-supervised Hierarchical Makeup Transfer)是阿里巴巴达摩院与武汉理工大学...