功能

首页 > 功能

SmolVLM是什么？一文让你看懂SmolVLM的技术原理、主要功能、应用场景

SmolVLM概述简介 SmolVLM是Hugging Face推出的轻量级视觉语言大模型，专为设备端推理设计。以20亿参数量，实现了高效内存占用和...
OneDiffusion是什么？一文让你看懂OneDiffusion的技术原理、主要功能、应用场景

OneDiffusion概述简介 OneDiffusion是AI2推出的多功能大规模扩散模型，能无缝支持双向图像合成和理解，涵盖文本到图像生成、条件...
LongAlign是什么？一文让你看懂LongAlign的技术原理、主要功能、应用场景

LongAlign概述简介 LongAlign是香港大学研究团队推出的文本到图像（T2I）扩散模型的改进方法，能提升长文本输入的对齐精度。LongA...
ebook2audiobookXTTS是什么？一文让你看懂ebook2audiobookXTTS的技术原理、主要功能、应用场景

ebook2audiobookXTTS概述简介 ebook2audiobookXTTS是开源的AI工具，能将电子书转换为有声书。ebook2audi...
Optima是什么？一文让你看懂Optima的技术原理、主要功能、应用场景

Optima概述简介 Optima是清华大学推出的优化基于大型语言大模型（LLM）的多智能体系统（MAS）的框架。基于一个迭代的生成、排名、选择和训...
MuCodec是什么？一文让你看懂MuCodec的技术原理、主要功能、应用场景

MuCodec概述简介 MuCodec是清华大学深圳国际研究生院、腾讯AI实验室和香港中文大学的开发人员一起推出的超低比特率音乐编解码器，能实现音乐...
Find3D是什么？一文让你看懂Find3D的技术原理、主要功能、应用场景

Find3D概述简介 Find3D是加州理工学院推出的3D部件分割模型，能根据任意文本查询分割任意对象的任何部分。Find3D用一个强大的数据引擎自...
Sketch2Lineart是什么？一文让你看懂Sketch2Lineart的技术原理、主要功能、应用场景

Sketch2Lineart概述简介 Sketch2Lineart是基于人工智能的绘画工具，能将简单的手绘草图转换成清晰的线条画。通过自动生成草图描...
Fancy123是什么？一文让你看懂Fancy123的技术原理、主要功能、应用场景

Fancy123概述简介 Fancy123是华中科技大学和华南理工大学推出的3D网格生成技术，基于即插即用的变形技术从单张图片生成高质量的3D网格。...
Mooncake是什么？一文让你看懂Mooncake的技术原理、主要功能、应用场景

Mooncake概述简介 Mooncake是月之暗面Kimi联合清华大学等机构共同开源的大模型推理架构。采用以KVCache为中心的分布式架构，通过...
QwQ-32B-Preview是什么？一文让你看懂QwQ-32B-Preview的技术原理、主要功能、应用场景

QwQ-32B-Preview概述简介 QwQ-32B-Preview（QwQ-32B）是阿里推出的开源AI推理模型，在数学和编程领域表现卓越。Qw...
InfiMM-WebMath-40B是什么？一文让你看懂InfiMM-WebMath-40B的技术原理、主要功能、应用场景

InfiMM-WebMath-40B概述简介 InfiMM-WebMath-40B 是字节跳动和中国科学院联合开源的超大规模多模态数据集，旨在提升多...
SAM 2.1是什么？一文让你看懂SAM 2.1的技术原理、主要功能、应用场景

SAM 2.1概述简介 SAM 2.1（全称Segment Anything Model 2.1）是Meta（Facebook的母公司）推出的先进视...
Qwen2vl-Flux是什么？一文让你看懂Qwen2vl-Flux的技术原理、主要功能、应用场景

Qwen2vl-Flux概述简介 Qwen2VL-Flux是多模态图像生成模型，结合Qwen2VL的视觉语言理解和FLUX框架，基于文本提示和图像参...
ShowUI是什么？一文让你看懂ShowUI的技术原理、主要功能、应用场景

ShowUI概述简介 ShowUI是新加坡国立大学Show Lab和微软一起推出的视觉-语言-行动模型，能提升图形用户界面（GUI）助手的工作效率。...
NVLM是什么？一文让你看懂NVLM的技术原理、主要功能、应用场景

NVLM概述简介 NVLM是NVIDIA推出的前沿多模态大型语言大模型（LLMs），在视觉-语言任务上达到与顶尖专有模型（如GPT-4o）和开放访问...
Promptriever是什么？一文让你看懂Promptriever的技术原理、主要功能、应用场景

Promptriever概述简介 Promptriever 是约翰斯·霍普金斯大学和Samaya AI联合推出的新型检索模型，能像语言大模型一样接受...
LongLLaVA是什么？一文让你看懂LongLLaVA的技术原理、主要功能、应用场景

LongLLaVA概述简介 LongLLaVA是的多模态大型语言大模型（MLLM），是香港中文大学（深圳）的开发人员推出。基于混合架构，结合Mamb...
Devika是什么？一文让你看懂Devika的技术原理、主要功能、应用场景

Devika 概述简介 Devika是开源的AI编程工具，能理解并拆分复杂指令，基于集成AI搜索和网页浏览能力搜集信息，编写代码实现目标。Devik...
iDP3是什么？一文让你看懂iDP3的技术原理、主要功能、应用场景

iDP3概述简介 iDP3（Improved 3D Diffusion Policy）是斯坦福大学联合多所高校推出的改进型3D视觉运动策略(如三维扩...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL