功能

首页 > 功能

Wan2.1是什么？一文让你看懂Wan2.1的技术原理、主要功能、应用场景

Wan2.1概述简介 Wan2.1是阿里云开源的AI视频生成大模型，具备强大的视觉生成能力。Wan2.1支持文生视频和图生视频任务，包含两种尺寸的模...
AgentRefine是什么？一文让你看懂AgentRefine的技术原理、主要功能、应用场景

AgentRefine概述简介 AgentRefine 是北京邮电大学和美团联合提出的智能体合成框架，通过“精炼调整”（Refinement Tun...
DeepGEMM是什么？一文让你看懂DeepGEMM的技术原理、主要功能、应用场景

DeepGEMM概述简介 DeepGEMM是DeepSeek开源的为高效简洁的FP8矩阵乘法（GEMM）设计的库，目前仅支持NVIDIA Hoppe...
TinyR1-Preview是什么？一文让你看懂TinyR1-Preview的技术原理、主要功能、应用场景

TinyR1-Preview概述简介 TinyR1-Preview是北京大学计算机学院与360公司联合推出的32B参数量的推理模型。模型仅用5%的参...
SurveyX是什么？一文让你看懂SurveyX的技术原理、主要功能、应用场景

SurveyX概述简介 SurveyX 是基于大型语言大模型（LLMs）自动化生成学术综述的系统，是中国人民大学、悉尼大学和中国东北大学联合推出的。...
Flame是什么？一文让你看懂Flame的技术原理、主要功能、应用场景

Flame概述简介 Flame是开源的多模态AI大模型，支持将UI设计截图转换为高质量的现代前端代码。Flame基于视觉语言建模、自动化数据合成和结...
OctoTools是什么？一文让你看懂OctoTools的技术原理、主要功能、应用场景

OctoTools概述简介 OctoTools 是斯坦福大学推出的开源智能体框架，基于可扩展的工具解决复杂的推理任务。OctoTools用标准化的工...
PhotoDoodle是什么？一文让你看懂PhotoDoodle的技术原理、主要功能、应用场景

PhotoDoodle概述简介 PhotoDoodle是新加坡国立大学、上海交通大学、北京邮电大学、字节跳动和Tiamat团队联合推出的艺术化图像编...
video-subtitle-master是什么？一文让你看懂video-subtitle-master的技术原理、主要功能、应用场景

video-subtitle-master概述简介 video-subtitle-master 是能批量为视频或音频生成字幕的工具，基于开源项目 V...
DualPipe是什么？一文让你看懂DualPipe的技术原理、主要功能、应用场景

DualPipe概述简介 DualPipe 是DeepSeek开源的创新的双向流水线并行技术，主要用于提升大规模深度学习模型的训练效率。核心思想是将...
EPLB是什么？一文让你看懂EPLB的技术原理、主要功能、应用场景

EPLB概述简介 EPLB（Expert Parallelism Load Balancer）是 DeepSeek 推出的专家并行负载均衡器，能解决...
Profiling Data是什么？一文让你看懂Profiling Data的技术原理、主要功能、应用场景

Profiling Data概述简介 Profiling Data是DeepSeek开源的训练和推理框架的性能分析数据，基于PyTorch Prof...
Phi-4-Multimodal是什么？一文让你看懂Phi-4-Multimodal的技术原理、主要功能、应用场景

Phi-4-Multimodal概述简介 Phi-4-Multimodal 是微软最新推出的多模态语言大模型，拥有 56 亿参数，能将语音、视觉和文...
R1-Onevision是什么？一文让你看懂R1-Onevision的技术原理、主要功能、应用场景

R1-Onevision概述简介 R1-Onevision 是开源的多模态大语言大模型，专注于复杂视觉推理任务。基于 Qwen2.5-VL 微调而成...
Phi-4-Mini是什么？一文让你看懂Phi-4-Mini的技术原理、主要功能、应用场景

Phi-4-Mini概述简介 Phi-4-Mini 是微软 Phi-4 系列中最新推出的专注于文本任务的小型语言大模型，参数量为 38 亿。基于密集...
IndexTTS是什么？一文让你看懂IndexTTS的技术原理、主要功能、应用场景

IndexTTS概述简介 IndexTTS 是 B 站推出的工业级可控文本转语音（TTS）系统。基于 XTTS 和 Tortoise 模型开发，结合...
Scribe是什么？一文让你看懂Scribe的技术原理、主要功能、应用场景

Scribe概述简介 Scribe 是 ElevenLabs 推出的高精度语音转文本模型，专为多语言和复杂音频环境设计。支持99种语言，英语和意大利...
Scribe是什么？一文让你看懂Scribe的技术原理、主要功能、应用场景

Scribe概述简介 Scribe 是 ElevenLabs 推出的高精度语音转文本模型，专为多语言和复杂音频环境设计。支持99种语言，英语和意大利...
VideoGrain是什么？一文让你看懂VideoGrain的技术原理、主要功能、应用场景

VideoGrain概述简介 VideoGrain 是悉尼科技大学和浙江大学推出的零样本多粒度视频编辑框架，能实现类别级、实例级和部件级的精细视频修...
腾讯混元Turbo S是什么？一文让你看懂腾讯混元Turbo S的技术原理、主要功能、应用场景

腾讯混元Turbo S概述简介腾讯混元Turbo S是腾讯推出的新一代快思考模型。模型采用创新的Hybrid-Mamba-Transformer融...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL