收集全球10,000⁺个好用的AI软件
-
Wan2.1是什么?一文让你看懂Wan2.1的技术原理、主要功能、应用场景Wan2.1概述简介 Wan2.1是阿里云开源的AI视频生成大模型,具备强大的视觉生成能力。Wan2.1支持文生视频和图生视频任务,包含两种尺寸的模...
-
AgentRefine是什么?一文让你看懂AgentRefine的技术原理、主要功能、应用场景AgentRefine概述简介 AgentRefine 是北京邮电大学和美团联合提出的智能体合成框架,通过“精炼调整”(Refinement Tun...
-
DeepGEMM是什么?一文让你看懂DeepGEMM的技术原理、主要功能、应用场景DeepGEMM概述简介 DeepGEMM是DeepSeek开源的为高效简洁的FP8矩阵乘法(GEMM)设计的库,目前仅支持NVIDIA Hoppe...
-
TinyR1-Preview是什么?一文让你看懂TinyR1-Preview的技术原理、主要功能、应用场景TinyR1-Preview概述简介 TinyR1-Preview是北京大学计算机学院与360公司联合推出的32B参数量的推理模型。模型仅用5%的参...
-
SurveyX是什么?一文让你看懂SurveyX的技术原理、主要功能、应用场景SurveyX概述简介 SurveyX 是基于大型语言大模型(LLMs)自动化生成学术综述的系统,是中国人民大学、悉尼大学和中国东北大学联合推出的。...
-
Flame是什么?一文让你看懂Flame的技术原理、主要功能、应用场景Flame概述简介 Flame是开源的多模态AI大模型,支持将UI设计截图转换为高质量的现代前端代码。Flame基于视觉语言建模、自动化数据合成和结...
-
OctoTools是什么?一文让你看懂OctoTools的技术原理、主要功能、应用场景OctoTools概述简介 OctoTools 是斯坦福大学推出的开源智能体框架,基于可扩展的工具解决复杂的推理任务。OctoTools用标准化的工...
-
PhotoDoodle是什么?一文让你看懂PhotoDoodle的技术原理、主要功能、应用场景PhotoDoodle概述简介 PhotoDoodle是新加坡国立大学、上海交通大学、北京邮电大学、字节跳动和Tiamat团队联合推出的艺术化图像编...
-
video-subtitle-master是什么?一文让你看懂video-subtitle-master的技术原理、主要功能、应用场景video-subtitle-master概述简介 video-subtitle-master 是能批量为视频或音频生成字幕的工具,基于开源项目 V...
-
DualPipe是什么?一文让你看懂DualPipe的技术原理、主要功能、应用场景DualPipe概述简介 DualPipe 是DeepSeek开源的创新的双向流水线并行技术,主要用于提升大规模深度学习模型的训练效率。核心思想是将...
-
EPLB是什么?一文让你看懂EPLB的技术原理、主要功能、应用场景EPLB概述简介 EPLB(Expert Parallelism Load Balancer)是 DeepSeek 推出的专家并行负载均衡器,能解决...
-
Profiling Data是什么?一文让你看懂Profiling Data的技术原理、主要功能、应用场景Profiling Data概述简介 Profiling Data是DeepSeek开源的训练和推理框架的性能分析数据,基于PyTorch Prof...
-
Phi-4-Multimodal是什么?一文让你看懂Phi-4-Multimodal的技术原理、主要功能、应用场景Phi-4-Multimodal概述简介 Phi-4-Multimodal 是微软最新推出的多模态语言大模型,拥有 56 亿参数,能将语音、视觉和文...
-
R1-Onevision是什么?一文让你看懂R1-Onevision的技术原理、主要功能、应用场景R1-Onevision概述简介 R1-Onevision 是开源的多模态大语言大模型,专注于复杂视觉推理任务。基于 Qwen2.5-VL 微调而成...
-
Phi-4-Mini是什么?一文让你看懂Phi-4-Mini的技术原理、主要功能、应用场景Phi-4-Mini概述简介 Phi-4-Mini 是微软 Phi-4 系列中最新推出的专注于文本任务的小型语言大模型,参数量为 38 亿。基于密集...
-
IndexTTS是什么?一文让你看懂IndexTTS的技术原理、主要功能、应用场景IndexTTS概述简介 IndexTTS 是 B 站推出的工业级可控文本转语音(TTS)系统。基于 XTTS 和 Tortoise 模型开发,结合...
-
Scribe是什么?一文让你看懂Scribe的技术原理、主要功能、应用场景Scribe概述简介 Scribe 是 ElevenLabs 推出的高精度语音转文本模型,专为多语言和复杂音频环境设计。支持99种语言,英语和意大利...
-
Scribe是什么?一文让你看懂Scribe的技术原理、主要功能、应用场景Scribe概述简介 Scribe 是 ElevenLabs 推出的高精度语音转文本模型,专为多语言和复杂音频环境设计。支持99种语言,英语和意大利...
-
VideoGrain是什么?一文让你看懂VideoGrain的技术原理、主要功能、应用场景VideoGrain概述简介 VideoGrain 是悉尼科技大学和浙江大学推出的零样本多粒度视频编辑框架,能实现类别级、实例级和部件级的精细视频修...
-
腾讯混元Turbo S是什么?一文让你看懂腾讯混元Turbo S的技术原理、主要功能、应用场景腾讯混元Turbo S概述简介 腾讯混元Turbo S是腾讯推出的新一代快思考模型。模型采用创新的Hybrid-Mamba-Transformer融...