收集全球10,000⁺个好用的AI软件
-
AutoGLM是什么?一文让你看懂AutoGLM的技术原理、主要功能、应用场景AutoGLM概述简介 AutoGLM是智谱AI团队最新推出的 “Phone Use” AI智能体,基于图形用户界面(GUI)实现自主任务完成。Au...
-
EveryoneNobel是什么?一文让你看懂EveryoneNobel的技术原理、主要功能、应用场景EveryoneNobel概述简介 EveryoneNobel是一个开源AI工具,为每个人生成个性化的诺贝尔奖风格图像。EveryoneNobel基...
-
TextHarmony是什么?一文让你看懂TextHarmony的技术原理、主要功能、应用场景TextHarmony概述简介 TextHarmony是华东师范大学和字节跳动一起推出的多模态生成模型,擅长理解和生成视觉文本。模型基于Slide-...
-
BlinkShot是什么?一文让你看懂BlinkShot的技术原理、主要功能、应用场景BlinkShot概述简介 BlinkShot是实时AI图像生成器,能迅速生成高质量的图像。用户只需输入提示,BlinkShot能在几毫秒内生成图像...
-
NotebookLlama是什么?一文让你看懂NotebookLlama的技术原理、主要功能、应用场景NotebookLlama概述简介 NotebookLlama是Meta推出的将PDF文档转换成播客内容的开源项目。项目基于一系列自动化步骤实现,用...
-
WonderWorld是什么?一文让你看懂WonderWorld的技术原理、主要功能、应用场景WonderWorld概述简介 WonderWorld是斯坦福大学和麻省理工学院一起推出的创新性3D场景生成框架,能从单张图片快速生成多样化且连贯的...
-
Meissonic是什么?一文让你看懂Meissonic的技术原理、主要功能、应用场景Meissonic概述简介 Meissonic是由阿里集团、Skywork AI等多所大学合作推出的文本到图像合成模型。基于掩蔽图像建模技术,结合多...
-
Zamba2-7B是什么?一文让你看懂Zamba2-7B的技术原理、主要功能、应用场景Zamba2-7B概述简介 Zamba2-7B是Zyphra公司推出的小型语言大模型,基于创新的架构在保持输出质量的同时实现快速的推理速度和低内存占...
-
PersonaTalk是什么?一文让你看懂PersonaTalk的技术原理、主要功能、应用场景PersonaTalk概述简介 PersonaTalk是字节跳动推出的基于注意力机制的两阶段框架,用在实现高保真度和个性化的视觉配音。Persona...
-
OpenSPG是什么?一文让你看懂OpenSPG的技术原理、主要功能、应用场景OpenSPG概述简介 OpenSPG是蚂蚁集团联合OpenKG社区推出的基于SPG框架的知识图谱引擎。OpenSPG融合LPG的结构性和RDF的语...
-
LongVU是什么?一文让你看懂LongVU的技术原理、主要功能、应用场景LongVU概述简介 LongVU是Meta AI团队推出的长视频理解模型,基于时空自适应压缩机制。解决处理长视频时受限于大型语言大模型(LLM)上...
-
SynthID Text是什么?一文让你看懂SynthID Text的技术原理、主要功能、应用场景SynthID Text 概述简介 SynthID Text 是谷歌DeepMind 推出的文本水印技术,用在识别和验证由大型语言大模型(LLM)生...
-
VILA-U 是什么?一文让你看懂VILA-U 的技术原理、主要功能、应用场景VILA-U概述简介 VILA-U是集成视频、图像、语言理解和生成的统一基础模型。基于单一的自回归下一个标记预测框架处理理解和生成任务,简化模型结构...
-
Video-XL是什么?一文让你看懂Video-XL的技术原理、主要功能、应用场景Video-XL概述简介 Video-XL是北京智源人工智能研究院联合上海交大、中国人民大学、中科院、北邮和北大的开发人员一起推出的专为小时级视频理...
-
Embed3是什么?一文让你看懂Embed3的技术原理、主要功能、应用场景Embed3概述简介 Embed3是Cohere公司推出的行业领先的多模态AI搜索模型,能从文本和图像生成嵌入向量,帮助企业快速准确地搜索复杂报告、...
-
DriveDreamer4D是什么?一文让你看懂DriveDreamer4D的技术原理、主要功能、应用场景DriveDreamer4D概述简介 DriveDreamer4D是用在提升自动驾驶场景4D重建质量的框架,基于世界模型先验增强4D驾驶场景的表示。...
-
Animate-X是什么?一文让你看懂Animate-X的技术原理、主要功能、应用场景Animate-X概述简介 Animate-X是基于LDM的通用动画框架,能将静态图像转化为动态视频,擅长处理拟人化角色。 通过引入姿势指示器,增强...
-
MarDini是什么?一文让你看懂MarDini的技术原理、主要功能、应用场景MarDini概述简介 MarDini是新型的视频扩散模型,融合掩码自回归(MAR)和扩散模型(DM)的优势,用在大规模视频生成。模型能处理任意数量...
-
SDXL-EcomID是什么?一文让你看懂SDXL-EcomID的技术原理、主要功能、应用场景SDXL-EcomID概述简介 SDXL-EcomID是阿里妈妈推出的开源项目,从单个参考图像生成定制的个性图像。融合PuLID和InstantID...
-
DreamClear是什么?一文让你看懂DreamClear的技术原理、主要功能、应用场景DreamClear概述简介 DreamClear是中国科学院自动化研究所和字节跳动团队联合推出的高性能图像修复技术,专注于隐私安全的数据集管理,能...