A

首页 > A

豆包AI视频模型是什么？一文让你看懂豆包AI视频模型的技术原理、主要功能、应用场景

豆包AI视频模型概述简介豆包AI视频模型是字节跳动推出的两款AI视频生成大模型：PixelDance 和 Seaweed 。PixelDance基...
PDF2Audio是什么？一文让你看懂PDF2Audio的技术原理、主要功能、应用场景

PDF2Audio概述简介 PDF2Audio 是一个开源工具，能将 PDF 文档转换成音频内容，适合制作播客、讲座或摘要。它基于 OpenAI 的...
PearAI是什么？一文让你看懂PearAI的技术原理、主要功能、应用场景

PearAI概述简介 PearAI 是一个开源的 AI 驱动的代码编辑器，基于 Visual Studio Code (VSCode) 开发。Pea...
EzAudio是什么？一文让你看懂EzAudio的技术原理、主要功能、应用场景

EzAudio概述简介 EzAudio是由约翰霍普金斯大学和腾讯AI实验室一起推出的一款文本到音频（Text-to-Audio, T2A）生成模型。...
AutoGen Studio是什么？一文让你看懂AutoGen Studio的技术原理、主要功能、应用场景

AutoGen Studio概述简介 AutoGen Studio 是微软研究院推出的一款开源界面工具，旨在简化多智能体系统的构建、调试和评估过程。...
AMD-135M是什么？一文让你看懂AMD-135M的技术原理、主要功能、应用场景

AMD-135M概述简介 AMD-135M是AMD推出的第一款小型语言大模型（SLM），为特定用例提供性能与资源消耗之间的平衡。基于LLaMA2模型...
Mini-LLaVA是什么？一文让你看懂Mini-LLaVA的技术原理、主要功能、应用场景

Mini-LLaVA概述简介 Mini-LLaVA是一款轻量级的多模态大语言大模型，由清华大学和北京航空航天大学的研究团队联合开发。能处理图像、文本...
WebDesignAgent是什么？一文让你看懂WebDesignAgent的技术原理、主要功能、应用场景

WebDesignAgent概述简介 WebDesignAgent是一个自动化的网页设计工具，基于AI技术帮助用户轻松创建网站。用户提供简单的文本描...
RD-Agent是什么？一文让你看懂RD-Agent的技术原理、主要功能、应用场景

RD-Agent概述简介 RD-Agent是一个开源的自动化研究与开发（R&D）工具，由微软亚洲研究院推出。基于AI技术推动数据驱动的AI研发过程，...
Realtime API是什么？一文让你看懂Realtime API的技术原理、主要功能、应用场景

Realtime API概述简介 Realtime API是OpenAI推出的一种低延迟、多模态的对话式API，支持文本和音频作为输入和输出。Rea...
MIP-Adapter是什么？一文让你看懂MIP-Adapter的技术原理、主要功能、应用场景

MIP-Adapter概述简介 MIP-Adapter是一种个性化图像生成技术，由阿里集团推出并开源。基于IP-Adapter模型，进一步扩展其能力...
LiveKit Agents是什么？一文让你看懂LiveKit Agents的技术原理、主要功能、应用场景

LiveKit Agents概述简介 LiveKit Agents 是一个强大的框架，用于创建能实时通过语音、视频和数据与用户互动的多模态AI代理。...
IFAdapter是什么？一文让你看懂IFAdapter的技术原理、主要功能、应用场景

IFAdapter概述简介 IFAdapter是一种新型的文本到图像生成模型，由腾讯和新加坡国立大学一起推出。提升生成含有多个实例的图像时的位置和特...
TinyVLA是什么？一文让你看懂TinyVLA的技术原理、主要功能、应用场景

TinyVLA概述简介 TinyVLA是一种面向机器人操控的视觉-语言-动作（VLA）模型，由华东师范大学和上海大学团队推出。针对现有VLA模型的不...
Reverb ASR是什么？一文让你看懂Reverb ASR的技术原理、主要功能、应用场景

Reverb ASR概述简介 Reverb ASR是Rev公司推出的开源自动语音识别和说话人分离模型，基于20万小时的人工转录英语数据训练而成。模型...
Crawl4AI是什么？一文让你看懂Crawl4AI的技术原理、主要功能、应用场景

Crawl4AI概述简介 Crawl4AI是一款用 Python 开发的异步爬虫框架，专为大型语言大模型（LLMs）和人工智能（AI）应用设计，简化...
Wren AI是什么？一文让你看懂Wren AI的技术原理、主要功能、应用场景

Wren AI概述简介 Wren AI 是一个开源的文本到 SQL 解决方案，基于自然语言处理技术，支持用户通过自然语言提问执行数据库查询，无需编写...
Aria是什么？一文让你看懂Aria的技术原理、主要功能、应用场景

Aria概述简介 Aria是由Rhymes AI团队推出全球首个开源多模态原生混合专家（MoE）模型，能理解和处理文本、代码、图像和视频等多种输入模...
LightRAG是什么？一文让你看懂LightRAG的技术原理、主要功能、应用场景

LightRAG概述简介 LightRAG是由香港大学研究团队推出的一种检索增强生成（Retrieval-Augmented Generation,...
Gen2Act是什么？一文让你看懂Gen2Act的技术原理、主要功能、应用场景

Gen2Act概述简介 Gen2Act是由谷歌、卡内基梅隆大学和斯坦福大学一起推出的一种机器人操作策略，基于预测网络数据中的运动信息来生成人类视频，...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL