收集全球10,000⁺个好用的AI软件
-
豆包AI视频模型是什么?一文让你看懂豆包AI视频模型的技术原理、主要功能、应用场景豆包AI视频模型概述简介 豆包AI视频模型是字节跳动推出的两款AI视频生成大模型:PixelDance 和 Seaweed 。PixelDance基...
-
PDF2Audio是什么?一文让你看懂PDF2Audio的技术原理、主要功能、应用场景PDF2Audio概述简介 PDF2Audio 是一个开源工具,能将 PDF 文档转换成音频内容,适合制作播客、讲座或摘要。它基于 OpenAI 的...
-
PearAI是什么?一文让你看懂PearAI的技术原理、主要功能、应用场景PearAI概述简介 PearAI 是一个开源的 AI 驱动的代码编辑器,基于 Visual Studio Code (VSCode) 开发。Pea...
-
EzAudio是什么?一文让你看懂EzAudio的技术原理、主要功能、应用场景EzAudio概述简介 EzAudio是由约翰霍普金斯大学和腾讯AI实验室一起推出的一款文本到音频(Text-to-Audio, T2A)生成模型。...
-
AutoGen Studio是什么?一文让你看懂AutoGen Studio的技术原理、主要功能、应用场景AutoGen Studio概述简介 AutoGen Studio 是微软研究院推出的一款开源界面工具,旨在简化多智能体系统的构建、调试和评估过程。...
-
AMD-135M是什么?一文让你看懂AMD-135M的技术原理、主要功能、应用场景AMD-135M概述简介 AMD-135M是AMD推出的第一款小型语言大模型(SLM),为特定用例提供性能与资源消耗之间的平衡。基于LLaMA2模型...
-
Mini-LLaVA是什么?一文让你看懂Mini-LLaVA的技术原理、主要功能、应用场景Mini-LLaVA概述简介 Mini-LLaVA是一款轻量级的多模态大语言大模型,由清华大学和北京航空航天大学的研究团队联合开发。能处理图像、文本...
-
WebDesignAgent是什么?一文让你看懂WebDesignAgent的技术原理、主要功能、应用场景WebDesignAgent概述简介 WebDesignAgent是一个自动化的网页设计工具,基于AI技术帮助用户轻松创建网站。用户提供简单的文本描...
-
RD-Agent是什么?一文让你看懂RD-Agent的技术原理、主要功能、应用场景RD-Agent概述简介 RD-Agent是一个开源的自动化研究与开发(R&D)工具,由微软亚洲研究院推出。基于AI技术推动数据驱动的AI研发过程,...
-
Realtime API是什么?一文让你看懂Realtime API的技术原理、主要功能、应用场景Realtime API概述简介 Realtime API是OpenAI推出的一种低延迟、多模态的对话式API,支持文本和音频作为输入和输出。Rea...
-
MIP-Adapter是什么?一文让你看懂MIP-Adapter的技术原理、主要功能、应用场景MIP-Adapter概述简介 MIP-Adapter是一种个性化图像生成技术,由阿里集团推出并开源。基于IP-Adapter模型,进一步扩展其能力...
-
LiveKit Agents是什么?一文让你看懂LiveKit Agents的技术原理、主要功能、应用场景LiveKit Agents概述简介 LiveKit Agents 是一个强大的框架,用于创建能实时通过语音、视频和数据与用户互动的多模态AI代理。...
-
IFAdapter是什么?一文让你看懂IFAdapter的技术原理、主要功能、应用场景IFAdapter概述简介 IFAdapter是一种新型的文本到图像生成模型,由腾讯和新加坡国立大学一起推出。提升生成含有多个实例的图像时的位置和特...
-
TinyVLA是什么?一文让你看懂TinyVLA的技术原理、主要功能、应用场景TinyVLA概述简介 TinyVLA是一种面向机器人操控的视觉-语言-动作(VLA)模型,由华东师范大学和上海大学团队推出。针对现有VLA模型的不...
-
Reverb ASR是什么?一文让你看懂Reverb ASR的技术原理、主要功能、应用场景Reverb ASR概述简介 Reverb ASR是Rev公司推出的开源自动语音识别和说话人分离模型,基于20万小时的人工转录英语数据训练而成。模型...
-
Crawl4AI是什么?一文让你看懂Crawl4AI的技术原理、主要功能、应用场景Crawl4AI概述简介 Crawl4AI是一款用 Python 开发的异步爬虫框架,专为大型语言大模型(LLMs)和人工智能(AI)应用设计,简化...
-
Wren AI是什么?一文让你看懂Wren AI的技术原理、主要功能、应用场景Wren AI概述简介 Wren AI 是一个开源的文本到 SQL 解决方案,基于自然语言处理技术,支持用户通过自然语言提问执行数据库查询,无需编写...
-
Aria是什么?一文让你看懂Aria的技术原理、主要功能、应用场景Aria概述简介 Aria是由Rhymes AI团队推出全球首个开源多模态原生混合专家(MoE)模型,能理解和处理文本、代码、图像和视频等多种输入模...
-
LightRAG是什么?一文让你看懂LightRAG的技术原理、主要功能、应用场景LightRAG概述简介 LightRAG是由香港大学研究团队推出的一种检索增强生成(Retrieval-Augmented Generation,...
-
Gen2Act是什么?一文让你看懂Gen2Act的技术原理、主要功能、应用场景Gen2Act概述简介 Gen2Act是由谷歌、卡内基梅隆大学和斯坦福大学一起推出的一种机器人操作策略,基于预测网络数据中的运动信息来生成人类视频,...