收集全球10,000⁺个好用的AI软件
-
Realtime API是什么?一文让你看懂Realtime API的技术原理、主要功能、应用场景Realtime API概述简介 Realtime API是OpenAI推出的一种低延迟、多模态的对话式API,支持文本和音频作为输入和输出。Rea...
-
Reverb ASR是什么?一文让你看懂Reverb ASR的技术原理、主要功能、应用场景Reverb ASR概述简介 Reverb ASR是Rev公司推出的开源自动语音识别和说话人分离模型,基于20万小时的人工转录英语数据训练而成。模型...
-
Red_Panda是什么?一文让你看懂Red_Panda的技术原理、主要功能、应用场景Red_Panda概述简介 Red_Panda 是 Recraft V3 在发布初期使用的化名,是Recraft AI推出的先进AI图像生成模型,以...
-
LongReward是什么?一文让你看懂LongReward的技术原理、主要功能、应用场景LongReward概述简介 LongReward是清华大学、中国科学院、智谱AI联合推出的,基于AI反馈改进长文本大型语言大模型(LLMs)性能的...
-
Recraft V3是什么?一文让你看懂Recraft V3的技术原理、主要功能、应用场景Recraft V3概述简介 Recraft V3是Recraft公司推出的AI文本到图像生成模型,在Hugging Face的文本到图像模型排行榜...
-
AgentReview是什么?一文让你看懂AgentReview的技术原理、主要功能、应用场景AgentReview概述简介 AgentReview是基于大型语言大模型(LLM)的框架,模拟学术同行评审过程。AgentReview基于LLM代...
-
ReCapture是什么?一文让你看懂ReCapture的技术原理、主要功能、应用场景ReCapture概述简介 ReCapture是谷歌和新加坡国立大学推出的视频处理技术,能从单一用户提供的视频中生成具有新相机轨迹的新视频。ReCa...
-
Talker-Reasoner是什么?一文让你看懂Talker-Reasoner的技术原理、主要功能、应用场景Talker-Reasoner概述简介 Talker-Reasoner是谷歌DeepMind推出的双思维AI代理架构,借鉴人类的认知理论,将代理分为...
-
Bocha Semantic Reranker是什么?一文让你看懂Bocha Semantic Reranker的技术原理、主要功能、应用场景Bocha Semantic Reranker概述简介 Bocha Semantic Reranker是博查AI推出的语义排序模型,能提升搜索应用和...
-
UniReal是什么?一文让你看懂UniReal的技术原理、主要功能、应用场景UniReal概述简介 UniReal是香港大学和Adobe研究院一起推出的框架,专注于实现多种图像生成和编辑任务。框架基于模拟现实世界动态,能在单...
-
Jina Reader是什么?一文让你看懂Jina Reader的技术原理、主要功能、应用场景Jina Reader是什么 Jina Reader 是 Jina AI 推出的开源工具,能将互联网上的 HTML 网页内容转换为适合大型语言大模型...
-
RealisHuman是什么?一文让你看懂RealisHuman的技术原理、主要功能、应用场景RealisHuman概述简介 RealisHuman 是创新的后处理框架,细化生成图像中的人体部位,如手和脸等。框架通过两阶段的方法来实现这一目标...
-
VideoRefer是什么?一文让你看懂VideoRefer的技术原理、主要功能、应用场景VideoRefer概述简介 VideoRefer是浙江大学和阿里达摩学院联合推出的,专门用在视频中对象的感知和推理。基于增强视频大型语言大模型(V...
-
RealtimeSTT是什么?一文让你看懂RealtimeSTT的技术原理、主要功能、应用场景RealtimeSTT概述简介 RealtimeSTT是开源的实时语音转文本库,专为低延迟应用设计。有强大的语音活动检测功能,可自动识别说话的开始与...
-
GLM-Realtime是什么?一文让你看懂GLM-Realtime的技术原理、主要功能、应用场景GLM-Realtime概述简介 GLM-Realtime是智谱推出的全新端到端多模态模型,具备低延迟的视频理解与语音交互能力,特别融入清唱功能,让...
-
VideoReward是什么?一文让你看懂VideoReward的技术原理、主要功能、应用场景VideoReward概述简介 VideoReward 是香港中文大学、清华大学、快手科技等联合创建的视频生成偏好数据集及奖励模型。包含182,00...
-
OpenDeepResearcher是什么?一文让你看懂OpenDeepResearcher的技术原理、主要功能、应用场景OpenDeepResearcher概述简介 OpenDeepResearcher 是开源的 AI 研究工具,能帮助用户高效地完成复杂的信息查询和分...
-
node-DeepResearch是什么?一文让你看懂node-DeepResearch的技术原理、主要功能、应用场景node-DeepResearch概述简介 node-DeepResearch 是开源的 AI 智能体项目,基于持续搜索和阅读网页,用 Gemini...
-
Open Deep Research是什么?一文让你看懂Open Deep Research的技术原理、主要功能、应用场景Open Deep Research概述简介 Open Deep Research 是开源的 AI 智能体,是Deep Research开源复现项目...
-
FireRedASR是什么?一文让你看懂FireRedASR的技术原理、主要功能、应用场景FireRedASR概述简介 FireRedASR 是小红书开源的工业级自动语音识别(ASR)模型家族,支持普通话、中文方言和英语,在普通话 ASR...