收集全球10,000⁺个好用的AI软件
-
BitsAI-CR是什么?一文让你看懂BitsAI-CR的技术原理、主要功能、应用场景BitsAI-CR概述简介 BitsAI-CR是字节跳动团队推出的基于大型语言大模型(LLM)的自动化代码审查工具,通过两阶段处理流程实现高效代码审...
-
DiffSplat是什么?一文让你看懂DiffSplat的技术原理、主要功能、应用场景DiffSplat概述简介 DiffSplat是新型的 3D 生成方法,从文本提示和单视图图像快速生成 3D 高斯点阵(Gaussian Splat...
-
X-Prompt是什么?一文让你看懂X-Prompt的技术原理、主要功能、应用场景X-Prompt概述简介 X-Prompt是用于多模态视频目标分割的通用框架,解决传统方法在极端光照、快速运动和背景干扰等复杂场景下的局限性。通过预...
-
VideoReward是什么?一文让你看懂VideoReward的技术原理、主要功能、应用场景VideoReward概述简介 VideoReward 是香港中文大学、清华大学、快手科技等联合创建的视频生成偏好数据集及奖励模型。包含182,00...
-
MILS是什么?一文让你看懂MILS的技术原理、主要功能、应用场景MILS概述简介 MILS(Multimodal Iterative LLM Solver)是Meta AI提出的无需训练即可赋予大型语言大模型(L...
-
OpenDeepResearcher是什么?一文让你看懂OpenDeepResearcher的技术原理、主要功能、应用场景OpenDeepResearcher概述简介 OpenDeepResearcher 是开源的 AI 研究工具,能帮助用户高效地完成复杂的信息查询和分...
-
OCRmyPDF是什么?一文让你看懂OCRmyPDF的技术原理、主要功能、应用场景OCRmyPDF概述简介 OCRmyPDF 是开源的命令行工具,专为将扫描的 PDF 文件转换为可搜索、可复制的文档。通过添加 OCR 文本层,将无...
-
node-DeepResearch是什么?一文让你看懂node-DeepResearch的技术原理、主要功能、应用场景node-DeepResearch概述简介 node-DeepResearch 是开源的 AI 智能体项目,基于持续搜索和阅读网页,用 Gemini...
-
OmniHuman是什么?一文让你看懂OmniHuman的技术原理、主要功能、应用场景OmniHuman概述简介 OmniHuman是字节跳动推出的端到端多模态条件化人类视频生成框架,能基于单张人类图像和运动信号(如音频、视频或两者的...
-
DeepRAG是什么?一文让你看懂DeepRAG的技术原理、主要功能、应用场景DeepRAG概述简介 DeepRAG 是中科院、中科大和腾讯微信AI部联合推出的新型检索增强生成(RAG)框架,提升大型语言大模型(LLMs)在推...
-
MnnLlmApp是什么?一文让你看懂MnnLlmApp的技术原理、主要功能、应用场景MnnLlmApp概述简介 MnnLlmApp 是阿里巴巴基于 MNN-LLM 框架开源的 Android 手机应用,支持各类大语言大模型(LLM)...
-
DynamicFace是什么?一文让你看懂DynamicFace的技术原理、主要功能、应用场景DynamicFace概述简介 DynamicFace是小红书团队推出新型的视频换脸技术,技术通过结合扩散模型和即插即用的时间层,基于3D面部先验知...
-
Open Deep Research是什么?一文让你看懂Open Deep Research的技术原理、主要功能、应用场景Open Deep Research概述简介 Open Deep Research 是开源的 AI 智能体,是Deep Research开源复现项目...
-
Chatbox AI是什么?一文让你看懂Chatbox AI的技术原理、主要功能、应用场景Chatbox AI概述简介 Chatbox AI是开源的跨平台AI客户端应用和智能助手,支持 Windows、Mac、Linux、iOS、Andr...
-
RAG-FiT是什么?一文让你看懂RAG-FiT的技术原理、主要功能、应用场景RAG-FiT概述简介 RAG-FiT(曾用名RAG Foundry)是英特尔实验室推出的开源框架,用在微调(fine-tuning)增强大型语言大...
-
FluxSR是什么?一文让你看懂FluxSR的技术原理、主要功能、应用场景FluxSR概述简介 FluxSR是新型的单步扩散模型,是上海交通大学、哈佛大学、华南理工大学和华为诺亚方舟实验室推出的专门用在真实世界图像超分辨率...
-
s1是什么?一文让你看懂s1的技术原理、主要功能、应用场景s1概述简介 s1是斯坦福大学和华盛顿大学的研究团队开发的低成本、高性能的AI推理模型。模型通过“蒸馏”技术从谷歌的Gemini 2.0 Flash...
-
VideoJAM是什么?一文让你看懂VideoJAM的技术原理、主要功能、应用场景VideoJAM概述简介 VideoJAM是Meta推出的,用在增强视频生成模型运动连贯性的框架。基于引入联合外观-运动表示,让模型在训练阶段同时学...
-
SynCD是什么?一文让你看懂SynCD的技术原理、主要功能、应用场景SynCD概述简介 SynCD(Synthetic Customization Dataset)是卡内基梅隆大学和Meta推出的高质量合成训练数据集...
-
MatAnyone是什么?一文让你看懂MatAnyone的技术原理、主要功能、应用场景MatAnyone概述简介 MatAnyone是南洋理工大学S-Lab实验室和商汤科技推出的,针对复杂背景人像视频抠图的先进框架,专注于目标指定的视...