收集全球10,000⁺个好用的AI软件
-
CogVideoX-Fun是什么?一文让你看懂CogVideoX-Fun的技术原理、主要功能、应用场景CogVideoX-Fun概述简介 CogVideoX-Fun是一个基于CogVideoX结合EasyAnimate修改的AI视频生成整合包,提供了...
-
SFR-RAG是什么?一文让你看懂SFR-RAG的技术原理、主要功能、应用场景SFR-RAG概述简介 SFR-RAG是由Salesforce AI Research推出的一款大型语言大模型,专注于提升机器在理解和生成文本方面的...
-
PDF2Audio是什么?一文让你看懂PDF2Audio的技术原理、主要功能、应用场景PDF2Audio概述简介 PDF2Audio 是一个开源工具,能将 PDF 文档转换成音频内容,适合制作播客、讲座或摘要。它基于 OpenAI 的...
-
FLUX-Controlnet-Inpainting是什么?一文让你看懂FLUX-Controlnet-Inpainting的技术原理、主要功能、应用场景FLUX-Controlnet-Inpainting概述简介 FLUX-Controlnet-Inpainting 是阿里妈妈(Alibaba’s ...
-
IDIFY是什么?一文让你看懂IDIFY的技术原理、主要功能、应用场景IDIFY概述简介 IDIFY是一款免费开源的在线证件照生成工具,通过AI技术实现自动抠图,帮助用户快速生成符合标准的证件照。用户只需在浏览器中上传...
-
MemFree是什么?一文让你看懂MemFree的技术原理、主要功能、应用场景MemFree概述简介 MemFree是一款开源的混合AI搜索引擎,通过整合多种AI大模型和搜索引擎,提供高效、多样化的搜索体验。可以用文本、图像、...
-
OutofFocus是什么?一文让你看懂OutofFocus的技术原理、主要功能、应用场景OutofFocus概述简介 OutofFocus是一个基于AI技术的图像编辑工具,基于Gradio平台为用户提供一个直观的界面操作和编辑图片。工具...
-
FLUX1.1是什么?一文让你看懂FLUX1.1的技术原理、主要功能、应用场景FLUX1.1概述简介 FLUX1.1 Pro是Black Forest Labs团队最新推出的升级版AI图像生成模型,代号“蓝莓”,提供比前代快6...
-
FineZip是什么?一文让你看懂FineZip的技术原理、主要功能、应用场景FineZip概述简介 FineZip 是一种基于大型语言大模型(LLMs)的无损文本压缩系统,结合在线记忆和动态上下文大小技术,提高文本压缩的速度...
-
IFAdapter是什么?一文让你看懂IFAdapter的技术原理、主要功能、应用场景IFAdapter概述简介 IFAdapter是一种新型的文本到图像生成模型,由腾讯和新加坡国立大学一起推出。提升生成含有多个实例的图像时的位置和特...
-
Future You是什么?一文让你看懂Future You的技术原理、主要功能、应用场景Future You概述简介 Future You是麻省理工学院(MIT)推出的AI对话聊天产品,支持用户与60岁时的虚拟形象进行互动对话。Futu...
-
Pyramid-Flow是什么?一文让你看懂Pyramid-Flow的技术原理、主要功能、应用场景Pyramid-Flow概述简介 Pyramid-Flow是一种先进的视频生成模型,由北京大学、快手科技和北京邮电大学的开发人员联合推出。模型根据文...
-
F5-TTS是什么?一文让你看懂F5-TTS的技术原理、主要功能、应用场景F5-TTS概述简介 F5-TTS是由上海交通大学开源的一款高性能文本到语音(TTS)系统,基于流匹配的非自回归生成方法,结合扩散变换器(DiT)技...
-
FLUX.1-Turbo-Alpha是什么?一文让你看懂FLUX.1-Turbo-Alpha的技术原理、主要功能、应用场景FLUX.1-Turbo-Alpha概述简介 FLUX.1-Turbo-Alpha是阿里妈妈创意团队基于FLUX.1-dev模型训练的8步蒸馏Lor...
-
Adobe Firefly是什么?一文让你看懂Adobe Firefly的技术原理、主要功能、应用场景Adobe Firefly概述简介 Adobe Firefly 是 Adobe 推出的一系列创意生成式 AI 模型,旨在帮助用户扩展其天生的创造力。...
-
FunASR是什么?一文让你看懂FunASR的技术原理、主要功能、应用场景FunASR概述简介 FunASR是由阿里巴巴达摩院开源的语音识别工具包,提供包括语音识别(ASR)、语音活动检测(VAD)、标点恢复、语言大模型、...
-
PDFtoChat是什么?一文让你看懂PDFtoChat的技术原理、主要功能、应用场景PDFtoChat概述简介 PDFtoChat 是一个开源的创新AI项目,支持用户基于自然语言对话的方式与 PDF 文件互动。工具基于最新的 AI 技...
-
Fluid是什么?一文让你看懂Fluid的技术原理、主要功能、应用场景Fluid概述简介 Fluid是由Google DeepMind和MIT一起推出的文本到图像的自回归生成模型,基于连续标记和随机生成顺序的方法,在视...
-
Flux.1 Lite是什么?一文让你看懂Flux.1 Lite的技术原理、主要功能、应用场景Flux.1 Lite概述简介 Flux.1 Lite是Freepik团队推出的轻量级AI大模型,目前处于alpha版本。Flux.1 Lite是基...
-
FakeShield是什么?一文让你看懂FakeShield的技术原理、主要功能、应用场景FakeShield概述简介 FakeShield是北京大学开发人员推出的多模态大型语言大模型框架,能检测和定位图像伪造。框架能评估图像的真实性,生...