收集全球10,000⁺个好用的AI软件
-
GPTEngineer是什么?一文让你看懂GPTEngineer的技术原理、主要功能、应用场景GPTEngineer概述简介 GPTEngineer 是一个基于 AI 技术通过简单的文本提示快速生成网页应用原型的开源工具。用户只需描述需求,A... -
STranslate是什么?一文让你看懂STranslate的技术原理、主要功能、应用场景STranslate概述简介 STranslate是专为Windows用户设计的多功能翻译和OCR工具。支持多种语言翻译,具备划词、截图、监听剪贴板... -
LTM-2-mini是什么?一文让你看懂LTM-2-mini的技术原理、主要功能、应用场景LTM-2-mini概述简介 LTM-2-mini是Magic公司推出的支持1亿token上下文AI大模型,能处理相当于1000万行代码或750本小... -
PGTFormer是什么?一文让你看懂PGTFormer的技术原理、主要功能、应用场景PGTFormer概述简介 PGTFormer是先进的视频人脸修复框架,通过解析引导的时间一致性变换器来恢复视频中的高保真细节,同时增强时间连贯性。... -
Torch-MLU是什么?一文让你看懂Torch-MLU的技术原理、主要功能、应用场景Torch-MLU概述简介 Torch-MLU 是寒武纪开源的 PyTorch 设备后端扩展插件,支持开发者将寒武纪 MLU 系列智能加速卡作为 P... -
PyVideoTrans是什么?一文让你看懂PyVideoTrans的技术原理、主要功能、应用场景PyVideoTrans概述简介 PyVideoTrans 是开源的视频翻译配音工具,将视频内容从一种语言自动翻译成另一种语言,并添加相应的字幕和配... -
QA-MDT是什么?一文让你看懂QA-MDT的技术原理、主要功能、应用场景QA-MDT概述简介 QA-MDT(Quality-aware Masked Diffusion Transformer)是由中国科学技术大学和科大... -
PoseTalk是什么?一文让你看懂PoseTalk的技术原理、主要功能、应用场景PoseTalk概述简介 PoseTalk 是基于文本和音频的姿势控制和运动细化方法的开源项目,用于一次性生成会说话的头部视频。从图像、驱动音频和驱... -
书生·物华2.0(3DTopia 2.0)是什么?一文让你看懂书生·物华2.0(3DTopia 2.0)的技术原理、主要功能、应用场景书生·物华2.0概述简介 书生·物华2.0(3DTopia 2.0)是由上海人工智能实验室与南洋理工大学联合开发的三维物体生成大模型。模型采用创新的... -
ANTO是什么?一文让你看懂ANTO的技术原理、主要功能、应用场景ANTO概述简介 ANTO是一款开源的Windows桌面字幕翻译工具,用于翻译SRT格式的视频字幕文件。集成多种翻译引擎,如谷歌翻译、DeepL、微... -
GOT-OCR2.0是什么?一文让你看懂GOT-OCR2.0的技术原理、主要功能、应用场景GOT-OCR2.0概述简介 GOT-OCR 2.0是一种先进的光学字符识别(OCR)模型,推动OCR技术进入2.0时代。GOT-OCR 2.0端到... -
Comic Translate是什么?一文让你看懂Comic Translate的技术原理、主要功能、应用场景Comic Translate概述简介 Comic Translate 是一个开源的漫画翻译工具,由开发者 ogkalu2 推出。帮助用户自动翻译全... -
RTranslator是什么?一文让你看懂RTranslator的技术原理、主要功能、应用场景RTranslator概述简介 RTranslator 是一款开源、免费、离线实时翻译应用程序,专为 Android 设备设计。基于先进的AI技术,... -
TeleChat2-115B是什么?一文让你看懂TeleChat2-115B的技术原理、主要功能、应用场景TeleChat2-115B概述简介 TeleChat2-115B是由中国电信人工智能研究院(TeleAI)研发的大型语言大模型,属于星辰语义大模型... -
CDial-GPT是什么?一文让你看懂CDial-GPT的技术原理、主要功能、应用场景CDial-GPT概述简介 CDial-GPT是清华大学研究团队推出的大型中文短文本对话数据集LCCC及基于数据集的预训练对话生成模型。LCCC数据... -
CatVTON是什么?一文让你看懂CatVTON的技术原理、主要功能、应用场景CatVTON概述简介 CatVTON是一种先进的虚拟试衣技术,由中山大学和Pixocial联合推出。基于轻量化的架构和高效的训练策略,实现高质量的... -
Boow-VTON是什么?一文让你看懂Boow-VTON的技术原理、主要功能、应用场景Boow-VTON概述简介 Boow-VTON是阿里巴巴推出的一种先进的虚拟试衣技术。能在野外场景中实现高质量的虚拟试衣效果,无需依赖精确的遮罩或修... -
TinyVLA是什么?一文让你看懂TinyVLA的技术原理、主要功能、应用场景TinyVLA概述简介 TinyVLA是一种面向机器人操控的视觉-语言-动作(VLA)模型,由华东师范大学和上海大学团队推出。针对现有VLA模型的不... -
F5-TTS是什么?一文让你看懂F5-TTS的技术原理、主要功能、应用场景F5-TTS概述简介 F5-TTS是由上海交通大学开源的一款高性能文本到语音(TTS)系统,基于流匹配的非自回归生成方法,结合扩散变换器(DiT)技... -
GTSinger是什么?一文让你看懂GTSinger的技术原理、主要功能、应用场景GTSinger概述简介 GTSinger是由浙江大学研究团队推出的大型开源高质量歌声数据集,旨在支持多样化的歌声任务。GTSinger包含80.5...