收集全球10,000⁺个好用的AI软件
-
LVCD是什么?一文让你看懂LVCD的技术原理、主要功能、应用场景LVCD概述简介 LVCD(Large Video Color Diffusion)是一个专为动画视频线稿上色设计的视频扩散框架,能将黑白线稿自动转...
-
LLaMA-Omni是什么?一文让你看懂LLaMA-Omni的技术原理、主要功能、应用场景LLaMA-Omni概述简介 LLaMA-Omni 是中国科学院计算技术研究所和中国科学院大学研究者推出的新型模型架构,用于实现与大型语言大模型(L...
-
SCoRe是什么?一文让你看懂SCoRe的技术原理、主要功能、应用场景SCoRe概述简介 SCoRe(Self-Correction via Reinforcement Learning)是谷歌DeepMind推出的一...
-
AiNiee是什么?一文让你看懂AiNiee的技术原理、主要功能、应用场景AiNiee概述简介 AiNiee 是一款AI翻译工具,能一键自动翻译RPG、SLG游戏、Epub、TXT格式的小说、Srt、Lrc字幕文件等。工具...
-
ANTO是什么?一文让你看懂ANTO的技术原理、主要功能、应用场景ANTO概述简介 ANTO是一款开源的Windows桌面字幕翻译工具,用于翻译SRT格式的视频字幕文件。集成多种翻译引擎,如谷歌翻译、DeepL、微...
-
OpenMusic是什么?一文让你看懂OpenMusic的技术原理、主要功能、应用场景OpenMusic概述简介 OpenMusic 是一款基于 QA-MDT(Quality-aware Masked Diffusion Transf...
-
SFR-RAG是什么?一文让你看懂SFR-RAG的技术原理、主要功能、应用场景SFR-RAG概述简介 SFR-RAG是由Salesforce AI Research推出的一款大型语言大模型,专注于提升机器在理解和生成文本方面的...
-
onewebot2是什么?一文让你看懂onewebot2的技术原理、主要功能、应用场景onewebot2概述简介 oneWebot2是一款微信AI机器人一键运行软件包,用户下载exe文件后,双击即可启动,无需复杂的Python环境配置...
-
GOT-OCR2.0是什么?一文让你看懂GOT-OCR2.0的技术原理、主要功能、应用场景GOT-OCR2.0概述简介 GOT-OCR 2.0是一种先进的光学字符识别(OCR)模型,推动OCR技术进入2.0时代。GOT-OCR 2.0端到...
-
豆包PixelDance是什么?一文让你看懂豆包PixelDance的技术原理、主要功能、应用场景豆包PixelDance概述简介 豆包PixelDance是字节跳动最新推出的AI视频生成模型,采用DiT结构,支持文生视频和图生视频。它能理解复杂...
-
豆包Seaweed是什么?一文让你看懂豆包Seaweed的技术原理、主要功能、应用场景豆包Seaweed概述简介 豆包Seaweed是字节跳动推出的AI视频生成模型,支持文生视频和图生视频两种模式。基于Transformer结构,利用...
-
PortraitGen是什么?一文让你看懂PortraitGen的技术原理、主要功能、应用场景PortraitGen概述简介 PortraitGen是中国科学技术大学研究团队推出的一款AI人像视频编辑工具。基于3D高斯溅射技术和神经高斯纹理机...
-
MMMLU是什么?一文让你看懂MMMLU的技术原理、主要功能、应用场景MMMLU概述简介 MMMLU(多语言大规模多任务语言理解)是OpenAI推出的一个开源数据集,为评估和提升人工智能模型在不同语言、认知和文化背景下...
-
Llama 3.2是什么?一文让你看懂Llama 3.2的技术原理、主要功能、应用场景Llama 3.2概述简介 Llama 3.2是Meta公司最新推出的开源AI大模型系列,包括小型和中型视觉语言大模型(11B和90B参数)以及轻量...
-
MIMO是什么?一文让你看懂MIMO的技术原理、主要功能、应用场景MIMO概述简介 MIMO是阿里集团智能计算研究所推出的可控角色视频合成的新型AI框架,基于空间分解建模技术,将2D视频转换为3D空间代码,实现对角...
-
豆包AI视频模型是什么?一文让你看懂豆包AI视频模型的技术原理、主要功能、应用场景豆包AI视频模型概述简介 豆包AI视频模型是字节跳动推出的两款AI视频生成大模型:PixelDance 和 Seaweed 。PixelDance基...
-
美图奇想大模型是什么?一文让你看懂美图奇想大模型的技术原理、主要功能、应用场景美图奇想大模型概述简介 美图奇想大模型(MiracleVision)是美图公司推出的一款AI视觉大模型,专注于美学创作,包括东方美学、人像和商业设计...
-
SafeEar是什么?一文让你看懂SafeEar的技术原理、主要功能、应用场景SafeEar概述简介 SafeEar是由浙江大学和清华大学联合开发的AI音频伪造检测框架,保护用户隐私的同时检测音频伪造。采用基于神经音频编解码器...
-
PDF2Audio是什么?一文让你看懂PDF2Audio的技术原理、主要功能、应用场景PDF2Audio概述简介 PDF2Audio 是一个开源工具,能将 PDF 文档转换成音频内容,适合制作播客、讲座或摘要。它基于 OpenAI 的...
-
GraphReasoning是什么?一文让你看懂GraphReasoning的技术原理、主要功能、应用场景GraphReasoning概述简介 GraphReasoning是一种基于人工智能技术将大量科学论文转换成知识图谱的方法。通过结构化分析,计算节点...