AI TOOL

AI软件大全 AI软件大全
  • AI排行榜
  • AI大模型
    • AI开发框架
    • 国外大模型
    • 国产大模型
    • 开源大模型
    • AI训练模型
  • AI写作软件
    • AI通用写作
    • AI PPT生成
    • 论文AI生成
    • AI小说生成
    • AI脚本剧本
    • AI歌词生成器
    • AI文案生成
    • AI会议助手
    • AI图表生成
    • AI内容检测
  • AI图片生成
    • AI绘画生成
    • AI图片编辑
    • AI 图标生成器
    • 文字生成图片
    • 图片生成图片
    • 图片生成3D
    • AI LOGO生成器
    • AI图片识别
    • 图片生成网页
  • AI视频生成
    • AI视频生成
    • 文字生成视频
    • AI视频换脸
    • 图片生成视频
    • AI虚拟数字人
    • AI视频编辑
    • AI视频直播
    • AI短剧生成
    • AI动漫视频
  • AI音频生成
    • 文字转语音
    • 语音转文字
    • AI音乐创作
    • AI语音识别
    • AI声音降噪
    • AI声音克隆
    • AI音频编辑
  • AI设计软件
    • AI网页设计
    • AI平面设计
    • AI 3D设计
    • AI室内设计
    • AI绘画设计
    • AI游戏设计
    • AI建筑设计
  • AI营销软件
    • AI SEO
    • 社媒营销
    • 网红营销
    • 广告投流
    • 邮件营销
    • 流量变现
    • 裂变增长
    • AI CRM
    • 数据分析
    • 电商平台
    • 营销平台
  • AI智能编程
    • AI开发者工具
    • AI机构协会
    • AI编程开发
    • AI搜索引擎
    • AI开发者社区
    • AI提示指令
    • AI开放平台
    • AI训练模型
    • AI算力平台
  • AI翻译软件
    • AI文本翻译
    • AI图片翻译
    • AI视频翻译
    • AI音频翻译
    • AI文档翻译
  • AI对话聊天
    • AI聊天机器人
    • AI智能客服
  • 其他AI工具
  • AI办公应用
    • AI文档处理
    • AI思维导图
    • 生产力工具
    • AI数据分析
    • 工作流管理
    • AI格式转换
    • 人力资源管理
    • AI表单调查
    • AI团队协作
  • AI行业应用
    • AI教育应用
    • AI电商应用
    • AI生活应用
    • AI医疗应用
    • AI法律助手
    • AI户外旅行
    • AI游戏娱乐
    • AI金融支付
    • AI商业应用
  • AI学习网站
  • 素材资源分享
    • 文档模板素材
    • 图片图标素材
    • 常用工具插件
    • 服务器VPS
    • CMS内容管理
    • 开源免费资源
    • 开发者开放平台
    • 前后端框架
    • API接口服务
  • AI教程评测
    • Deepseek教程
    • ChatGPT教程
    • ‌Midjourney教程
    • AI提示指令
    • AI入门教程
    • AI工具教程
    • AI高级知识
    • AI工具评测
  • AI热点资讯
    • AI热点资讯
    • AI风云人物
    • 国内AI资讯
    • 国外AI资讯
    • AI算力资讯
    • 大咖说AI
    • AI讨论区
  • AI创业专区
    • AI创业项目
    • AI创业案例
    • AI项目融资
    • AI创业攻略
    • AI出海项目
    • 小白AI创业
    • AI创业经验
  • 提交您的AI工具
  • AI工具箱
  • AI工具专题
  • 热门AI工具
  • 免费AI工具
  • 国外AI工具
  • 国产AI工具
  • 最新AI工具
    提交收录
AI工具软件收录提交入口
收集全球10,000⁺个好用的AI软件
  • DeepSeek
  • AI写作
  • AI数字人
  • AI视频
  • AI图片
首页 > AI教程评测
全部所有 Deepseek教程 ChatGPT教程 ‌Midjourney教程 AI提示指令 AI入门教程 AI工具教程 AI高级知识 AI工具评测
  • Social Media Agent是什么?一文让你看懂Social Media Agent的技术原理、主要功能、应用场景
    Social Media Agent是什么?一文让你看懂Social Media Agent的技术原理、主要功能、应用场景
    Social Media Agent概述简介 Social Media Agent是智能的社交媒体内容管理工具,能帮用户收集、整理和安排发布社交媒体帖子,基于输入的URL内容生成Twitter和LinkedIn帖子。Social Media Agent用人机交互流程,处理社交媒体平台认证,支持用户修改或接受/拒绝生成的帖子。Social Media Agent支持基本和高级两种设置模式,高级模式下能处理YouTube视频内容、集成Slack和GitHub...
    AI工具评测
    2025-04-05
  • Matrix-Zero是什么?一文让你看懂Matrix-Zero的技术原理、主要功能、应用场景
    Matrix-Zero是什么?一文让你看懂Matrix-Zero的技术原理、主要功能、应用场景
    Matrix-Zero概述简介 Matrix-Zero是昆仑万维推出的世界模型,包含两款子模型:3D场景生成大模型和可交互视频生成大模型。Matrix-Zero能将用户输入的图片转化为可自由探索的真实3D场景,支持不同风格的图片输入和风格迁移,具备全局一致性、动态场景生成等亮点。Matrix-Zero的可交互视频生成模型以用户输入为核心,支持视角和运动轨迹的精确控制,提供流畅的交互体验。Matrix-Zero世界模型预计4月份上线,对AI游戏生产、AI短...
    AI工具评测
    2025-04-05
  • Sa2VA是什么?一文让你看懂Sa2VA的技术原理、主要功能、应用场景
    Sa2VA是什么?一文让你看懂Sa2VA的技术原理、主要功能、应用场景
    Sa2VA概述简介 Sa2VA是字节跳动联合加州大学默塞德分校、武汉大学和北京大学一起推出的多模态大语言大模型,是SAM2和LLaVA结合而成,能实现对图像和视频的密集、细粒度理解。Sa2VA基于统一的任务表示,将图像或视频指代分割、视觉对话、视觉提示理解等任务整合到一个框架中,用LLM生成的空间-时间提示指导SAM2生成精确分割掩码。Sa2VA采用解耦设计,保留SAM2的感知能力和LLaVA的语言理解能力,引入Ref-SAV数据集,用在提升复杂视频场景...
    AI工具评测
    2025-04-05
  • WebLI-100B 是什么?一文让你看懂WebLI-100B 的技术原理、主要功能、应用场景
    WebLI-100B 是什么?一文让你看懂WebLI-100B 的技术原理、主要功能、应用场景
    WebLI-100B概述简介 WebLI-100B是Google DeepMind推出的包含1000亿图像-文本对的超大规模数据集,用在预训练视觉语言大模型(VLMs)。WebLI-100B是WebLI数据集的扩展版本,基于从网络中收集大量图像及其对应的标题或页面标题作为文本配对信息构建而成。WebLI-100B的规模是之前最大视觉语言数据集的十倍,用海量数据提升模型对长尾概念、文化多样性和多语言内容的理解能力。研究者在构建时仅进行基本的数据过滤,保留尽...
    AI工具评测
    2025-04-05
  • BAG是什么?一文让你看懂BAG的技术原理、主要功能、应用场景
    BAG是什么?一文让你看懂BAG的技术原理、主要功能、应用场景
    BAG概述简介 BAG(Body-Aligned 3D Wearable Asset Generation)是香港中文大学和腾讯联合提出创新的3D可穿戴资产生成技术,通过结合多视图图像扩散模型和控制网络(ControlNet),运用人体形状和姿态信息,自动生成与人体完美适配的3D可穿戴资产,如服装和配饰。 BAG的核心在于基于多视图生成器和3D扩散模型。首先通过多视图图像扩散模型生成与人体对齐的多视图图像,然后基于3D扩散模型将这些图像转化为3D资产。通...
    AI工具评测
    2025-04-05
  • 通古大模型是什么?一文让你看懂通古大模型的技术原理、主要功能、应用场景
    通古大模型是什么?一文让你看懂通古大模型的技术原理、主要功能、应用场景
    通古大模型概述简介 通古大模型是华南理工大学深度学习与视觉计算实验室(SCUT-DLVCLab)推出的专注于古籍文言文处理的人工智能语言大模型。基于百川2-7B-Base进行增量预训练,使用24.1亿古籍语料进行无监督训练,结合400万古籍对话数据进行指令微调。模型采用冗余度感知微调(RAT)技术,有效提升了古籍任务的性能。帮助用户更便捷地理解和翻译古籍文献。通过检索增强生成(CCU-RAG)技术,减少知识密集型任务中的幻觉问题,提高生成内容的准确性和可...
    AI工具评测
    2025-04-05
  • ENEL是什么?一文让你看懂ENEL的技术原理、主要功能、应用场景
    ENEL是什么?一文让你看懂ENEL的技术原理、主要功能、应用场景
    ENEL概述简介 ENEL(Exploring the Potential of Encoder-free Architectures in 3D LMMs)是创新的无编码器3D大型多模态模型(3D LMM),解决传统编码器架构在3D理解任务中的局限性。ENEL通过去除3D编码器,直接将点云数据转换为离散的点标记,与文本标记拼接后输入到大型语言大模型(LLM)中。模型通过两种关键策略实现高效语义编码和几何结构理解:一是LLM嵌入的语义编码策略,通过混合语...
    AI工具评测
    2025-04-05
  • AnyCharV是什么?一文让你看懂AnyCharV的技术原理、主要功能、应用场景
    AnyCharV是什么?一文让你看懂AnyCharV的技术原理、主要功能、应用场景
    AnyCharV概述简介 AnyCharV是香港中文大学、清华大学深圳国际研究生院、香港大学联合推出的角色可控视频生成框架,能将任意参考角色图像与目标驱动视频相结合,生成高质量的角色视频。AnyCharV基于两阶段训练策略实现精细到粗略的引导:第一阶段用细粒度分割掩码和姿态信息进行自监督合成;第二阶段用自增强训练和粗粒度掩码优化角色细节保留。AnyCharV 在实验中展现出优越的性能,能自然地保留角色的外观细节,支持复杂的人-物交互和背景融合。AnyCh...
    AI工具评测
    2025-04-05
  • NobodyWho是什么?一文让你看懂NobodyWho的技术原理、主要功能、应用场景
    NobodyWho是什么?一文让你看懂NobodyWho的技术原理、主要功能、应用场景
    NobodyWho概述简介 NobodyWho是为 Godot 游戏引擎设计的插件,通过本地运行的大型语言大模型(LLM)实现互动小说创作。支持 Windows、Linux 和 macOS 平台,用户无需联网即可使用高性能的 LLM 功能,如对话交互和文本生成。插件通过简单的节点系统(如 NobodyWhoModel 和 NobodyWhoChat)实现与模型的无缝对接,让创作者可以快速构建动态叙事内容。NobodyWho的功能特色本地运行:支持在本地运...
    AI工具评测
    2025-04-05
  • PIKE-RAG是什么?一文让你看懂PIKE-RAG的技术原理、主要功能、应用场景
    PIKE-RAG是什么?一文让你看懂PIKE-RAG的技术原理、主要功能、应用场景
    PIKE-RAG概述简介 PIKE-RAG(sPecIalized KnowledgE and Rationale Augmented Generation)是微软亚洲研究院推出的检索增强型生成框架,能解决传统RAG系统在复杂工业应用中的局限性。PIKE-RAG基于提取、理解和应用专业知识,构建连贯的推理逻辑,引导大型语言大模型(LLM)生成准确的回答。PIKE-RAG引入知识原子化(Knowledge Atomizing),将知识分解为细粒度的原子单元...
    AI工具评测
    2025-04-05
  • Collaborative Gym是什么?一文让你看懂Collaborative Gym的技术原理、主要功能、应用场景
    Collaborative Gym是什么?一文让你看懂Collaborative Gym的技术原理、主要功能、应用场景
    Collaborative Gym概述简介 Collaborative Gym(Co-Gym)是专注于人机协作(Human-Agent Collaboration)的框架,支持人类与AI代理之间的实时交互与协作。通过模拟和真实两种实验条件,支持开发者在受控环境中进行迭代开发,同时能在真实场景中部署和评估协作效果。Co-Gym支持异步交互,能处理代理、人类和任务环境之间的三方互动。Collaborative Gym的功能特色支持异步交互:Co-Gym突破传...
    AI工具评测
    2025-04-05
  • TIGER是什么?一文让你看懂TIGER的技术原理、主要功能、应用场景
    TIGER是什么?一文让你看懂TIGER的技术原理、主要功能、应用场景
    TIGER概述简介 TIGER(Time-frequency Interleaved Gain Extraction and Reconstruction Network)是清华大学研究团队提出的轻量级语音分离模型,通过时频交叉建模策略,结合频带切分和多尺度注意力机制,显著提升了语音分离的效果,降低了参数量和计算量。 TIGER 的核心在于创新的时频交叉建模模块(FFI),能高效整合时间和频率信息,更好地提取语音特征。模型引入多尺度选择性注意力模块(MS...
    AI工具评测
    2025-04-05
  • «
  • 1
  • 2
  • ...
  • 186
  • 187
  • 188
  • 189
  • 190
  • 191
  • 192
  • ...
  • 215
  • 216
  • »
卓商AI工具集 卓商-AI工具集
AI爱好者的一站式人工智能AI工具箱,累计收录全球10,000⁺好用的AI工具软件和网站,方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用,力争做全球排名前三的AI网址导航网站,欢迎您成为我们的一员。

隐私策略 免责条款 服务协议关于我们

微信群

AI产品交流群

二维码

扫码联系站长
© 2013-2025 卓商AI 版权所有,保留所有权利 本站SEO技术支持: 知了网络   网站地图   友情链接交换
  • 微信二维码