收集全球10,000⁺个好用的AI软件
-
LLaSA_trainingLLaSA_training 是一个基于 LLaMA 的语音合成训练项目,旨在通过优化训练时间和推理时间的计算资源,提升语音合成模型的效率和性能。该项...
-
LLaSA_trainingLLaSA_training 是一个基于 LLaMA 的语音合成训练项目,旨在通过优化训练时间和推理时间的计算资源,提升语音合成模型的效率和性能。该项...
-
LLaMA-Mesh是什么?一文让你看懂LLaMA-Mesh的技术原理、主要功能、应用场景LLaMA-Mesh概述简介 LLaMA-Mesh是清华大学和NVIDIA一起推出的项目,基于将3D网格生成与大型语言大模型(LLMs)结合,实现用...
-
Emotion-LLaMA是什么?一文让你看懂Emotion-LLaMA的技术原理、主要功能、应用场景Emotion-LLaMA概述简介 Emotion-LLaMA是多模态情绪识别与推理模型,融合了音频、视觉和文本输入,通过特定情绪编码器整合信息。模...
-
VideoLLaMA3是什么?一文让你看懂VideoLLaMA3的技术原理、主要功能、应用场景VideoLLaMA3概述简介 VideoLLaMA3 是阿里巴巴开源的前沿多模态基础模型,专注于图像和视频理解。基于 Qwen 2.5 架构,结合...
-
LLaMA-Omni是什么?一文让你看懂LLaMA-Omni的技术原理、主要功能、应用场景LLaMA-Omni概述简介 LLaMA-Omni 是中国科学院计算技术研究所和中国科学院大学研究者推出的新型模型架构,用于实现与大型语言大模型(L...
-
LLaMA-Mesh是什么?一文让你看懂LLaMA-Mesh的技术原理、主要功能、应用场景LLaMA-Mesh概述简介 LLaMA-Mesh是清华大学和NVIDIA一起推出的项目,基于将3D网格生成与大型语言大模型(LLMs)结合,实现用...
-
Emotion-LLaMA是什么?一文让你看懂Emotion-LLaMA的技术原理、主要功能、应用场景Emotion-LLaMA概述简介 Emotion-LLaMA是多模态情绪识别与推理模型,融合了音频、视觉和文本输入,通过特定情绪编码器整合信息。模...
-
VideoLLaMA3是什么?一文让你看懂VideoLLaMA3的技术原理、主要功能、应用场景VideoLLaMA3概述简介 VideoLLaMA3 是阿里巴巴开源的前沿多模态基础模型,专注于图像和视频理解。基于 Qwen 2.5 架构,结合...