收集全球10,000⁺个好用的AI软件
-
TableGPT2TableGPT2是一个大型多模态模型,专门针对表格数据进行预训练和微调,以解决实际应用中表格数据整合不足的问题。该模型在超过593.8K的表格和2....
-
olmo-mix-1124allenai/olmo-mix-1124数据集是由Hugging Face提供的一个大规模多模态预训练数据集,主要用于训练和优化自然语言处理模型。该...
-
FineWeb2FineWeb2是由Hugging Face提供的一个大规模多语言预训练数据集,覆盖超过1000种语言。该数据集经过精心设计,用于支持自然语言处理(N...
-
中文互联网语料资源平台中文互联网语料资源平台是由中国网络空间安全协会主办的专业网站,旨在为人工智能大模型的预训练提供高质量、安全合规的中文语料资源。该平台汇聚了来自企业、高...
-
Nemotron-CCNemotron-CC是一个基于Common Crawl的6.3万亿token的数据集。它通过分类器集成、合成数据改写和减少启发式过滤器的依赖,将英文...
-
Crawl4LLMCrawl4LLM是一个开源的网络爬虫项目,旨在为大型语言模型(LLM)的预训练提供高效的数据爬取解决方案。它通过智能选择和爬取网页数据,帮助研究人员...
-
TableGPT2TableGPT2是一个大型多模态模型,专门针对表格数据进行预训练和微调,以解决实际应用中表格数据整合不足的问题。该模型在超过593.8K的表格和2....
-
MILSMILS是一个由Facebook Research发布的开源项目,旨在展示大型语言模型(LLMs)在未经过任何训练的情况下,能够处理视觉和听觉任务的能...
-
ClearerVoice-StudioClearerVoice-Studio是一个开源的AI驱动语音处理工具包,专为研究人员、开发者和最终用户设计。它提供了语音增强、语音分离、目标说话人提...
-
Qwen2.5-Coder Technical ReportQwen2.5-Coder系列是基于Qwen2.5架构的代码特定模型,包括Qwen2.5-Coder-1.5B和Qwen2.5-Coder-7B两个模...
-
Qwen2.5-Coder-3BQwen2.5-Coder-3B是Qwen2.5-Coder系列中的一个大型语言模型,专注于代码生成、推理和修复。基于强大的Qwen2.5,该模型通过...
-
Qwen2.5-Coder-0.5B-InstructQwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,通过扩展训练令牌到5.5万亿...
-
Qwen2.5-Coder-32B-Instruct-GPTQ-Int4Qwen2.5-Coder-32B-Instruct-GPTQ-Int4是基于Qwen2.5的代码生成大型语言模型,具有32.5亿参数量,支持长文本处...
-
YuLan-MiniYuLan-Mini是由中国人民大学AI Box团队开发的一款轻量级语言模型,具有2.4亿参数,尽管仅使用1.08T的预训练数据,但其性能可与使用更多...
-
GLM-4-9BGLM-4-9B是智谱AI推出的新一代预训练模型,属于GLM-4系列中的开源版本。它在语义、数学、推理、代码和知识等多方面的数据集测评中表现优异,具备...
-
GLM-4-9B-ChatGLM-4-9B-Chat是智谱AI推出的新一代预训练模型GLM-4系列中的开源版本,具备多轮对话、网页浏览、代码执行、自定义工具调用和长文本推理等高...
-
对比语言-图像预训练是什么意思?对比语言-图像预训练(Contrastive Language-Image Pretraining, CLIP)详细介绍对比语言-图像预训练(Contrastive Language-Image Pretraining, CLIP)是OpenAI开发的一种多模态预训...