Arctic是什么?一文让你看懂Arctic的技术原理、主要功能、应用场景

来源:卓商AI
发布时间:2025-04-05

Arctic概述简介

Arctic是由云计算巨头Snowflake的AI研究团队开发的一款高效、开源的企业级大型语言大模型,该大模型是一个拥有480亿(480B)的参数规模,由128个细粒度的专家构成的混合专家模型(MoE)模型。在成本效益、训练效率和推理效率方面具有显著优势,特别适合执行企业任务,如SQL生成、编程和指令遵循。Arctic采用Apache 2.0许可,提供对模型权重和代码的开放访问,并开源了数据集和研究洞察。

Arctic的主要特点

参数规模:Arctic拥有480亿参数,但在推理时仅激活170亿参数,以提高效率。

技术架构:采用混合架构,结合了密集变换器(Dense Transformer)和128个专家的MoE模型,每个专家有3.66亿参数。

上下文窗口:模型训练时使用4K的注意力上下文窗口,并计划扩展至32K,以支持更长序列的处理。

训练成本:Arctic的训练计算预算大约在200万美元以下(即少于3000个GPU周)即可达到顶级大模型的能力

模型许可:Arctic在开放的Apache 2.0许可下发布,允许自由使用和修改。

主要用途:专为企业设计,擅长执行SQL生成、编程和指令遵循等任务,适合创建定制企业模型。

Arctic的模型架构

架构组成:Arctic采用了Dense-MoE Hybrid Transformer架构,这种架构结合了密集变换器(Dense Transformer)和混合专家模型(MoE)的特点。

密集变换器规模:模型包含一个具有10B(10 billion,即10亿)参数的密集变换器模型。

MoE架构规模:在MoE部分,Arctic设计了128个细粒度的专家,每个专家拥有3.66B(3.66 billion,即36.6亿)参数。因此,MoE部分的总参数量为128×3.66B,即约470B(470 billion,即4700亿)参数。

总参数量:结合密集变换器和MoE部分,Arctic的总参数量达到了480B(480 billion,即4.8万亿)参数。

活跃参数选择:在推理过程中,Arctic使用top-2门控机制从128个专家中选择两个最合适的专家,这意味着在任何给定时间,大约有17B(17 billion,即170亿)的参数是活跃的。

通信与计算重叠:为了提高训练效率,Arctic的架构设计允许在训练过程中将专家间的通信开销与计算任务重叠,从而隐藏了通信开销。

推理效率:在小批量(如批量大小为1)的交互式推理中,Arctic模型的内存读取次数比Code-Llama 70B少4倍,比Mixtral 8x22B少2.5倍,这有助于提高推理性能。

系统优化:Arctic与NVIDIA合作,利用TensorRT-LLM和vLLM团队的技术,为Arctic提供了初步的推理实现,并通过FP8量化技术,使得Arctic可以在单个GPU节点上运行。

注意力上下文窗口:Arctic训练时使用的注意力上下文窗口为4K,团队正在开发基于attention-sinks的滑动窗口实现,以支持无限序列生成能力,未来计划扩展到32K注意力窗口。

Arctic的性能表现

Snowflake将Arctic与DBRX、Llama、Mixtral等模型在企业指标和学术指标方面的基准测试进行了对比,Arctic在企业智能指标上表现更好,在如MMLU等通用知识基准上的性能可能略低于一些最新模型,但它在这些基准上仍然保持了竞争力。

企业指标:与所有其他开源模型相比,Arctic 都表现出顶级性能,这些任务包括:

编码(Coding):通过HumanEval+ 和 MBPP+ 基准测试编码能力。

SQL生成(SQL Generation):使用Spider基准测试SQL查询生成能力。

指令遵循(Instruction Following):IFEval基准测试遵循复杂指令的能力。

如何使用Arctic

Snowflake Arctic 现已可从 Hugging Face、Replicate 等平台使用,后续将在包括 Snowflake Cortex、Amazon Web Services (AWS)、Microsoft Azure、NVIDIA API Catalog、Lamini、Perplexity 和 Together 等在内的平台陆续上线。

官方模型主页:https://www.snowflake.com/en/data-cloud/arctic/

Hugging Face模型空间:https://huggingface.co/Snowflake/snowflake-arctic-instruct

Replicate模型地址:https://replicate.com/snowflake/snowflake-arctic-instruct

GitHub仓库:https://github.com/Snowflake-Labs/snowflake-arctic

© 版权声明:本站所有原创文章版权均归卓商AI工具集及原创作者所有,未经允许任何个人、媒体、网站不得转载或以其他方式抄袭本站任何文章。
卓商AI
卓商AI

AI爱好者的一站式人工智能AI工具箱,累计收录全球10,000⁺好用的AI工具软件和网站,方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用,力争做全球排名前三的AI网址导航网站,欢迎您成为我们的一员。

猜你喜欢
  • smart calendars ai
    smart calendars ai 告别手动数据输入!使用智能日历AI,创建日历事件就像说话,捕捉照片或粘贴文本,电子邮件或网站一样容易。我们的高级AI自动检测到日期,时间和位置 - 因...
  • Graphix AI
    Graphix AI Graphix AI是一款强大的AI图像生成器和图像效果应用,可以根据输入提示和选择的艺术风格,快速生成数字艺术和令人惊叹的照片作品。功能包括文字生成...
  • Talently.ai
    Talently.ai Talently.ai是一个人工智能面试官,可以进行真人互动式面试,并提供实时评估,以便轻松识别顶尖人才。它消除了手动筛选的需要,实现了更智能的招聘。...
  • l1m
    l1m l1m是一个强大的工具,它通过代理的方式利用大型语言模型(LLMs)从非结构化的文本或图像中提取结构化的数据。这种技术的重要性在于它能够将复杂的信息转...
  • ElevenLabs Conversational AI
    ElevenLabs Conversational AI ElevenLabs Conversational AI是一款能够快速部署在网页、移动设备或电话上的语音代理产品。它以低延迟、全配置性和无缝扩展性为特...
  • backl io backlink builder
    backl io backlink builder 用Backl.io- AI驱动的反向链接构建器来增强您的创业公司的SEO。分析竞争对手的反向链接差距,并使用GPT驱动的个性化消息传递进行有效的冷电子...
  • Pyramid Analytics
    Pyramid Analytics Pyramid Analytics是一个商业决策智能平台,它通过集成数据准备、商业分析和数据科学于一体,帮助企业实现快速有效的决策制定。该平台利用AI...
  • Paper-to-Podcast
    Paper-to-Podcast Paper-to-Podcast是一个将学术论文转换成播客形式的工具,通过模拟三个人的讨论来让听众以更自然和人性化的方式理解论文内容。它不仅使复杂的信...