SuperGPQA是什么?一文让你看懂SuperGPQA的技术原理、主要功能、应用场景
SuperGPQA概述简介
SuperGPQA 是字节跳动豆包大模型团队联合 M-A-P 推出的全面覆盖 285 个研究生级学科、包含 26529 道专业题目的知识推理基准测试集。解决传统评测基准学科覆盖不全、题目质量存疑和评测维度单一的问题,基于专家与大语言大模型协同构建,确保题目的高质量和高难度。SuperGPQA 包含 STEM 和非 STEM 学科,42.33% 的题目需要数学计算或严谨推理,能有效衡量大语言大模型的泛化能力和真实推理水平。Sup...
AI工具评测
2025-04-05