谷歌发布Gemini-SQL2:以80.04%准确率登顶BIRD单模型榜单
t.meGeneral06/13 02:384 阅读
谷歌发布Gemini-SQL2:以80.04%准确率登顶BIRD单模型榜单
谷歌研究团队(Google Research)于 6 月 12 日发布文本转 SQL 技术 Gemini-SQL2。新系统基于 Gemini 3.1 Pro 模型构建,在行业主流数据库查询评测 BIRD 单模型榜单中取得 80.04% 的执行准确率,创下新的性能纪录。
早期版本 Gemini-SQL 搭载 Gemini 2.5 Pro,并采用多任务监督微调,曾以 77.14% 的执行准确率领跑榜单。新版本将成绩提升了 2.9 个百分点。
BIRD 作为评估文本转 SQL 系统能力的行业基准,包含超过 12700 个问题与 SQL 语句对。测试覆盖多表关联查询、脏数据处理以及复杂业务上下文推理等真实数据库环境,并以生成的 SQL 语句能否在数据库中正确执行作为衡量指标。
Gemini-SQL2 并未作为独立的大模型发布,而是作为底层的数据库查询能力进行推广。谷歌计划逐步将相关能力整合至现有的数据服务中,涵盖 BigQuery Studio、AlloyDB AI 以及 Cloud SQL Studio 等平台,协助非技术人员通过自然语言直接查询企业数据库。
信源:https://x.com/GoogleResearch/status/2065475343205740911

原文链接纠错/举报