SQL Server 2025 新技术系列介绍(第一期)

SQL Server 2025 新技术系列介绍(第一期)—— AI 革命:当数据库真正“学会思考”

引言

如果说 SQL Server 2022 是微软向云端的优雅转身,那么 SQL Server 2025 则是一场彻底的自我重塑。2025 年 11 月 19 日,在微软 Ignite 2025 大会上,SQL Server 2025 正式结束预览测试并投入生产环境。而就在几天前(2026 年 4 月 23 日),CU3 累积更新也已正式发布,标志着这一版本正以稳健的步伐走进企业的核心系统。

本期作为系列的开篇,我们将聚焦 SQL Server 2025 最具颠覆性的变革——AI 深度集成,同时完整呈现其在性能、安全、混合部署等维度的全面进化。这不是一次常规的版本迭代,而是一场将数据库从“存储系统”转变为“智能平台”的范式革命。

一、从“存数据”到“理解数据”:AI 的深度内嵌

如果说过去十年数据库的核心命题是“更快、更稳、更安全”,那么 SQL Server 2025 给出了新的答案:更聪明

SQL Server 2025 首次将 AI 能力深度整合至数据库引擎底层,而非简单地在数据库之上叠加 AI 工具层。这意味着开发者可以直接在数据库内部完成从数据存储到语义理解的全流程,无需将数据搬运到外部的 AI 服务或 Python 环境。微软将这一架构理念概括为 “AI Where Your Data Lives” ——让智能发生在数据所在之处,而非迁移数据去迁就智能。

为什么这很重要? 传统方案中,若要实现语义搜索,你需要将数据导出、调用外部 embedding 模型、建立向量数据库、再处理查询……这不仅带来了数据传输的安全风险,也大幅增加了系统的复杂度和延迟。SQL Server 2025 将这些全部内置于引擎内部,用最熟悉的 T-SQL 即可完成端到端的 AI 应用开发。

1.1 原生向量数据类型:为语义搜索筑基

向量数据的存储与检索是 AI 应用的核心基础设施。SQL Server 2025 新增了原生的 VECTOR 数据类型,开发者可以直接在数据表中定义向量列,并通过 T-SQL 创建和管理向量索引。

向量是什么?简单来说,AI 模型会将文本、图像等内容转化为一串高维数字数组(即向量)。两个向量的距离越近,代表原始内容的语义越相似。借助这一机制,数据库能够理解“苹果”与“水果”“iPhone”之间的关联,而不仅仅是关键词匹配。

RC1 版本进一步引入了 FP16(半精度浮点数)支持,允许以 2 字节存储向量中的每个维度,相比传统的 4 字节(FP32)可节省一半的存储空间。对于动辄数百甚至数千维的 AI 向量,这一优化带来的存储和内存收益极为可观。向量数据类型支持最多 3996 个维度,足以覆盖绝大多数主流 embedding 模型的需求。

1.2 DiskANN 索引技术:让向量搜索快如闪电

仅有向量存储还不够,如何高效检索才是真正的挑战。SQL Server 2025 集成了微软研究院研发的 DiskANN 技术,这是一种专为高维向量设计的近似最近邻(ANN)搜索算法,能够在磁盘上构建高效的向量索引,相比传统的内存方案大幅降低资源消耗。

在 RC1 中,DiskANN 获得了显著增强:索引构建速度大幅提升(更好地利用所有 CPU 核心),跨所有处理器的扩展性显著改善,从而在面对大规模数据集和高吞吐量负载时能够保持一致的性能表现。

值得特别关注的是,向量索引的创建不再对表加 SCH-M 锁,允许在索引构建过程中保持完整的读访问能力——这对生产环境的意义不言而喻。

1.3 混合搜索:向量 + 全文 + 过滤的“组合拳”

现实中的搜索需求往往是多维度的:既要有语义相关性,也要满足特定的过滤条件(如价格区间、时间范围)。SQL Server 2025 支持将向量搜索与传统的全文检索和结构化过滤逻辑相结合,提供强大的混合搜索能力,让开发者可以在同一个查询中融合多种搜索范式。

1.4 T-SQL AI 函数:用熟悉的 SQL 驾驭大模型

SQL Server 2025 在 T-SQL 层面新增了一系列 AI 函数,让开发者用最熟悉的语法调用大模型能力:
函数功能说明AI_GENERATE_EMBEDDINGS生成文本的向量嵌入AI_GENERATE_CHUNKS将长文本智能分块,便于 RAG 处理VECTOR_SEARCH执行向量相似性搜索这些函数支持与 Azure OpenAI、OpenAI、Ollama 等主流 AI 服务无缝集成,开发者可以在不同模型之间随意切换而无需修改代码——今天用 OpenAI,明天换 Ollama,就像换个电源适配器一样简单。

1.5 ONNX 模型本地托管:数据不出门的 AI 推理

对于一些对数据隐私有严格要求的场景,将数据发送到云端 API 可能并不合适。SQL Server 2025 通过 CREATE EXTERNAL MODEL 语句,支持在数据库文件系统中直接托管本地的 ONNX 模型,实现完全离线的 AI 推理能力。这一功能在预览阶段可通过 PREVIEW_FEATURES 配置启用。

1.6 RAG 应用支持:构建企业级智能问答系统

RAG(检索增强生成)是当下企业构建 AI 应用的主流架构——先通过向量搜索从企业知识库中检索相关内容,再将这些内容作为上下文提交给大语言模型生成答案。SQL Server 2025 为 RAG 提供了完整的基础设施支持:向量嵌入生成、文本分块、DiskANN 索引等核心构建块一应俱全,并能与 LangChain、Semantic Kernel 及 Entity Framework Core 等主流框架顺利整合。

1.7 SSMS Copilot:自然语言驱动数据库开发

AI 的能力不止体现在数据处理上,也体现在开发工具的智能化。SQL Server Management Studio(SSMS 22)正式发布,新增了与 GitHub Copilot 的深度集成。开发者可以直接使用自然语言获取查询建议、解释复杂执行计划、甚至自动生成 T-SQL 代码,大幅降低开发门槛。

本期小结: AI 不是 SQL Server 2025 的一个“新功能”,而是其底层基因。从向量存储到语义搜索,从模型托管到 RAG 支持,数据库正在从被动的数据容器转变为主动的智能引擎。

二、性能与智能:让查询处理“自己会思考”

AI 的触角也延伸到了数据库自身的运行优化上。SQL Server 2025 引入了一系列 AI 驱动的智能查询处理(IQP)增强功能,让数据库能够根据工作负载模式动态调整执行策略。

2.1 参数敏感计划(PSP)优化

这是 DBA 群体长期面临的一个痛点:同一个存储过程,传入不同的参数值,有时执行得飞快,有时却慢如蜗牛。根源在于 SQL Server 根据参数生成的执行计划未必适用于所有参数值。SQL Server 2025 的 PSP 优化可以根据参数值模式自动创建和维护多个执行计划,让系统为不同参数选择最合适的计划。

2.2 基数估计(CE)表达式反馈 + 持久化

基数估计(预测查询将返回多少行)是优化器生成执行计划的核心依据。SQL Server 2025 引入了 CE 表达式反馈机制:系统会从重复的查询模式中学习,持续改进行数估计的准确性。更重要的是,这种学习结果会持久化存储——即使服务器重启或发生故障转移,学习成果也不会丢失,从而保持更稳定的性能并减少调优需求。

2.3 并行度(DOP)反馈与自适应并行

SQL Server 2025 能够根据历史查询性能自动调整并行执行设置,默认启用并行度反馈功能,避免过度并行造成资源争用或并行不足造成性能瓶颈。结合自适应的并行执行机制,系统可以在运行时动态调整并行策略。

2.4 可选参数计划优化(OPPO)

针对存储过程中包含可选参数(可能传入 NULL 也可能传入具体值)的场景,OPPO 能够在运行时根据参数是否为 NULL 选择最优执行计划,无需编写复杂的动态 SQL。

2.5 优化锁定与 tempdb 资源治理

SQL Server 2025 优化了锁定机制,减少锁定内存消耗,最小化阻塞并提高并发性。tempdb 空间资源治理得到了增强,支持按百分比阈值配置限制,使策略能够在不同硬件配置上更容易扩展。

2.6 查询存储(Query Store)增强

查询存储是 DBA 手中的性能诊断利器。SQL Server 2025 中,查询存储功能扩展到了 Always On 可用性组的可读辅助副本,支持跨分布式环境的性能监控,并可自动检测查询回归、推荐索引和计划改进。

三、安全与可用性:默认即加固

SQL Server 一直在数据库安全领域保持着出色的纪录。截至 2025 年 7 月的 NIST 漏洞数据库统计显示,2016 至 2025 年间,SQL Server 记录的漏洞事件为 62 起,显著低于 Oracle(198 起)、IBM(197 起)、PostgreSQL(195 起)等主要竞争对手。SQL Server 2025 延续了这一传统,并进一步提升了安全基线。

3.1 默认强制加密:TDS 8.0 + TLS 1.3

SQL Server Agent 和链接服务器现已默认启用强制加密,采用行业最新的安全标准:TDS 8.0 协议TLS 1.3 协议。Always On 可用性组、故障转移群集实例、复制和日志传送均可配置 TLS 1.3 加密。从预览版开始,TLS 1.3 已默认启用。

3.2 托管身份与 Entra 集成

SQL Server 2025 引入了 Microsoft Entra(原 Azure AD)托管身份验证体系,大幅改善凭据管理,减少密码泄露风险。PolyBase 现在支持使用托管身份与 Azure Blob Storage 和 Azure Data Lake Storage 通信。

3.3 Fabric 镜像与资源治理

SQL Server 2025 实现了与 Microsoft Fabric 的深度集成,通过 Fabric 镜像功能,无需复杂的 ETL 流程即可近乎实时地将数据复制到 OneLake 中。Fabric 镜像支持资源治理,通过新增的 dynamicmaxtrans 配置选项优化性能,帮助隔离和管理资源消耗。

3.4 复制默认升级

复制功能默认使用 OLE DB 版本 19 进行实例间通信,并默认强制执行 TLS 1.3 加密(Encrypt=Strict),进一步提升了数据复制的安全性。

3.5 备份不可变存储

备份到 Azure Blob Storage 现在支持不可变存储,可在指定保留期内防止篡改或删除——这对合规和审计场景尤其重要。

四、部署与开发:从本地到云端的无缝体验

4.1 部署灵活性大幅提升

SQL Server 2025 扩展了部署灵活性,支持 Windows 和 Linux 操作系统、虚拟机以及各类云平台。新版本新增了先进的容器化功能、改进的 Kubernetes 和 Azure Arc 编排能力,以及与 Azure 的无缝集成,全面支持混合和多云部署方案。

在 Linux 生态方面,SQL Server 2025 在 CU1(2026 年 1 月)中正式支持 Red Hat Enterprise Linux(RHEL)10 和 Ubuntu 24.04 的生产环境部署。截至 2026 年 3 月,CU3 已正式发布,版本号为 17.0.4025.3。值得注意的是,SUSE Linux Enterprise Server(SLES)自本版本起不再受支持。

标准版的资源限制也得到提升:最大支持 32 个 CPU 核心256GB 内存,相比 SQL Server 2022 的 24 核 128GB 有了显著增长。

4.2 开发者体验全面升级

SQL Server 2025 被微软称为“十年来最重要的 SQL 开发者版本”,其主要亮点包括:
功能说明原生 JSON 数据类型支持存储和处理最大 2GB 的 JSON 文档,提供 JSON 聚合函数和索引机制正则表达式(Regex)函数REGEXP_REPLACEREGEXP_SUBSTR 支持 LOB 类型,REGEXP_LIKE 支持 SARGable 索引加速REST API 集成通过 sp_invoke_external_rest_endpoint 直接从 T-SQL 调用外部 REST/GraphQL 服务变更事件流将数据变更从 SQL Server 实时流式传输到 Azure Event Hubs,比传统 CDC 的资源开销更低模糊字符串匹配JARO_WINKLER_DISTANCEJARO_WINKLER_SIMILARITY 函数,支持字符串相似度计算Python 驱动程序Microsoft Python Driver for SQL Server(mssql-python)正式发布,支持 Entra ID 认证

4.3 PREVIEW_FEATURES:安全地尝鲜

SQL Server 2025 引入了全新的 PREVIEW_FEATURES 数据库范围配置,允许管理员在特定数据库上启用预览功能进行测试,而不会影响其他生产数据库。即使在 SQL Server 正式发布后,这一机制也能让用户继续试用尚未 GA 的功能。

目前处于预览状态的核心功能包括:向量索引、向量搜索、AI 文本分块、变更事件流、ONNX 本地模型等。

五、已弃用功能:升级前需要知道的事

在引入大量新功能的同时,SQL Server 2025 也弃用了一些旧有特性,企业在规划升级时需要注意:
已弃用/删除功能替代方案旧式 PolyBase Hadoop 连接现代化连接器和数据虚拟化机器学习服务器及捆绑的 R/Python/Java 运行时外部包和服务Distributed Replay已从安装程序中删除Stretch Database将在未来版本中完全移除SUSE Linux Enterprise Server(SLES)支持使用 RHEL 或 Ubuntu

六、版本演进时间轴

SQL Server 2025 的版本演进历程如下:
版本版本号发布日期公开预览(Build 2025)-2025 年 5 月CTP 2.117.0.800.32025 年 6 月RC017.0.900.72025 年 8 月RC117.0.925.42025 年 9 月GA(正式发布)17.0.1000.72025 年 11 月 18 日CU117.0.4005.72026 年 1 月CU217.0.4015.42026 年 2 月CU317.0.4025.32026 年 3 月SQL Server 2025 遵循固定生命周期政策,主流支持持续至 2030 年,扩展支持至 2035 年

七、展望与预告

SQL Server 2025 的发布标志着数据库技术进入了一个新的时代——智能与数据深度融合的时代。本期我们重点介绍了 AI 集成、智能查询处理、安全增强和部署开发方面的革新。在下一期(第二期)中,我们将聚焦 SQL Server 2025 在企业级架构中的实践应用,包括:

  • 高可用性与灾难恢复:Always On 可用性组的新特性、包含的可用性组(CAG)增强、故障转移速度提升
  • 混合架构与云集成:Azure Arc 统一管理、Fabric 镜像深度应用、混合数据虚拟化
  • 数据仓库与分析:PolyBase 增强、Parquet/Delta 原生支持、S3 兼容对象存储
  • 迁移与升级指南:从 SQL Server 2022 及更早版本的升级路径、兼容性评估、最佳实践

敬请期待!

参考资源


下期预告: SQL Server 2025 新技术系列(第二期)——企业级高可用与混合架构实战,敬请关注!

No comments yet