SQLServer分布式查询

  MSSQlServer所谓的分布式查询(Distributed Query)是能够访问存放在同一部计算机或不同计算机上的SQL Server或不同种类的数据源, 从概念上来说分布式查询与普通查询区别 它需要连接多个MSSQL服务器也就是具有多了数据源.实现在服务器跨域或跨服务器访问. 而这些查询是否被使用完全看使用的需要.

  本篇将演示利用SQlExpress链接远程SQlServer来获取数据方式来详细说明分布式查询需要注意细节.先看一下系统架构数据查询基本处理:

  当然如果采用了分布式查询 我们系统采取数据DataBase也就可能在多个远程[Remote Server]上访问时:

  如上截取系统架构中关于数据与缓存流向中涉及的分布式查询业务, 当我们从客户端Client发起请求数据时. 首先检查MemCache Server缓存服务器是否有我们想要数据. 如果没有我需要查询数据库.  而此时数据要求查询多个远程服务器上多个数据库中表, 这时利用分布式查询.获得数据 然后更新我们在缓存服务器MemCache Server上数据保持数据更新同步, 同时向客户端Client直接返回数据.那如何来执行这一系列动作中最为关键分布式查询?

  <1>分布式查询方式

  我们知道Microsoft微软公用的数据访问的API是OLE_DB, 而对数据库MSSQlServer 2005的分布式查询支持也是OLE_DB方式.SQL Server 用户可以使用分布式查询访问以下内容:

  A:存储在多个 SQL Server 实例中的分布式数据

  B:存储在各种可以使用 OLE DB 访问接口访问的关系和非关系数据源中的异类数据

  OLE DB 访问接口将在称为行集的表格格式对象中公开数据。SQL Server 允许在 Transact-SQL 语句中像引用 SQL Server 表一样引用 OLE DB 访问接口中的行集,[其实不用关心这个行集概念 它的功能类似SQl中临时表 不过它容积更大 能容纳类型更多 更丰富]

  SQL Server 实例的客户机与 OLE DB 访问接口之间的连接 如下图:

  从上图可以看出.客户端借助OLEDB接口可以访问Oracle/MS Jet/MS SQL/ODBC/第三方等这些丰富数据源来我们分布式查询提供数据. 说了这么多关于OLEDB底层支持. 关于在MSSQL2005中则支持两种方式来进行分布式查询:

  <A>使用添加链接服务器方式(Add Link Server)

  <B>使用特定名称及特定数据源来直接指定(Add Host Names)

  其实这两种方式在实际运用中是有区别的:

  方式A:Add Link Server方式建立服务器之间关联.创建一个链接的服务器,使其允许对分布式的、针对 OLE DB 数据源的异类查询进行访问. 一般适用于持久的数据操作 对于数据量偏大 服务器之间交付时间长特点.

  方式B: Add Host Name 利用域来唯一识别数据库以及数据库表对象. 来实现跨服务器访问. 这种方式一般比较简单 主要适用于对数据需求临时性查询是使用偏多. 不适合做大批量数据提取. 有性能瓶颈.

  <2>分布式查询实现

  在进行实现分布式查询之前.本次测试Demo对应的SQL版本:

  确定SQLServer版本后如下会演示两种方式来实现分布式查询,并对Distributed Query中详细细节进行说明.

  <2.1>链接服务器查询

  链接服务器配置使 SQL Server 可以对远程服务器上的 OLE DB 数据源执行命令。链接服务器具有以下优点:

  1. 访问远程服务器
  2. 能够对企业内的异类数据源发出分布式查询、更新、命令和事务。
  3. 能够以相似的方式确定不同的数据源

  下图显示了链接服务器配置的基础:

  现在利用链接服务器方式实现数据访问远程服务器数据库CustomerDB中Users表数据先本地添加LinkServer:

   1:  -- 建立连接服务器  第一步建立连接  IP方式来控制 
2:
3: EXEC sp_addlinkedserver '192.168.10.104' , 'SQL Server'
4:
5: -- 查看链接服务器信息 [测试连接成功]
6:
7: select name , product, provider, data_source, query_timeout, lazy_schema_validation, is_remote_login_enabled, is_rpc_out_enabled
8: from sys.servers
9: where is_linked= 1

  <3>问题排查与更多查询方式

  当我们在实际编程中进行访问远程数据时 因为不同操作环境会引发各种各样的异常,如下我会提出一种常见的异常方式解决办法和关于远程数据操作更多查询方式.

  <3.1>无法建立远程连接

  其实这个问题在做分布式查询时极其常见. 而引起这个问题的因素过多. 我们一时无法判断真正引发这个异常地方. 只能通过逐个排查方式来进行设置:

  例如我们在建立关联关系后 进行查询时会遇到:

  提示是: 在进行远程连接时超时, 引起这个问题原因可能是远程服务器积极拒绝访问!

  首先要在Sql Server Configuation Manager中保证你服务已经运行 且是开机自动运行.

  再次检查SQl2005外围配置DataBaseEngine允许远程连接:

  设置完成后.我们还需要设置Sql Server Analysis Services分析服务也支持远程数据查询:

  在远程服务器上如果启用了防火墙则可能对目前SQl Server方位实例进行拦截. 所以在服务器端启用防火墙情况下要为SQl DAtaBase创建例外.防止客户端请求被拦截.

  <3.2>进程被其他用户占用

  当我们在远程分布式查询中有创建动作或是类似创建一个新的数据库. 有时会提示 “该数据库无法操作 已经别其他进程占用”异常. 导致我们无法访问数据库. 或是执行我们要做的创建操作.

  遇到这种情况我们可以利用SA权限查询到Master数据库对应数据库被占用的进程 并杀掉Kill Process.查询:

   1:  -- [sysprocesses 表中保存关于运行在 Microsoft® SQL Server™ 上的进程的信息。
2: -- 这些进程可以是客户端进程或系统进程。sysprocesses 只存储在 master 数据库中]
4: use Master
5: go
7: SELECT * FROM sysprocesses ,sysdatabases WHERE sysprocesses.dbid=sysdatabases.dbid AND sysdatabases.Name='CustomerDB'
9: select * from sysprocesses
11: select * from sysdatabases
13: -- 杀死占用进程
14: kill 5

it知识库SQLServer分布式查询,转载需保留来源!

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。