阅读以下关于数据集成的叙述,在答题纸上回答问题 1 至问题3。 某互联网销售企业需要建立自己的电子商务平台,将所有产品信息集中在一起,为用户提供全方位的产品信息检索服务。但产品供应商大多数已经建有自己的电子商务平台,且数据独立存储,而且数据格式和数据平台有较大差异,有的供应商甚至没有采用数据库来存储商品信息。为此该企业专门成立专家组来论证其数据集成方案。 李工提出采用集中式集成方式把产品供应商的数据集中在一起,采用数据仓库技术来实现与各家供应商的数据集成。而王工提出采用松耦合的联邦数据库集成方案。专家组经

题目
阅读以下关于数据集成的叙述,在答题纸上回答问题 1 至问题3。
某互联网销售企业需要建立自己的电子商务平台,将所有产品信息集中在一起,为用户提供全方位的产品信息检索服务。但产品供应商大多数已经建有自己的电子商务平台,且数据独立存储,而且数据格式和数据平台有较大差异,有的供应商甚至没有采用数据库来存储商品信息。为此该企业专门成立专家组来论证其数据集成方案。
李工提出采用集中式集成方式把产品供应商的数据集中在一起,采用数据仓库技术来实现与各家供应商的数据集成。而王工提出采用松耦合的联邦数据库集成方案。专家组经过激烈讨论,认为王工方案更为合理,建议采用王工提出的集成方案。
【问题 1】(10 分)
请结合数据仓库和联邦数据库集成方案各自的特点,简要说明专家组采用王工提出的集成方案的原因。
【问题 2】(7 分)
部分供应商的产品信息没有相应的数据库,而是直接嵌入在 WEB 页面中供用户浏览。数据集成时需要直接从供应商电子商务平台的网页上获取其产品信息。请简要给出此类数据集成的方法和基本步骤。
【问题 3】(8 分)
在方案评审会上,项目组针对李工和王工的方案展开了激烈的讨论。刘工指出两种方案在实施的过程中,都存在数据源之间的语义映射和转换问题,都会带来数据集成的不确定。请简要说明产生不确定的原因。


相似考题
参考答案和解析
答案:
解析:
【问题1】
数据仓库集成是把多种来源的数据集中在一起,建立数据仓库,所有数据都驻留在单个数据库服务器上,配置大型处理器和存储容量。数据仓库主要用于决策支持,在数据处理过程中强调分析。其特点是:
(1)集成的数据。
(2)面向主题。
(3)数据相对稳定。
(4)包含历史信息。
联邦数据库集成是把多个数据库系统联合在一起,构成"联邦数据库系统",数据库之间通过接口查询,互相通信,数据分布在不同地方的计算机或数据库服务器上,通过网络连接。其特点是:
(1)联邦数据库提供集成的数据格式,对用户提供统一的访问,屏蔽了各个数据库的复杂性和分布情况,简化了开发数据库查询和对数据统一理解的工作。这种分布式的数据集成,更加符合应用系统的实际情况。
(2)异构数据源不仅仅是数据库系统,通过中间件,可以扩展到传感器、文件和应用程序等。
【问题2】
此类数据往往是非结构化或者半结构化的,但同一个数据源往往有统一的页面模式,因此应该采用Web内容提取(挖掘/文本挖掘)的集成方法来获取对应供应商的产品信息。
其基本步骤为:
(1)分析页面,确定其页面中的数据模式。
(2)抓取页面,通过爬虫技术获取对应的网页。
(3)特征提取与处理,获取相应数据。
(4)数据清洗,根据规则进行判断,抛弃异常数据。
(5)数据转换,根据顶先定义好的语义映射关系,将数据转换为统一格式。
【问题3】
数据集成系统依靠模式映射来指明数据源中的数据和中介所用数据之间的语义关系,但映射过程中可能发生不确定性,其原因有:
(1)数据源与中介模式之间的语义映射可能是近似的。
(2)用户不熟悉模式或系统的域太宽,不能提供基于表单式的查询接口,需要使用关键字查询,但将关键字查询转换成一组候选的结构化查询时,会带来不确定性。
(3)数据常常是使用信息获取技术从非结构化数据源获取的,而这些获取技术一般只是"大致可用",所取得的数据可能是不确定的。
【解析】

本题主要考查数据集成中的数据仓库方案和联邦数据库方案的内容。
【问题1】
本问题考查数据仓库和联邦数据库集成方案的基本概念。数据仓库集成是把多种来的数据集中在一起,建立数据仓库,所有数据都驻留在单个数据库服务器上,配置大型处理器和存储容量。数据仓库主要用于决策支持,在数据处理过程中强调分析。其特点是:①集成的数据;②面向主题;③数据相对稳足;④包含历史信息。但是此种集成方法中需要将数据源的数据转换为数据仓库中的语义,而且需要定期的数据复制和数据更新。数据源往往指的是数据库系统。
联邦数据库集成是把多个数据库系统联合在一起,构成"联邦数据库系统",数据之间通过接口查询,互相通信,数据分布在不同地方的计算机或数据库服务器上,通过网络连接。其特点是:①联邦数据库提供集成的数据格式,对用户提供统一的访问,屏蔽了各个数据库的复杂性和分布情况,简化了开发数据库查询和对数据统一理解的工作。这种分布式的数据集成,更加符合应用系统的实际情况。②异构数据源不仅仅是数据库系统,通过中间件,可以扩展到传感器、文件和应用程序等。
两种方式都需要将数据源中的数据语义转换为统一数据语义,这种转换往往存在不定性。
【问题2】
本问题考查Web内容提取或Web数据挖掘的相关知识。Web信息系统中的数据往住是非结构化或者半结构化的,但同一个数据源往往有统一的页面模式,但是其数据呈现是嵌入在页面中。因此需要采用Web内容提取(挖掘/文本挖掘)的集成方法来获取对应供应商的产品信息。
其基本的步骤是:
(1)分析页面,确定其页面中的数据模式。制定数据挖掘的特征和提取规则,编写特定的页面分析和数据提取程序。
(2)抓取页面,通过爬虫技术获取对应的网页。将远端的页面下载到本地进行存储,为后续数据提取做准备。
(3)特征提取与处理,获取相应数据,依据的原则是分析页面阶段所形成的特征和提取规则。
(4)数据清洗,根据规则进行判断,抛弃异常数据。
(5)数据转换,根据预先定义好的语义映射关系,将数据转换为统一格式。
Web内容提取的算法程序本身是近似的,因此在获取数据的内容上存在不确定性。
【问题3】
本问题考查在数据集成过程存在的不确定性问题。问题1和问题2中实际己经明确了集成过程中存在不确定性。主要的原因在于数据集成系统依靠模式映射来指明数据源中的数据和中介所用数据之间的语义关系,但映射过程中可能发生不确定性。具体原因有:
(1)数据源与中介模式之间的语义映射可能是近似的。实际系统中往往很难有非常精确、完整的语义映射。
(2)用户不熟悉模式或系统的域太宽,不能提供基于表单式的查询接口,需要使用关键字查询,但将关键字查询转换成一组候选的结构化查询时,会带来不确定性。
(3)数据常常是使用信息获取技术从非结构化数据源获取的,而这些获取技术一般只是"大致可用",所取得的数据可能是不确定的。
因此,在本试题中,无论采用数据仓库或者联邦数据库集成方案,都存在数据源之间的语义映射和转换问题,都会带来数据集成的不确定。
更多“阅读以下关于数据集成的叙述,在答题纸上回答问题 1 至问题3。 ”相关问题
  • 第1题:

    阅读以下关于成本管理的叙述,回答问题1至问题3,将解答填入答题纸的对应栏内。【说明】一个预算100万的项目,为期12周,现在工作进行到第八周。已知成本预算是64万,实际成本支出是68万,挣值为54万。

    请计算成本偏差(CV)、进度偏差(SV)、成本绩效指数(CPI)、进度绩效指数(SPI)。


    CV=EV-AC=54-68=-14万元
    SV=EV-PV=54-64=-10万元
    CPI=EV/AC=54/68=0.794
    SPI=EV/PV=54/64=0.843

  • 第2题:

    先阅读以下说明,然后回答问题1至问题4。

    [说明]

    Windows Server 2003是基于Windows NT的技术,支持完善的NTFS分区格式。

    请简要说出NTFS的特点。


    正确答案:(1)NTFS对用户权限做出了非常严格的限制具有更高的安全性。 (2)NTFS支持对单个文件或目录的压缩。 (3)NTFS使用事务日志自动记录所有文件夹和文件更新系统能重做或恢复未成功的操作从而保护了系统的安全性。 NTFS文件系统与FAT文件系统相比最大的特点是安全性在NTFS分区上支持随机访问控制和拥有权对共享文件夹无论采用FAT还是NTFS文件系统都可以指定权限以免受到本地访问或远程访问的影响;对于在计算机上存储文件夹或单个文件或者是通过连接到共享文件夹访问的用户都可以指定权限使每个用户只能按照系统赋予的权限进行操作充分保护了系统和数据的安全。NTFS主要特点体现在以下三个方面: 1.通过NTFS许可保护网络资源 在Windows 2000以上版本网络资源的本地安全性是通过NTFS许可权限来实现的。在一个格式化为 NTFS的分区上每个文件或者文件夹都可以单独的分配一个许可这个许可使得这些资源具备更高级别的安全性用户无论是在本机还是通过远程网络访问设有NTFS许可的资源都必须具备访问这些资源的权限。 2.使用NTFS对文件和文件夹进行压缩 NTFS支持对单个文件或者目录的压缩。这种压缩不同于FAT结构中对驱动器卷的压缩其可控性和速度都要比FAT的磁盘压缩要好的多。 除了以上两(一、二两个)个主要的特点之外NTFS文件系统还具有其他的优点如:对于超过4GB以上的硬盘使用NTFS分区可以减少磁盘碎片的数量大大提高硬盘的利用率;NTFS可以支持的文件大小可以达到64GB远远大于FAT32下的4GB;支持长文件名等。 3.使用事务日志 NTFS使用事务日志自动记录所有文件夹和文件更新当出现系统损坏和电源故障等问题而引起操作失败后系统能重做或恢复未成功的操作从而保护了系统的安全性。
    (1)NTFS对用户权限做出了非常严格的限制,具有更高的安全性。 (2)NTFS支持对单个文件或目录的压缩。 (3)NTFS使用事务日志自动记录所有文件夹和文件更新,系统能重做或恢复未成功的操作,从而保护了系统的安全性。 NTFS文件系统与FAT文件系统相比最大的特点是安全性,在NTFS分区上,支持随机访问控制和拥有权,对共享文件夹无论采用FAT还是NTFS文件系统都可以指定权限,以免受到本地访问或远程访问的影响;对于在计算机上存储文件夹或单个文件,或者是通过连接到共享文件夹访问的用户,都可以指定权限,使每个用户只能按照系统赋予的权限进行操作,充分保护了系统和数据的安全。NTFS主要特点体现在以下三个方面: 1.通过NTFS许可保护网络资源 在Windows 2000以上版本,网络资源的本地安全性是通过NTFS许可权限来实现的。在一个格式化为 NTFS的分区上,每个文件或者文件夹都可以单独的分配一个许可,这个许可使得这些资源具备更高级别的安全性,用户无论是在本机还是通过远程网络访问设有NTFS许可的资源,都必须具备访问这些资源的权限。 2.使用NTFS对文件和文件夹进行压缩 NTFS支持对单个文件或者目录的压缩。这种压缩不同于FAT结构中,对驱动器卷的压缩,其可控性和速度都要比FAT的磁盘压缩要好的多。 除了以上两(一、二两个)个主要的特点之外,NTFS文件系统还具有其他的优点,如:对于超过4GB以上的硬盘,使用NTFS分区,可以减少磁盘碎片的数量,大大提高硬盘的利用率;NTFS可以支持的文件大小可以达到64GB,远远大于FAT32下的4GB;支持长文件名等。 3.使用事务日志 NTFS使用事务日志自动记录所有文件夹和文件更新,当出现系统损坏和电源故障等问题而引起操作失败后,系统能重做或恢复未成功的操作,从而保护了系统的安全性。

  • 第3题:

    阅读以下关于输入输出接口设计的说明,回答问题1至问题3,将解答填入对应栏内。

    【说明】

    下图为采用查询方式工作的输入接口,地址译码器中A15~A1直接接到或门的输入端。

    输入设备在向接口传送8位数据的同时,还传送负脉冲STB,该信号的作用是什么?


    正确答案:脉冲除了将输入设备的数据锁存到锁存器的输出端外该脉冲还用来触发D触发器使其输出Q为高电平此高电平表示外设有数据准备好。
    脉冲除了将输入设备的数据锁存到锁存器的输出端外,该脉冲还用来触发D触发器,使其输出Q为高电平,此高电平表示外设有数据准备好。 解析:本题考查输入输出接口设计以及输入输出控制方式应用知识。
    计算机与外设之间进行数据传送主要有三种基本控制方式:查询方式、中断方式和DMA方式。
    查询方式是通过执行输入/输出查询程序来完成数据传送的,其工作原理是:当CPU。启动外设工作后,不断地读取外设的状态信息进行测试,查询外设是否准备就绪,如外设准备好,则可以进行数据传送:否则,CPU继续读取外设的状态信息进行查询等待,直到外设准备好。
    采用程序查询方式进行数据传送时,实际上在外设准备就绪之前,CPU一直处于等待状态,致使CPU的利用率较低。倘若CPU按这种方式与多个外设传送数据时,就需要周期性的依次查询每个外设的状态,浪费的时间就更多,CPU的利用率就更低。因此,这种方式适合于工作不太繁忙的系统。
    中断方式是一种硬件和软件相结合的技术,中断请求和处理依赖于中断控制逻辑,而数据传送则是通过执行中断服务程序来实现的。这种方式的特点是:在外设工作期间,CPU无须等待,可以处理其他任务,CPU与外设可以并行工作,提高了系统效率,同时又能满足实时信息处理的需要。但在进行数据传送时,仍需要通过执行程序来完成。
    采用中断方式可以提高CPU的利用率,但有些I/O设备(如磁盘、光盘等)需要高速而又频繁地与存储器进行批量的数据交换,此时中断方式已不能满足速度上的要求。而直接存储器处理DMA方式,可以在存储器与外设之间开辟一条高速数据通道,使外设与存储器之间可以直接进行批量数据传送。实现DMA传送,要求CPU让出系统总线的控制权,然后由专用硬件设备(DMA控制器)来控制外设与存储器之间的数据传送。这种传送方式的特点是:在数据传送过程中,由DMA控制器参与工作,不需要CPU的干预,批量数据传送时效率很高,通常用于高速I/O设备与内存之间的数据传送。
    本题采用程序查询方式从输入设备读取数据。
    接口图中的选通信号低电平有效,是由外设提供的输入信号。当该信号有效时,将输入设备送来的数据锁存至输入锁存器中临时存储起来,并设置数据已经准备好的状态,标志该状态的是上图中的D触发器。
    D触发器的初始状态为0(数据未准备好),当输入设备的数据准备好时,通过CP将D触发器设置为1,标明数据已准备好,CPU可随时读取。
    要从输入设备读取数据(有效),首先应确定输入设备的端口地址,包括状态端口和数据端口。从题图中可知,要读取输入设备的状态端口(即数据是否准备好),需进行下面的运算:
    A15+A14+A13+…+A2+A1++
    即地址信号A15、A14、…、A2、A1与IOR进行或运算(经过或门)后的输出,与A0经非门后的输出再进行或运算,若为0,则可将D触发器中的状态输出至数据线D7,因此,要求A15、A14、…、A2、A1全部为0且A0为1,即状态端口地址为0001H。同理,要读取输入设备的数据,需进行下面的运算:
    A15+A14+A13+…+A2+A1++A0
    即当A15、A14、…、A2、A1全部为0并且A0也为0,才能通过三态门将数据送往数据总线,因此数据端口地址为0000H。
    若用查询方式将输入设备的一个数据读入CPU的BL寄存器中,则根据其工作方式,需要对I/O接口的状态不断进行测试,一旦满足条件(准备好传送数据即外设就绪),紧接着就执行数据传送指令,程序如下:
    START: MOVDX,0001H;外设的状态端口号送入DX寄存器
    NEXT1: IN AL,DX ;从外设端口读取状态并暂存入AL
    NEXT2: ANDAL,80H;判断数据是否就绪(D7是否为1)
    JZ NEXT1;未就绪(D7为0),则继续查询,否则开始读取数据
    MOVDX, 0000H ;外设数据端口号送入DX寄存器
    IN AL,DX ;从外设端口读取数据到的数据暂存入AL
    NEXT3: MOVBL,AL ;将数据送入BL寄存器
    RET

  • 第4题:

    阅读以下说明,回答问题1至问题3。

    【说明】路由器中IP访问控制列表能够帮助控制网上包的传输。

    IP访问控制列表主要用在哪几个方面?


    正确答案:主要用在以下几个方面: (1)控制一个端口的包传输; (2)控制虚拟终端访问数量; (3)限制路由更新的内容。
    主要用在以下几个方面: (1)控制一个端口的包传输; (2)控制虚拟终端访问数量; (3)限制路由更新的内容。

  • 第5题:

    阅读以下关于成本管理的叙述,回答问题1至问题3,将解答填入答题纸的对应栏内。
    【说明】
    一个预算100万的项目,为期12周,现在工作进行到第八周。已知成本预算(BCWS)是64万,实际成本(ACWP)支出是68万,挣值(BCWP)为54万。
    【问题1】(4分)
    请计算成本偏差(CV)、进度偏差(SV)、成本绩效指数CPI、进度绩效指数SPI。
    【问题2】(4分)
    根据给定数据,近似画出该项目的预算成本、实际成本和挣值图。
    【问题3】(12分)
    对以下六幅图表,分别分析其所代表的效率、进度和成本等情况,针对每幅图表所反映的问题,可采取哪些调整措施?


    答案:
    解析:
    无解析

  • 第6题:

    阅读下面程序,回答问题1至问题3。



    【问题1】(3分)

    上述代码能否输出“This is a test”?上述代码存在什么类型的隐患?

    【问题2】(4分)

    造成上述隐患的原因是?

    【问题3】(3分)

    给出消除该安全隐患的思路。


    答案:
    解析:


  • 第7题:

    阅读下列程序,回答问题1至问题3,将解答填入答题纸的对应栏内。【说明】逻辑覆盖法是设计白盒测试用例的主要方法之一,它是通过对程序逻辑结构的遍历实现程序的覆盖。针对以下由C 语言编写的程序,按要求回答问题。
    main( ){int i,n; //1for(i=1;i<5;i++){ //2n=0;  if(i!=1) //3 n=n+1; //4 if(i==3) //5 n=n+1; //6  if(n==3) //7  printf("Hello!"); //8 }} //9 问题1:(4分)请给出满足100%DC(判定覆盖)所需的逻辑条件。问题2:(6分)请画出上述程序的控制流图,并计算其控制流图的环路复杂度V(G)。问题3:(5分)请给出【问题2】中控制流图的线性无关路径。


    答案:
    解析:
    问题1:
    1、i < 52、i >= 53、i != 14、i == 15、i == 36、i != 37、n == 38、n != 3
    问题2(1) 控制流图如下图所示:



    (2)V(G)=4+1=5问题3:
    (1) 1-2-9 (2) 1-2-3-5-7-2... (3) 1-2-3-5-7-8-2...(4) 1-2-3-4-5-7-2… (5) 1-2-3-5-6-7-2…
    【解析】
    问题1:判定覆盖指设计足够的测试用例,使得被测程序中每个判定表达式至少获得-次 “真”值和“假”值,从而使程序的每一个分支至少都通过一次。本题中程序一共有4个判定,所以满足判定覆盖一共就需要8个逻辑条件,这些条件详见上述答案。问题2:
    本题考查白盒测试方法中的基本路径法。涉及到的知识点包括:根据代码绘制控制流图、计算环路复杂度。控制流图是描述程序控制流的一种图示方法。其基本符号有圆圈和箭线:圆圈为控制流图中的一个结点,表示一个或多个无分支的语句;带箭头的线段称为边或连接,表示控制流。基本结构如下所示:



    其中要特别注意的是,如果判断中的条件表达式是复合条件,即条件表达式是由一个或多个逻辑运算符连接的逻辑表达式,则需要改变复合条件的判断为一系列之单个条件的嵌套的判断。环路复杂度用来衡量一个程序模块所包含的判定结构的复杂程度。环路复杂度等于右图中的判定的节点个数加1。图中判定节点个数为4,所以V(G)=4+1=5。控制流程图的环路复杂性 V(G)一共有以下三种方法,但是最后一种最好用,不易出错。(1)控制流程图中的区域个数。(2)边数-结点数+2。(3)判定数+1。问题3:本小题考查白盒测试用例设计方法之基本路径法。涉及到根据控制流图和环路复杂度给出线性无关路径。线性无关路径:指包含一组以前没有处理的语句或条件的路径。从控制流图上来看,一条线性无关路径是至少包含一条在其他线性无关路径中从未有过的边的路径。程序的环路复杂度等于线性无关路径的条数,所以本题中有5条线性无关路径。这5条路径组成了问题2中控制流图的一个基本路径集。只要设计出的测试用例能确保这些基本路径的执行,就可以使程序中的每个可执行语句至少执行一次,每个条件的取真和取假分支也能得到测试。需要注意的是,基本路径集不是唯一的,对于给定的控制流图,可以得到不同的基本路径集。

  • 第8题:

    阅读以下说明,回答问题1至问题4,将解答填入答题纸对应的解答栏内。
    【说明】
    某企业网络拓扑如图1-1所示,A~E是网络设备的编号。










    答案:
    解析:
    【问题1】参考答案:1.B,2.A,3.C 4.D【问题2】5.ethernet 1 6、59.74.221.254【问题3】7) C.deny 8、A 9.F【问题4】10)192.168.4.1
    11)192.168.100.0 12)设置接口的类型是trunk
    【解析】
    【问题1】试题分析:这是一道简单的概念题,考察我们对企业园区网络的基本拓扑结构的了解。通常的企业为了确保内部网络的安全,会设置防火墙,防火墙有3个区域,外网,内网和DMZ区。DMZ通常用于存放各种服务器。因此首先可以选出B这个位置是防火墙,A用于连接Internet,是路由器。DMZ区内部有多台服务器,需要使用交换机连接。【问题3】试题分析:这是网络工程师考试第一次考华为的设备配置,而我们考前准备的都是ios的命令。那这道题是不是很难呢,其实这道题非常简单,只要我们有IOS的命令经验,这道题完全可以自己凭经验做出来,题目出题也是以选择题的形式,因此更加容易,对于没有用过华为设备的考生来说,也是非常简单的。
    【问题4】试题分析:这道题同样是基本的配置,掌握基本命令即可。

  • 第9题:

    阅读以下关于变更的叙述,回答问题1至问题3。【说明】在一个正在实施的系统集成项目中出现了下述情况:一个系统的用户向他所认识的一个项目开发人员抱怨系统软件中的一项功能问题,并且表示希望能够进行修改。于是,该开发人员就直接对系统软件进行了修改,解决了该项功能问题。针对这样一种情况,请分析如下问题。动态配置库用于管理基线和控制基线的变更。()


    正确答案:错误

  • 第10题:

    阅读以下关于变更的叙述,回答问题1至问题3。【说明】在一个正在实施的系统集成项目中出现了下述情况:一个系统的用户向他所认识的一个项目开发人员抱怨系统软件中的一项功能问题,并且表示希望能够进行修改。于是,该开发人员就直接对系统软件进行了修改,解决了该项功能问题。针对这样一种情况,请分析如下问题。请用150字以内的文字,说明上述情况中存在着哪些问题?


    正确答案: 上述情景中存在的主要问题有:
    (1)对用户的要求未进行记录;
    (2)对变更请求未进行足够的分析,也没有获得批准;
    (3)在修改过程中没有注意进行版本管理;
    (4)修改完成后未进行验证;
    (5)修改的内容未和项目干系人进行沟通。

  • 第11题:

    问答题
    阅读以下关于变更的叙述,回答问题1至问题3。【说明】在一个正在实施的系统集成项目中出现了下述情况:一个系统的用户向他所认识的一个项目开发人员抱怨系统软件中的一项功能问题,并且表示希望能够进行修改。于是,该开发人员就直接对系统软件进行了修改,解决了该项功能问题。针对这样一种情况,请分析如下问题。请用150字以内的文字,说明上述情况中存在着哪些问题?

    正确答案: 上述情景中存在的主要问题有:
    (1)对用户的要求未进行记录;
    (2)对变更请求未进行足够的分析,也没有获得批准;
    (3)在修改过程中没有注意进行版本管理;
    (4)修改完成后未进行验证;
    (5)修改的内容未和项目干系人进行沟通。
    解析: 暂无解析

  • 第12题:

    问答题
    阅读下列人力资源管理问题的叙述,回答问题1至问题3,将解答填入答题纸的对应栏内。【说明】M是负责某行业一个系统集成项目的项目经理,因人手比较紧张,M从正在从事编程工作的高手中选择了小张作为负责软件子项目的项目经理,小张同时兼任模块的编程工作,这种安排导致软件子项目失控。请用400字以内的文字,概述典型的系统集成项目团队的角色构成。叙述在组建项目团队、建设项目团队和管理项目团队方面所需的活动,结合实例说明。

    正确答案: 1.针对选定的项目,根据项目的特点,需要的角色如下:
    (1)管理类岗位如项目经理;
    (2)工程类如系统分析师(架构师)、软件设计师、程序员、测试工程师、美工、网络工程师、主机人员、实施人员;
    (3)行业专家;
    (4)辅助类如文档管理员、秘书等。
    2.考生结合实际项目,叙述进行如下活动的经验:
    (1)组建项目团队,明确责任(制订责任分配矩阵)。
    (2)建设项目团队:提高项目团队成员的个人绩效。提高项目团队成员之间的信任感和凝聚力,以通过更好的团队合作提高工作效率。
    (3)管理项目团队:跟踪个人和团队的执行情况、提供反馈。协调变更、以提高项目的绩效、保证项目的进度。项目管理团队还必须注意团队的行为、管理冲突、解决问题。评估团队成员的绩效。
    解析: 暂无解析

  • 第13题:

    试题四(共 25 分)

    阅读以下关于数据集成的叙述,在答题纸上回答问题 1 至问题3。

    某互联网销售企业需要建立自己的电子商务平台,将所有产品信息集中在一起,为用户提供全方位的产品信息检索服务。但产品供应商大多数已经建有自己的电子商务平台,且数据独立存储,而且数据格式和数据平台有较大差异,有的供应商甚至没有采用数据库来存储商品信息。为此该企业专门成立专家组来论证其数据集成方案。

    李工提出采用集中式集成方式把产品供应商的数据集中在一起,采用数据仓库技术来实现与各家供应商的数据集成。而王工提出采用松耦合的联邦数据库集成方案。专家组经过激烈讨论,认为王工方案更为合理,建议采用王工提出的集成方案。

    【问题 1】(10 分)

    请结合数据仓库和联邦数据库集成方案各自的特点,简要说明专家组采用王工提出的集成方案的原因。

    【问题 2】(7 分)

    部分供应商的产品信息没有相应的数据库,而是直接嵌入在 WEB 页面中供用户浏览。数据集成时需要直接从供应商电子商务平台的网页上获取其产品信息。请简要给出此类数据集成的方法和基本步骤。

    【问题 3】(8 分)

    在方案评审会上,项目组针对李工和王工的方案展开了激烈的讨论。刘工指出两种方案在实施的过程中,都存在数据源之间的语义映射和转换问题,都会带来数据集成的不确定。请简要说明产生不确定的原因。


    正确答案:

    试题四分析
    本题主要考查数据集成中的数据仓库方案和联邦数据库方案的内容。
    【问题l】
    本问题考查数据仓库和联邦数据库集成方案的基本概念。数据苍库集成是把多种来源的数据集中在一起,建立数据仓库,所有数据都驻留在单个数据库服务器上,配置大型处理器和存储容量。数据仓库主要用于决策支持,在数据处理过程中强调分析。其特点是:①集成的数据;②面向主题;③数据相对稳定;④包含历史信息。但是此种集成方法中需要将数据源的数据转换为数据仓库中的语义,而且需要定期的数据复制和数据更新。数据源往往指的是数据库系统。
    联邦数据库集成是把多个数据库系统联合在一起,构成“联邦数据库系统”,数据
    库之间通过接口查询,互相通信,数据分布在不同地方的计算机或数据库服务器上,通过网络连接。其特点是:①联邦数据库提供集成的数据格式,对用户提供统一的访问,屏蔽了各个数据库的复杂性和分布情况,简化了开发数据库查询和对数据统一理解的工作。这种分布式的数据集成,更加符合应用系统的实际情况。②异构数据源不仅仅是数据库系统,通过中间件,可以扩展到传感器、文件和应用程序等。
    两种方式都需要将数据源中的数据语义转换为统一数据语义,这种转换往往存在不确定性。
    【问题2】
    本问题考查Web内容提取或Web数据挖掘的相关知识。Web信息系统中的数据往往是非结构化或者半结构化的,但同一个数据源往往有统一的页面模式,但是其数据呈现是嵌入在页面中。因此需要采用Web内容提取(挖掘/文本挖掘)的集成方法来获取对应供应商的产品信息。
    其基本的步骤是:
    (1)分析页面,确定其页面中的数据模式。制定数据挖掘的特征和提取规则,编写特定的页面分析和数据提取程序。
    (2)抓取页面,通过爬虫技术获取对应的网页。将远端的页面下载到本地进行存储,为后续数据提取做准备。
    (3)特征提取与处理,获取相应数据,依据的原则是分析页面阶段所形成的特征和提取规则。
    (4)数据清洗,根据规则进行判断,抛弃异常数据。
    (5)数据转换,根据预先定义好的语义映射关系,将数据转换为统一格式。
    Web内容提取的算法程序本身是近似的,因此在获取数据的内容上存在不确定性。
    【问题3】
    本问题考查在数据集成过程存在的不确定性问题。问题1和问题2中实际已经明确了集成过程中存在不确定性。主要的原因在于数据集成系统依靠模式映射来指明数据  ,源中的数据和中介所用数据之问的语义关系,但映射过程中可能发生不确定性。具体原因有:
    (1)数据源与中介模式之间的语义映射可能是近似的。实际统中往往很难有非常精确、完整的语义映射。
    (2)用户不熟悉模式或系统的域太宽,不能提供基于表单式的查询接口,需要使用关键字查询,但将关键字查询转换成一组候选的结构化查询时,会带来不确定性。
    (3)数据常常是使用信息获取技术从非结构化数据源获取的,而这些获取技术一般只是“大致可用”,所取得的数据可能是不确定的。
    因此,在本试题中,无论采用数据仓库或者联邦数据库集成方案,都存在数据源之间的语义映射和转换问题,都会带来数据集成的不确定。
    试题四解答要点
    【问题1】
    数据仓库集成是把多种来源的数据集中在一起,建立数据仓库,所有数据都驻留在
    单个数据库服务器上,配置大型处理器和存储容量。数据仓库主要用于决策支持,在数
    据处理过程中强调分析。其特点是:
    (1)集成的数据。
    (2)面向主题。
    (3)数据相对稳定。
    (4)包含历史信息。
    联邦数据库集成是把多个数据库系统联合在一起,构成“联邦数据库系统”,数据库之间通过接口查询,互相通信,数据分布在不同地方的计算机或数据库服务器上,通过网络连接。其特点是:
    (1)联邦数据库提供集成的数据格式,对用户提供统一的访问,屏蔽了各个数据库的复杂性和分布情况,简化了开发数据库查询和对数据统一理解的工作。这种分布式的数据集成,更加符合应用系统的实际情况。
    (2)异构数据源不仅仅是数据库系统,通过中间件,可以扩展到传感器、文件和应用程序等。
    【问题2】
    此类数据往往是非结构化或者半结构化的,但同一个数据源往往有统一的页面模式,因此应采用Web内容提取(挖掘/文本挖掘)的集成方法来获取对应供应商的产品信息。
    其基本步骤为:
    (1)分析页面,确定其页面中的数据模式。
    (2)抓取页面,通过爬虫技术获取对应的网页。
    (3)特征提取与处理,获取相应数据。
    (4)数据清洗,根据规则进行判断,抛弃异常数据。
    (5)数据转换,根据预先定义好的语义映射关系,将数据转换为统一格式。
    【问题3】
    数据集成系统依靠模式映射来指明数据源中的数据和中介所用数据之间的语义关系,但映射过程中可能发生不确定性,其原因有:
    (1)数据源与中介模式之间的语义映射可能是近似的。
    (2)用户不熟悉模式或系统的域太宽,不能提供基于表单式的查询接口,需要使用关键字查询,但将关键字查询转换成一组候选的结构化查询时,会带来不确定性。
    (3)数据常常是使用信息获取技术从非结构化数据源获取的,而这些获取技术一般只是“大致可用”,所取得的数据可能是不确定的。

  • 第14题:

    阅读以下关于成本管理的叙述,回答问题1至问题3。

    [说明]

    一个预算100万的项目,为期12周,现在工作进行到第八周。已知成本预算是64万,实际成本支出是68万,挣值为54万。

    请计算成本偏差(CV)、进度偏差(SV)、成本绩效指数CPI、进度绩效指数SPI。


    正确答案:CV=EV-AC=54-68=-14万元 SV=EV-PV=54-64=-10万元 CPI=EV/AC=54/68=0.794 SPI=EV/PV=54/64=0.843
    CV=EV-AC=54-68=-14万元 SV=EV-PV=54-64=-10万元 CPI=EV/AC=54/68=0.794 SPI=EV/PV=54/64=0.843 解析:考查对挣值管理的几个重要参数的掌握程度。

  • 第15题:

    阅读以下关于分布式数据库的叙述,回答问题1至问题3。

    随着传统的数据库技术的成熟和计算机网络技术的发展,分布式数据库系统的研究与开发受到人们越来越多的关注。分布式数据库支持数据独立性和分布透明性。用户不必关心数据的逻辑分区,不必关心数据物理位置分布的细节,也不必关心副本的一致性问题。

    请用200字以内的文字叙述分布式数据库的主要特性和优缺点。


    正确答案:分布式数据库具有物理分布性、位置自治性与协作性支持数据独立性、集中与自治相结合的控制、适度数据冗余度、分布的事务管理。 优点:具有灵活的体系结构、分布式的管理和控制、系统的高可靠性和可用性、高扩展性、局部处理、响应速度快、经济性能优越。 缺点:系统开销通信较大、复杂的存取结构、保持数据一致性算法复杂、数据的安全性和保密性要求高。
    分布式数据库具有物理分布性、位置自治性与协作性,支持数据独立性、集中与自治相结合的控制、适度数据冗余度、分布的事务管理。 优点:具有灵活的体系结构、分布式的管理和控制、系统的高可靠性和可用性、高扩展性、局部处理、响应速度快、经济性能优越。 缺点:系统开销通信较大、复杂的存取结构、保持数据一致性算法复杂、数据的安全性和保密性要求高。 解析:本题目考查分布式数据库的主要特点和优缺点,同时考查在数据量很大的情况下数据表分片的设计及分片需要满足的条件,以及保持数据库一致性的方法。
    分布式数据库具有物理分布性、位置自治性与协作性,支持数据独立性、集中与自治相结合的控制、适度数据冗余度、分布的事务管理。优点包括具有灵活的体系结构、分布式的管理和控制、系统的高可靠性和可用性、高扩展性、局部处理、响应速度快、经济性能优越。缺点包括系统开销通信较大、复杂的存取结构、保持数据一致性算法复杂、数据的安全性和保密性要求高。
    在数据库中,某个业务表中的数据量很大,急速膨胀,在这样的情况下,为了保持高的数据响应速度,根据数据的时间局部性和空间局部性原则,可以对数据表进行分片设计。一般有两种分片方法:水平分片和垂直分片。
    数据表分片满足完备性条件,可重构条件和不相交条件。其中完备性条件是指必须把全局关系的所有数据映射到片段中,决不允许有属于全局关系的数据却未被映射到任何一个片段;可重构条件是指必须保证能够由同一个全局关系的各个片段来重建该全局关系。对于水平分片可用并操作重构全局关系;对于垂直分片可用联接操作重构全局关系。不相交条件是指要求一个全局关系被分割后所得的各个数据片段互不重叠(对垂直分片的主键除外)。
    分布式数据库中各局部数据库应满足集中式数据库的基本需求,除此以外还应保证数据库的数据全局一致性、并发操作的可串行性和故障的全局可恢复性。保持数据库一致性的方法是要保持数据副本的一致性,保证分布式事务的ACID属性和故障恢复的一致性。

  • 第16题:

    阅读以下说明,回答问题1至问题4,将解答填入答题纸对应的解答栏内。

    【说明】

    某公司网络的 Internet接入方式如图3-1 所示。

    【问题 1】(4分)

    查看路由器R1的状态信息如图3-2所示, 则可以确定R1的E0端口IP地址是 (1) ,

    E1端口的IP地址是 (2) 。


    正确答案:

    1222.90.196.54

    2192.168.0.1
    试题三分析
    本题考查网络配置和网络故障的处理。题目给出一个小型公司的简单网络配置图,要求根据题意完成简单的网络配置;题中设置了一些常见的网络故障,要求考生能根据故障现象推测出故障原因并提供解决故障的思路和方案。
    【问题1】
    根据图3-1可知,E0端口位于外网网段,E1端口位于内网网段。根据图3-2两个网卡的配置对应着E0端口和E1端口的配置,从“WAN端”和“LAN端”可以推测E0对应于“WAN端”,E1端口对应于“LAN端”;再从“222.90.196.54” IP地址属于公网地址,“192.168.0.1”IP地址属于私网地址可以确定E0端口IP地址是“222.90.196.54”,E1端口IP地址是“192.168.0.1”。

  • 第17题:

    阅读以下C代码,回答问题1和问题2,将解答填入答题纸的对应栏内。【C代码1】


    【问题2】写出【代码2】的运行时的输出结果。


    答案:
    解析:
    (1)输入-1331的结果是:Palindromic number.a=-1331 b=1331 输入795的结果是:a=795 b=597(2) Passed,point=4 Passed,point=1 Passed,point=1Passed,point=1 Failed

  • 第18题:

    阅读以下说明,回答问题1至问题4,将解答填入答题纸的对应栏内。【说明】某IT部门的小张在撰写本企业的信息化管理报告时,提到企业信息安全的管理所存在的问题时有如下表述(下面方框内)。



    请分析小张提出的企业信息安全问题,并结合信息安全管理的相关知识回答下列问题。
    【问题1】(6分)请简要说明安全审计对数据安全保障的作用。【问题2】(4分)(1)HTTPS协议在传输过程中如何确保数据的安全。 (2)访问HTTPS网站与访问HTTP网站的区别是什么。【问题3】(3分)简要叙述对信息化人员的安全管理包括哪些方面。【问题4】(2分)为了保障业务的连续性,拟配置两条百兆网络出口线路,请简要说明应该如何配置策略路由。


    答案:
    解析:
    【问题1】安全审计的作用如下:?(1)检测对系统的入侵,对潜在的攻击者起到震慑或警告作用。?(2)发现计算机的滥用情况,对于已经发生的系统破坏行为提供有效的追纠证据。?(3)为系统安全管理员提供有价值的系统使用日志,从而帮助系统安全管理员及时发现系统入侵行为或潜在的系统漏洞。?(4)为系统安全管理员提供系统运行的统计日志,使系统安全管理员能够发现系统性能上的不足或需要改进与加强的地方。【问题2】HTTPS通过:?内容加密?建立一个信息安全通道,来保证数据传输的安全;?身份认证?确认网站的真实性?数据完整性?防止内容被第三方冒充或者篡改?来确保数据的安全?HTTPS和HTTP的区别?https协议需要到CA申请证书。?http是超文本传输协议,信息是明文传输;https?则是具有安全性的ssl加密传输协议。?http和https使用的是完全不同的连接方式,用的端口也不一样,前者是80,后者是443。?http的连接很简单,是无状态的;HTTPS协议是由SSL+HTTP协议构建的可进行加密传输、身份认证的网络协议,比http协议安全。【问题3】多人负责的原则:每项与安全有关的活动都必须有两人或多人在场。这些应是由系统主管领导指派的,应忠诚可靠,能胜任此项工作?任期有限原则:一般地讲,任何人最好不要长期担任与安全有关的职务,以免误认为这个职务是专有的或永久的?职责分离原则:除非系统主管领导批准,在信息处理系统工作的人员不要打听、了解或参与职责以外、与安全有关的任何事情。【问题4】
    使用双主干策略路由,配置策略路由步骤为:?定义路由策略?定义每个路由策略的匹配规则或条件?定义每个规则或条件匹配后的行为?将策略应用到指定的端口上

  • 第19题:

    阅读以下关于软件系统可行性分析的叙述,在答题纸上回答问题1至问题3。【说明】某软件开发企业受对外贸易公司委托开发一套跨境电子商务系统,项目组从多个 方面对该电子商务系统进行了可行性分析,在项目组给出的可行性分析报告中,对项目的成本、收益情况进行了说明:建设投资总额为300万元,建设期为1年,运营期为4年,该方案现金流量表如表1-1所示。【问题1】(12分)软件系统可行性分析包括哪几个方面?用200以内文字说明其含义。


    答案:
    解析:
    【问题1】(12分)答案:系统可行性分析包括以下个方面:(1)经济可行性。主要评估项目的建设成本、运行成本和项目建成后可能的经济收益。(2)技术可行性。研究的对象是信息系统需要实现的功能和性能,以及技术能力约束。(3)法律可行性。具有比较广泛的内容,它需要从政策、法律、道德、制度等社会因素来论证信息系统建设的现实性。(4)用户使用可行性。从信息系统用户的角度来评估系统的可行性,包括企业的行政管理和工作制度、使用人员的素质和培训要求等。【问题2】(7分)

  • 第20题:

    阅读以下关于变更的叙述,回答问题1至问题3。【说明】在一个正在实施的系统集成项目中出现了下述情况:一个系统的用户向他所认识的一个项目开发人员抱怨系统软件中的一项功能问题,并且表示希望能够进行修改。于是,该开发人员就直接对系统软件进行了修改,解决了该项功能问题。针对这样一种情况,请分析如下问题。请用300字以内的文字,说明上述情况可能会导致什么样的后果?


    正确答案: 由于上述问题的存在可能导致如下后果:
    (1)缺乏对变更请求的记录可能会导致对产品的变更历史无法追溯,并会导致对工作产物的整体变化情况失去把握。
    (2)缺乏对变更请求的分析可能会导致后期的变更工作出现工作缺失、与其他工作不一致等问题,对项目的进度、成本、质量方面也会产生一定影响。
    (3)在修改过程中不注意版本管理.一方面可能会导致当变更失败时无法进行复原,造成成本损耗和进度拖延;另一方面,对于组织财富和经验的积累也是不利的。
    (4)修改完成后不进行验证则难以确保变更是否正确实现,为变更付出的工作量也无法得到承认。
    (5)未与项目干系人进行沟通可能会导致项目干系人的工作之间出现不一致之处,进而影响项目的整体质量。

  • 第21题:

    阅读以下关于变更的叙述,回答问题1至问题3。【说明】在一个正在实施的系统集成项目中出现了下述情况:一个系统的用户向他所认识的一个项目开发人员抱怨系统软件中的一项功能问题,并且表示希望能够进行修改。于是,该开发人员就直接对系统软件进行了修改,解决了该项功能问题。针对这样一种情况,请分析如下问题。配置项审计包括功能配置审计和物理配置审计。()


    正确答案:正确

  • 第22题:

    问答题
    阅读以下关于成本管理的叙述,回答问题1至问题3,将解答填入答题纸的对应栏内。【说明】一个预算100万的项目,为期12周,现在工作进行到第八周。已知成本预算是64万,实际成本支出是68万,挣值为54万。请计算成本偏差(CV)、进度偏差(SV)、成本绩效指数(CPI)、进度绩效指数(SPI)。

    正确答案: CV=EV-AC=54-68=-14万元
    SV=EV-PV=54-64=-10万元
    CPI=EV/AC=54/68=0.794
    SPI=EV/PV=54/64=0.843
    解析: 暂无解析

  • 第23题:

    问答题
    阅读以下关于变更的叙述,回答问题1至问题3。【说明】在一个正在实施的系统集成项目中出现了下述情况:一个系统的用户向他所认识的一个项目开发人员抱怨系统软件中的一项功能问题,并且表示希望能够进行修改。于是,该开发人员就直接对系统软件进行了修改,解决了该项功能问题。针对这样一种情况,请分析如下问题。请用300字以内的文字,说明上述情况可能会导致什么样的后果?

    正确答案: 由于上述问题的存在可能导致如下后果:
    (1)缺乏对变更请求的记录可能会导致对产品的变更历史无法追溯,并会导致对工作产物的整体变化情况失去把握。
    (2)缺乏对变更请求的分析可能会导致后期的变更工作出现工作缺失、与其他工作不一致等问题,对项目的进度、成本、质量方面也会产生一定影响。
    (3)在修改过程中不注意版本管理.一方面可能会导致当变更失败时无法进行复原,造成成本损耗和进度拖延;另一方面,对于组织财富和经验的积累也是不利的。
    (4)修改完成后不进行验证则难以确保变更是否正确实现,为变更付出的工作量也无法得到承认。
    (5)未与项目干系人进行沟通可能会导致项目干系人的工作之间出现不一致之处,进而影响项目的整体质量。
    解析: 暂无解析

  • 第24题:

    问答题
    阅读以下关于变更的叙述,回答问题1至问题3。【说明】在一个正在实施的系统集成项目中出现了下述情况:一个系统的用户向他所认识的一个项目开发人员抱怨系统软件中的一项功能问题,并且表示希望能够进行修改。于是,该开发人员就直接对系统软件进行了修改,解决了该项功能问题。针对这样一种情况,请分析如下问题。请用300字以内的文字,说明配置管理中完整的变更处置流程。

    正确答案: 变更管理的基本流程是:
    (1)变更申请。应记录变更的提出人、日期、申请变更的内容等信息。
    (2)变更评估。对变更的影响范围、严重程度、经济和技术可行性进行系统分析。
    (3)变更决策。由具有相应权限的人员或机构决定是否实施变更。
    (4)变更实施。由管理者指定的工作人员在受控状态下实施变更。
    (5)变更验证。由配置管理人员或受到变更影响的人对变更结果进行评价,确定变更结果和预期相符、相关内容进行了更新、符合版本管理的要求。
    (6)沟通存档。将变更后的内容通知可能会受到影响的人员,并将变更记录汇总归档。如提出的变更在决策时被否决,其初始记录也应予以保存。
    解析: 暂无解析