第3章 计算机信息检索
一、填空题
1、脱机检索阶段、联机检索阶段、光盘检索、网络检索
2、定题信息、回溯性信息、日常
3、输出格式、输出方式
4、ARPANET
5、中国科学技术网、中国教育和科研计算机网、中国公用计算机互联网、中国金桥信息网
二、名词解释
1、P50检索策略:是指为实现检索目标而制订的全盘计划或方案,指导整个检索过程。
2、P60计算机标识语言:是电子环境下发展的一种利用特定的文本句法描述信息资源的格式成分、结构信息、特征等的语言。
3、P66搜索引擎:又称搜索机,是人们对网上各种信息资源进行标引和检索的一种工具,它是一种能够通过互联网接受用户的检索标识,并向用户返回符合其检索要求的信息资源网址的网站。
三、简答题
1、P34(1)速度快、效率高 (2)检索范围广 (3)检索不受时空的限制
(4)数据更新快,可以及时获得最新信息 (5)检索辅助功能完善,使用方便
2、P39规定检索词之间的逻辑关系的运算符,称为布尔逻辑运算符。布尔罗辑运算符包括逻辑 “或(OR)”与“(AND)”和“非(NOT)” 。利用布尔逻辑运算符进行检索词或代码的逻辑组配,是现代计算机检索的基本技术。
3、P55扩检是指设置的检索范围太小,命中文献不多,需要扩大检索范围的方法。
缩检:是指设置的检索范围太大,命中文献太多,需要缩小检索范围的方法。
如果属于需要扩大检索范围,提高文献查全率,调整检索策略的方法有:(1)减少“与(AND)”运算符,增加同义或同族相关词,并使用逻辑“或(OR)”运算符将它们连接起来;(2)在词干相同的单词后使用截词符“?”;(3)去除已有的字段限制、位置运算符限制(或者改用限制程度较小的位置运算符)。
如果属于缩小检索范围,提高文献查准率的,调整检索策略的方法有:(1)减少同义词或同族相关词;(2)增加限制概念,用逻辑“与(AND)”将它们连接起来;(3)使用字段限制,限定检索词在指定的基本字段或者批定的辅助字体出现,限制检索结果的文献类型、语种、出版国家、时间等;(4)使用适当的位置算符;(5)使用“非(NOT)”运算符,排除无关概念。
4、P63 IP地址是如何分类的?为了适应不同的网络规模和需求,IPV4地址被分成五类,A类地址、B类地址、C类地址、D类地址和E类地址。其中前三类地址被用来作为全球唯一的单播地址,后两类地址作为组播和试验目的而保留。A类网络是大型网,B类网络是中型网,C类网络是小型网。
5、P71根据搜索引擎产生的时间顺序可分为第一代、第二代、第三代搜索引擎。
根据搜索方法和服务提供方式可分为目录式搜索引擎、机器人搜索引擎和元搜索引擎。
根据搜索引擎对搜索的网络资源集中情况分为集中式搜索引擎和分布式搜索引擎。
根据搜索引擎搜集网络资源的不同类型可分为万维网搜索和非万维网搜索引擎。
P76搜索引擎工作原理:首先是通过网络机器人搜集信息,并对网页中的每一个词(即关键词)进行索引,建立网页索引数据库,当用户提交关键词后,所有网页索引数据库中的相关的关键词都将作为搜索结果检索出来,再经过搜索引擎网站特定的算法——通常根据网页中关键词的匹配程度、出现的位置/频次、链接质量等进行排序后,按照与关键词的相关度由高到低、依次排列,返回给用户。
6、P77一个搜索引擎一般由搜索器、索引器与索引数据库、检索器和用户接口等四个部分组成。
7、P84一是选好关键词:(1)高频词法,(2)善用“搜索提示”,(3)巧用“相关搜索”,(4)根据网页特征选择关键,(5)搜索语法的灵活运用。
二是使用搜索的基本语法:(1)布尔逻辑,(2)范畴检索,(3)短语检索。
8、P79(1)网页覆盖率,提高查全率,是保证查准率的基础。。
(2)返回结果的准确性,主要是第一页结果的准确性。
(3)重复信息返回的过滤,返回结果应该尽可能不出现重复、类似的结果。
(4)网页更新速度,取决于新网页的发现和死链接(指无法访问网页)的及时删除。
(5)搜索服务的相应时间,也就是用户提交检索后得到结果返回的等待时间,一般要低于一秒钟即可。
(6)搜索服务的系统稳定性。
常用的搜索引擎有:百度,谷歌,必应、雅虎、搜狐、新浪。
9、Fisher判别法,重庆市,上市公司,投资机会
10、以下是搜索三个术语时的结果列表
术语查询 | 西西弗斯 | 速动比率 | 长平之战 |
| |||||
网站 | 输入提示 | 网页快照 | 搜索时间 | 搜索结果 | 搜索时间 | 搜索结果 | 搜索时间 | 搜索结果 |
|
百度 | 有 | 有 | 无显示 | 875,000 | 无显示 | 6,270,000 | 无显示 | 1,450,000个 |
|
谷哥 | 无 | 无法访问 | 0.33秒 | 451,000 | 0.14秒 | 1,520,000 | 0.23秒 | 1,760,000 |
|
结果显示,百度”作为全球最大的中文搜索引擎,在查找资料时更显方便.不但有输入提示, 网页快照,而且百度百科在解释术语方面还比较详细.搜索时间也很快,稳定性强,搜索结果与谷歌比也不相上下,而且更新较快.
“Google”搜索速度快而且提供了最丰富的高级搜索功能。但是死链率比较高是Google最大的问题,稳定性不够高。特别是“网页快照”功能,有却出现不可访问的问题。内容更新不是很及时.
11、奥尔德林
12、清平乐·宋 黄庭坚
13、1977-05-25 1980-05-21 1983-05-25 近20年的电影:夺宝奇兵、慕尼黑世界大战、幸福终点站、少数派报告、神鬼交锋、人工智能、拯救大兵瑞恩、失落的世界:侏罗纪公园、断锁怒潮、辛德勒的名单、侏罗纪公园、霍克船长、直到永远、夺宝奇兵3 :圣战奇兵、太阳帝国、紫色、夺宝奇兵2 :魔宫传奇、阴阳魔界、外星人、夺宝奇兵1:法柜奇兵、一九四一 、第三类接触、大白鲨、横冲直撞大逃亡、飞轮喋血
14、www.chinaunicom.com.cn
中国联合网络通信集团有限公司(简称“中国联通”)于2009年1月6日在原中国网通和原中国联通的基础上合并组建而成,是中国唯一一家在纽约、香港、上海三地同时上市的电信运营企业,连续多年入选“世界500强企业”。中国联通主要经营固定通信业务,移动通信业务,国内、国际通信设施服务业务,卫星国际专线业务、数据通信业务、网络接入业务和各类电信增值业务,与通信信息业务相关的系统集成业务等。中国联通于2009年4月28日推出全新的全业务品牌“沃”,承载了联通始终如一坚持创新的服务理念,为个人客户、家庭客户、集团客户提供全面支持。
15、欧拉,全名是莱昂哈德·欧拉(Leonhard Euler,1707-1783),1707年出生在瑞士的巴塞尔城。18世纪最优秀的数学家,也是历史上最伟大的数学家之一,被称为“分析的化身”。欧拉是一位数学神童。他作为数学教授,先后任教于圣彼得堡和柏林,尔后再返圣彼得堡。欧拉是有史以来最多遗产的数学家,他的全集共计75卷。欧拉实际上支配了18世纪的数学,对于当时的新发明微积分,他推导出了很多结果。在他生命的最后7年中,欧拉的双目完全失明,尽管如此,他还是以惊人的速度写出了生平一半的著作。
第4章 数据库基础及应用
一、填空题
1、参考数据库、全文数据库、事实数据库
2、中国知识基础设施工程、国家重点新产品重中之重
3、万方数字资源系统
二、简答题
1、P112数据库是指至少由一种文档组成,能满足特定目的的或特定功能数据处理系统需要的数据集合。主要由文档、记录、字段等构成,是长期存储在计算机内、结构化、可共享的数据集合。
2、P116(1)中国知网(CNKI)系列源数据库:特点:
有3种检索方式:初级检索、高级检索和专业检索
(2)维普信息资源系统:特点:全球著名的中文信息服务网站,以及中国最大的综合性文献服务站。
有5种检索方式:快速检索、传统检索、高级检索、分类检索和期刊导航。
(3)万方数据资源系统 特点:是万方数据股份有限公司面向互联网推出的网络推出服务网站,是以科技信息为主,集经济、金融、社会、文化、教育等信息于一体的综合性信息服务系统;是一个以国家信息基本设施为依托,面向国民经济建设主战场的现代化、网络化、覆盖全国的科技信息传播系统。
检索方法:1、在IE地址栏中输入网址http://www.wanfangdata.com.cn,打开万方数字资源主页,默认进入的就是新版页面。 2、输入用户名及密码,登录。需提前注册。 3、万方数据资源系统包括多个数据库资源,在首页检索区上方列出了可检索的数据库类型,主要包括学术论文、专利、标准、成果、法规等,选择首页检索区或资源更新区的待检索数据库。 4、万方数据资源系统针对不同的数据库特点设计了不同的检索入口,在选定的数据库中输入检索词或构建的检索式,即可在系统默认的简单检索界面上通过单击“检索”按键进行相应的查询。 5、检索结果的处理,保存题录或下载全文。
3、P154书生之家,超星数字图书馆(重在会运用)
书生之家数字图书馆 特点:它是集支持普遍存取、分布式管理和提供集成服务于一身的基于Intranet和Internet环境的数字图书馆系统平台,为广大读者创造了一个全新的阅读空间,提供了一个多元立体的知识网络系统。
有6种检索方式:简单检索、分类检索、图书全文检索、组合检索、高级全文检索以及继续检索。
超星数字图书馆 特点:向互联网用户提供丰富的电子图书阅读,是目前世界最大的中文在线数字图书馆;同时专门为非会员构建开放免费阅览室,并向所有用户、作者免费提供原创作品发布平台、读书社区、博客等服务。
有4种检索方式:快速检索 高级检索分类检索 二次检索。
4、参考宁波电大电子文献库。
如行政管理专业论文,选取“企业人力资源管理”这一课题,会搜索到很多相关的参考文献,格式如:《企业人力资源管理现状与制定对策》,李恕,经营管理者,2012/01,不一一列举,也可进百度搜。
下一篇:暂无