摘要 以CIMSNET信息中心网站的开发与建设为背景,本文系统地分析和阐述了建立一个制造技术信息服务网站需要考虑的问题和解决方法,包括网站的总体设计、硬软件平台的选择、信息资源的采集、加工方法、维护方法和组织方法等。希望能对中国的制造信息服务网站的建设有所帮助。
关键词 因特网,信息资源,信息服务
在知识经济飞速发展的今天,对信息资源的发掘和利用关系着一个国家经济发展的潜力和速度,能否及时、准确、快速获取丰富的信息资源,也往往决定着企业在瞬息万变的市场中竞争的成败。作为国民经济的支柱产业,制造业要发展,也必须充分发掘利用好丰富的信息资源,因此进行互联网建设、建立专门为本领域服务的专业网站已成为制造业发展的一个重点。
1 制造信息服务网站
制造信息服务网站是将经过选择的、系统的、符合制造学科体系的信息,包括技术信息、产品信息、经济信息等制造类专业信息提供给用户,以满足他们对制造领域相关信息的需求,其目的就是在于节省用户的查找时间和通信费用,提高查准率和查全率。为从事制造领域管理的各级领导及研究的有关专家提供决策依据,为科研、管理人员提供有关技术信息、咨询服务,促进我国制造业的腾飞。
目前,我国制造业信息服务网站基本上可分为三种模式:第一种是以馆藏文献为基础的文献检索、报道、传递网站;第二种是以网络化资源为基础的专业信息检索和专业信息门户网站;第三种是以信息交流为导向的专业信息园区。本文以第二种模式为基础,试图通过开发“CIMSNET信息中心站点”摸索出一套开发专业制造信息服务网站的方法。
2.系统硬软件的选择
2.1 硬件平台的选择
硬件平台的选择是十分重要的。一个网站如果速度太慢,则很难吸引众多的用户,同时也是对网站用户不负责任的体现。硬件平台的选择可从预计的客户规模、站点内容和可提供的服务、经费等方面进行考虑。下面是由WEBBENCH2.0测试所得的两张图表明客户规模和站点的内容(静态与动态内容)是如何影响服务器性能的。
从图2.1可以看出,对于静态内容而言,如果没有足够的内存作为缓存,服务器就被迫使用磁盘子系统,使服务器整体系统性能下降,如果加上足够的内存,就可以使系统不使用磁盘子系统而使服务器获得最佳的性能。但有了足够的内存来容纳所有的静态内容,再增加内存就不会提高服务器的性能,而增加处理器就是最好的选择。
从图2.2可以看出,如果站点有大量的动态内容(如CGI程序),增加CPU可能是较好的选择。因为动态内容占用CPU的处理时间更多一些,当有了足够的内存来容纳所有的静态内容时,CPU将花费大量的时间处理动态内容会导致服务器性能降低。
图2.1
每秒页面请求数越高表示性能越好
注:以60个客户机为准,吞吐量由高到低的5条线分别代表:
2CPU-521MB;1CPU-256MB;1CPU-128MB;2CUP-64MB;1CPU-64MB。
图2.2
每秒页面请求数越高表示性能越好
注:以60个客户机为准,吞吐量由高到低的6条线分别代表:
静态1CPU-256MB;动态1CPU-256MB;
动态1CPU-128MB;动态1CPU-64MB;
静态1CPU-128MB;静态1CPU-64MB。
在CIMSNET信息中心站点项目中,选择了曙光GT140和GT355E两台服务器分别作为Web服务器和Mail服务器。其配置分别是PowerPC 604e,128M内存、PowerPC 604e,和256M内存。
2.2 操作系统及开发工具的选择
2.2.1 操作系统的选择
当前可供选择的操作系统包括Windows NT、UNIX和LINUX,但总的来说目前较为流行、好用而且功能强大的还是UNIX系统,当然如果由于经费的原因,而且从可维护性等方面考虑,Windows NT也是不错的选择。
本项目的操作系统是AIX4.2。
2.2.2 数据库系统的选择
目前无论是UNIX平台还是Windows NT平台,可选择的数据库产品还是相当多的,如Oracle、Informix、Sybase、SQL Server等。从技术上看它们各有优势,用户可以根据自己的实际情况、应用的方面来选择不同的数据库产品。
本项目的数据库系统是Oracle 8.0.4 for AIX。
2.2.3 开发工具的选择
2.2.3.1.Web网页开发工具的选择
制作Web页面的工具有很多,包括Microsoft FrontPage、Netscape编辑器、Adobe Pagemill3.5、Dreamwaver3.0等等,我们选择了“功能强大、容易上手”的FrontPage98。
和Web页面相关的图形、图象及动画,除可选择Photoshop、CoreDraw等图形制作软件制作外,也可直接选用现成的来做,如市面上出售的光盘上有大量的图形、图象和动画库,可根据需要选择。
2.2.3.2.数据库开发工具的选择
不同的数据库有他们各自的开发工具,如Sybase的PowerBuilder6.5,Oracle的Developer2000等。根据我们所选择的数据库,选择了Oracle的PL/SQL和Pro*C,数据库维护工具选用PowerBuilder6.5。
3 CIMSNET信息中心站点设计
3.1 CIMSNET信息中心站点设计原则
CIMSNET信息中心站点的设计原则始终是以“用户为中心”的,其目的就是“让用户以最小的代价,最短的时间,获得最满意的结果”。因为使用制造业信息服务站点的用户往往都是对制造领域的信息感兴趣的人,如果不能满足这部分用户群的需求,那么专业信息服务站点就失去了使用的价值。
经过充分的考虑,我们提出了CIMSNET信息中心站点的功能结构。站在用户的角度,我们在设计页面时,加入了站点结构、导航条、检索帮助等多种帮助信息;在设计检索功能时,提供了尽量多的检索方式和途径,如全文检索、联库检索、渐近检索、策略式检索等。同时为了进一步完善网站功能和方便用户,还应提供交互工具,如站内检索、网上书店、在线注册、留言板、技术论坛等,为网上用户提供一个集订阅、交流、信息反馈于一体的综合的、动态的交互环境,帮助用户更好的针对个人需求发掘和获取站内信息资源。
3.2 功能结构
图3 系统功能结构图
4 网站资源的收集
良好的信息资源是保证专业技术网站信息内容充实、质量优异的根本,如果专业技术信息网站信息资源不够,就成了“无本之木,无源之水”。因此专业技术信息网站信息资源建设就成了网站建设的“重中之重”。由于专业技术信息网站的目标是提供准确、有效的信息,所以收集信息时的重点应放在“精”,而不是“广”。根据不同领域信息的特点,可以选择不同的信息采集方式。
4.1 自动采集
自动采集指用“机器人(Robot)”或“蜘蛛(Spider)”定期地到指定的网站去下载部分内容或全部内容,然后对这些信息进行分析、加工。具备这一条件是现代专业技术信息服务网站作好服务工作的基础。上述工具网上某些站点提供免费下载,如http://www.tardis.ed.ac.uk/harvest/。
4.2 手工采集
手工采集在自动采集还未实现智能化之前是信息采集的重要手段。手工采集的方式主要有:
通过因特网进行网上信息资源的采集
因特网上的制造类专业站点有很多,而且这些网站的技术侧重点也不进相同,信息更新较快,运用传统的手工收集印刷型和电子型的工具书远远不能满足网站用户的需求。因此网上信息的收集是专业技术信息服务网站资源建设的重点工作。
(1)调研与整理步骤
确定主题,利用所确定的报导内容确定主题词;
上网检索,利用网上搜索引擎(如Yahoo, Infoseek等)对所选主题进行检索,得到站点信息与URL地址,URL也可在纸基传统媒体扫描进行积累,如有许多权威的出版社出版了许多站点大全、站点手册等进行网上冲浪的工具书,这些工具书往往具有较为清晰的分类体系,并会对站点进行简要的介绍,从这里我们也可以得到一些相关站点的网址;
内容浏览,利用URL地址访问目标站点,浏览站点内容;
检索结果的组织利用,将浏览过的站点中有价值的筛选出来加以记录,并记录URL地址以备进一步利用。
(2)网上资源调查结果分析
由于上网的各机构、组织都分别采用各种方式宣传和扩大自己的影响,因此可通过网络迅速获得各种信息,包括有关的出版及会议消息,对于我们做好专业技术信息服务有重要作用,这主要体现在:
①公开出版物在网上有预告,这对我们文献的获取计划制定非常有力,以往仅能依赖公共图书馆的馆藏,现在利用网上资源,在时效性方面获得了很大优势;
②协会、科研机构咨询机构举办的会议在网上也有预告,公开出版的会议录、研究报告也有采购办法的通告,这对我们掌握学术动态以及文献获取有重要意义;
③科研机构网站上一般都有其性质、背景、演变、隶属关系等方面的详细介绍,另外还包含他们的研究成果,正在进行的项目等的介绍,这对我们全面了解机构,掌握国际研究进展状态具有很大意义。
④CIMS各分领域产品供应商网站发布的产品介绍、应用案例分析、客户服务等信息对于我们掌握工业发展动态、产品选型参考,技术实施等都有重要参考价值。
当然,上网的组织机构一方面是扩大自己的影响,同时,他们也注重赢利的主要目的,因而许多有价值的出版物我们都无法直接获得原文,只能通过订购获得。
2)通过报刊、专著、会议录、工具书等纸基媒体进行信息采集
通过分析,我们将期刊分为学术类期刊和新闻动态类期刊。学术类期刊、专著、会议录、工具书主要充实数据库信息,而报纸、新闻动态类期刊则主要报导技术动态及技术综述,将其作为Web页面信息的来源。当然,学术类期刊、专著等报导的新内容我们也将在页面上进行报导。
(1)调研与搜集整理步骤
以国家图书馆的馆藏为主,并结合信息中心订阅的报刊,用CIMS主题分类,SME分类体系的主题词进行筛选,确定调研范围;
设计文献源调查表(如表1所示),表中设文献名称、类型、出版信息(时间、地点、期刊有出版周期)、馆藏(馆藏地、馆藏号)主要报道内容等项目;
到馆藏地点提取文献源,由调查人员对文献源从其权威性、时效性、可靠性等方面做出评价,若符合入选标准,则填写文献源调查表,作为入选的文献源备用。
3)利用商用数据库进行信息采集
一些大型的信息机构会定期出版信息库光盘,如Dialog公司的商用数据库和中国万方公司出版的信息库光盘等。我们信息的调研主要是为数据库建设而进行的数据准备工作,对工程索引、美国政府报告、中国科技名人、中国科研机构、中国企业、公司及产品数据库、北美商情等七个数据库进行的调研,并对每个数据库都提取了样记录。
4)利用政府机关、CIMS主题及国内相关机构、相关学术与商业活动进行信息采集
这类信息资源的确定,一是要反映国内的发展动态,二是要为数据库建设收集信息。对于这类信息资源,信息中心以信息交流与共享为前提,以信函、电话、面谈、参加博览会等方式,与国内数十家相关组织建立了信息交流伙伴的关系。
5 信息加工手段及其方法
对上述过程获得的信息资源中信息的采集、加工直到最后到网上发布应用,是一个非常耗时的艰苦过程,也是非常重要的一个过程。
5.1栏目信息的加工方法
网站栏目中的信息内容主要从国内外报刊、新闻媒体、网上信息资源、主题及相关机构、企业协作中采集。具体流程如下:
首先网站信息维护人员对信息源进行扫描或主动预约信息,将认为有价值的信息保存下来,提交给信息审核人员进行审核,审核通过后即可进行信息处理,如翻译、录入、校对、加工成HTML格式,提交给Web管理员,由管理员将信息上网发布。栏目信息加工方法流程如图5.1所视
5.2数据库信息的加工方法
数据库的信息内容主要从国内外科技期刊、专著、商业数据库、网上资源、主题及相关机构中获得。具体流程如下:
首先网站信息维护人员对信息源进行扫描、预约信息或检索,将与各数据库有关的信息保存下来,提交给信息审核人员进行审核,审核通过后即可进行信息处理,如标引、录入、转库、校对,将原始信息进入临时库。最后由数据库管理员将临时库中的数据转入正式数据库中。
数据库信息加工方法流程如图5.2所示。
图5.1 栏目信息加工方法流程图
图5.2 数据库信息加工方法流程图
5.3 建立完善的信息维护制度
信息的采集与加工,最终是要提交给各栏目发布并供服务对象最终应用,栏目的内容决定着信息的采集与加工,而信息采集加工工作的质量最终也影响着栏目的内容。
为保证栏目内容的质量,应建立栏目专人负责的制度,对于所确定的各个栏目,要有专人负责。专栏负责人有权对信息研究人员进行征稿,确定信息发布内容。栏目负责人的责任是:制定本栏目信息的采集与发布的标准流程、审核制度,并保证信息的质量与严格的更新周期。对于数据库的信息建设,同样也有相应的操作规范。各个库设有专门负责人,并明确确定各库收录范围、在此基础上,制定数据采集与入库的标准流程。
同时,为使信息的采集更好地服务于栏目,还应建立信息采集机制,根据要报道的信息技术领域范围以及所确定的权威文献源,定期对所确定的文献源进行扫描和访问,记录扫描结果并提交给栏目应用。
最后要建立信息审核制度。从各个信息源收集来的信息,其质量、准确性和及时性都是有差异的,并不都是可用的,这就需要建立信息审核制度来保证网站信息的质量,我们建议应由网站的管理人员和负责人牵头建立信息审核小组,审查和监督信息的质量。
6 信息资源的组织
信息资源的组织包括两个方面,一个是Web页面的信息组织,另一方面是数据库的信息组织。
6.1 Web页面的信息组织
6.1.1 目录结构与文件命名
路径清晰、含义明确的目录结构不仅能使设计过程变得严谨和有条理,同时也有利于今后的维护和扩充。有许多方法来组织Web的信息,归纳起来有以下几种:
单目录网站 所有的HTML文件和图象文件都防在一个目录下;
按功能组织目录 把一些相关的HTML文件放在相同的目录中;
按文件类型组织目录 按文件的类型而不是按内容建立目录;
混合组织 借鉴第二和第三种方法组织目录,这是目前组织大型网站目录的最好方法。
一般来讲,网站的目录册次不应超过4层,否则将会对网站的维护造成一定的困难。
一个好的文件名能够反映文件的内容,便于设计者和今后的维护人员查找需要的文档,提高工作效率。所以在命名文件名时一定要考虑这个问题。
6.1.2 设计Web页面应注意的问题
在设计Web页面时应在页面的醒目处设有清晰的路标或位置信息或导航条;
在页面中要注意Metadata标记的使用。该标记可以对整个页面的标题、主题、内容等进行描述,其意义在于搜索引擎对页面的自动标引和检索;
尽量避免页面过长,如果页面过长,则应在页面内部设置锚链接方式,避免用户滚动整个网页;
应在网站中设置站内导航,使用户能迅速从网站中找到所需信息。
6.2 数据库信息的组织
数据库信息通过对信息源的加工、标引而来,重点在于对数据库信息的分类和标引。对数据库信息我们参照《国防科技叙词表》、863/CIMS技术体系和SME分类体系进行标引工作,即抽象出信息主题的各个特征,归入数据库,并提供检索功能。
7 结束语
目前国内的制造技术信息服务站点还处于起步阶段,提供的服务主要是数据库检索、业内网站导航、技术文献提供、技术动态新闻等。随着电子商务的兴起,对制造技术信息服务网站提出了更高的要求,如开设网上资料订购、网上会议、网上课程培训及网上社区等功能,更好地为制造领域内的广大用户服务。
参考文献
何俊梅. 因特网上高校院系Web站点的设计.情报理论与实践,2000,23(2).
彭晓蓉,孔桃.专业信息服务网站的开发研究.情报理论与实践,2000,23(1).
漆宏. 探索21世纪信息服务体系.情报理论与实践,1999,22(3).
4.洪伟. 科技期刊网页的设计和制作. 情报理论与实践,1999,22(2).