合肥工业大学 王首安编译
文档管理软件实质上是一系列服务程序。它们能帮助用户跟踪、索引存储的电子文档 ,能极大减少用户检索信息、制作报告等材料的时间。但是这些来自图像图表公司、出版系
统及数据库供应商的文档管理软件良莠不齐,信息服务部门要做好充分的思想准备,花大力 气来组建一套适合自己需要的完整的文档管理系统。
文档管理软件的组成概述
无论你如何看待和理解,文档管理都是一项艰巨的工作。医药研究公司要起草大量的文 档来满足政府的管理要求;司法部门要记录每一个案例的材料;广告部门则要不断起草新的
市场计划。所有这些工作都离不开文档管理。花费气力来管理和准备文档对于按期完成工 作计划、取悦客户都是至关重要的。
文档管理软件则正是为了帮助人们管理文档而开发出来的。简单地说,它们提供了一组 服务功能来帮助用户跟踪存储的电子文档。工业调查报告的数据指出,一般白领工作人员每
天要花一半的时间来处理文档。报告同时预测,电子文档管理系统将有助于减少人们花在起
草、查找文档工作上的时间,因而能降低成本、提高生产效率、加速产品推向市场的进度并 提高员工的专业技能。
但是,目前还几乎没有哪个产品能全面解决用户单位的文档管理问题。来自图像/图表 、出版系统和数据库供应商的产品都不十分理想,用户要想从中作出合适的选择是很困难的
。
文档管理系统大致上可分为三种类型:文件管理、库管理和组合文档管理。在每一种类 型中,都必须确定将要管理的文档对象范围。文档管理系统有支持桌面、小组及专业范围的
不同安装方式。小组版与企业版产品之间的根本区别在于其基本结构和控制方式的不同。
1994年idc的300个抽样调查结果表明,公司在安装文档管理系统时遇到的最大挑战就是
如何有机地集成各种各样的应用。其它的障碍包括如何引导用户使用系统,改变他们对书面材料的依赖,处理历史文档以及改变习惯上的商务处理方式。只有克服了这些困难才能算是 进入了文档管理系统。
在即插即用文档管理系统到来之前,许多用户都不得不主要依靠自己的摸索与锻炼来应 付文档管理过程中的问题,诸如材料获取、创立、存储、查找及维护等工作。
一、 文档创建
文档的创建已不仅仅局限于使用novell公司的wordperfect和microsoft的word。现在
还应包括诸如电子邮件、扫描图像、fax材料、电子表、图形以及计算机辅助绘图等。 字处理能胜任大多数日常工作的需要,但是对于诸如飞机设计、药品研制材料等数量巨
大、控制管理严格的对象,就需要有更结构化的技术。 来自interleaf公司、frame technology公司和xsoft公司的专用文档著作软件可以跟
踪处理来自多个作者和信息源的材料。其规则检查器保证了作者必须提供类似托管授权一 类的管理信息。
这种软件还将信息资源以对象形式存储在文档库中,这样信息就可以很方便地重用在后 续文档中,并且一旦更新了源信息,其它相连文档也便随之自动更新。 根据cell
therapeutics公司信息技术部副主任mike arnold说,分布在各地的cell制药
公司,在使用上述软件后,专家们能将更多的精力投入到肿瘤药物的研制,而花较少的时间来
编写说明书。arnold进一步说,就我们所研制开发的大多数药品而言,管理文件在其中都扮
演着重要角色。为了从食品及药品管理署获取一种药品的生产许可证,一般都要准备5万至 25万页材料。cell制药公司使用inteleaf的智能文档管理系统来集成各种各样的信息,包括照片、图形、文字,按评审周期来访问组合文档。原始试验统计数据及初期试验室数据要集 中进行存储及管理,并定期在各种药物文档中加以更新。
arnold说,如果文档管理非常关键,那么将各处数据资料集成到inteleaf的系统中去,并不像想像的那么容易。但是如果使用通用标注语言sgml(standard
generalized markup language),事情就会简单些,尽管sgml是一种在十年前就出现了的在复杂文档中对资料加注
标签的标准,但是它至今仍然深受政府和工业部门的欣赏。此外,sgml的子集——超文本标
注语言html(hypertext markup language)的出现更增加了sgml的流行程度。在著作文档中
使用sgml可以使它们方便地得到应用,并且易于与其它所有文档建立关联。
因而,许多文档著作软件供应商都在其产品中加入了将sgml转换为自身格式的能力,以 使老的标准更易于使用。例如:microsoft已开始销售sgml author
for word;novell应用公 司开始出售针对wordperfect的dos版及uinx版的sgml转换器intellitag。当然,评论家们会
认为在这些低端软件包中普遍缺乏类似专业化产品中那样的规则检查等特性。
二、 文档存储
在一间律师事务所任信息部门负责人的jeffreg brandt说,创建文档相对来说还算是容
易的,而存储、跟踪、访问控制及导航才是文档管理的核心。我们的最终文档通常是纸张形
式,如果没有一种有效的方式来管理和访问这些文档,那跟把它们放入废纸篓没有什么两样 。为此,我们公司使用了pc
docs公司的产品来支持分别位于俄亥俄、华盛顿、佛罗里达分
部的300多个专家进行分析、保存、查找、获取字处理文档及扫描图像。
其它许多机构也和它们一样,在公司内部的特别群组中使用了pc
docs、saros公司的mezzanine和novell公司的softsolution等产品来管理文档。
一般来说,那些依赖于结构化的、生产线一级资料的公司,更倾向于来自documentum公司、filenet公司和viewstar公司的高档产品以处理类似飞机手册、保险索赔等资料。
可是专家们现在已承认,随着办公系统逐渐推出更傻瓜型的服务平台,这些产品之间的 界限正在渐渐消失,产品更加开放和易于使用。
另一方面,用户们正在寻找一种文档服务功能的核心集合。其一般能力就是要能让用户 通过网络搜寻文档资料或概览信息,并且当某用户调用一份文档时,系统要能跟踪它。其它
方面就各不相同了,例如生产制造系统的用户可能希望有内置的图像支持功能,而办公人员
却可能会使用来自watermark软件公司或imagery软件公司的附加图像处理软件。此外,有些人希望文档管理中有内置的导航及流程图管理能力,而其他人则可能希望通过电子邮件或action技术公司的第三方流程图软件供应商的产品来支持它。
* 安全
系统管理借助安全功能可以设置合法权限来管理用户与系统。系统分析人员john hutchinson说,美国加州的州秘书长认为saros
mezzanine的安全特征非常有价值。立法人员可通过mezzanine来共享、分析和追加立法内容。其安全机制可以只允许一小组人员来使用,也可允许更大范围的人来使用。
* 总体设计
有些机构将文档管理看成一个总的计算结构的一部分。大多数系统使用oracle或sybase和sql来存储索引、跟踪内容及安全信息。当前用户最感兴趣的就是将数据库信息与文档
管理结合在一起,以构造一个综合的办公系统。
三、 文档获取
* 获取
公司一旦编写出了一个文档,可能就会希望能让尽可能多的人看到它。原来都是将文档
印刷出来,然后向外分发。但是现在fax、广播、电子分发已逐渐普及了,同时文档获取及管
理也已逐渐成为现实。例如有些机构打算引入"阅读器"来节省纸张成本。这些"阅读器"有 adobe系统公司的acrobat,electronic book
technologies公司的dyntext和interleaf公司 的worldview。借助它们阅读者可以观看材料,并在必要时打印出来。此外,使用阅读器不需
要调入原文档的庞大编辑软件,因而可以降低使用设备的成本,并提高阅读速度。
一家机构可以使用多种程序来生成销售及市场信息报告,然后转换成adobe的可移植文
档格式,再存入存储媒介中。在外地现场的职员可以通过acrobat来查找和获取所需要的文
档。采用这种方式相对纸质信息的发布而言可以减少包装、存储、邮递等的费用。这方面
的另一个例子是,美国威斯康星州的立法部门使用acrobat来起草、分析、出版立法材料。
起草人利用interleaf来构思立法内容,并进行管理、导向和访问控制,然后利用acrobat来
观看。为了对外出版,州立法部门将需要的文档内容以acrobat的格式取出,然后送到xereodocutech打印机上印出。表一 高档文档创建(桌面出版)软件包
* 集成的关键
尽管文档管理系统可能极为开放和灵活,但将它们的所有方面都集成在一起却并不容易 。而只有能集成在一起的软件包才是最理想的。因而希望供应商们能够通过努力,开发出一
套共同遵守的应用编程接口(api)来让用户构建一套完整的文档管理系统。 值得庆幸的是,供应商们确实正在着手解决这种互操作性问题。例如,shamrock集团的
用于连接不同文档管理系统的api,xerox公司/novell公司联合开发的具有连接netware和文
档管理服务的文档连网框架。在台式机上,微软公司的ole实现了windows环境下的组合文档
部件的连接件的连接,部件集成试验室的开放文档管理api正试图提供跨平台的文档部件连 接功能。如何评价文档管理——众多厂家搏击,标准混乱
将一页纸放入文件夹就等于文档管理吗?错了!文档的内涵与外延都在不断变化,从书面 材料到动态电子资源,以及最近集中考虑的基于文档的商务二次工程都在迫使各用户单位重
新审视自己的文档管理需求。曾经一度是如此简单的直观的事,如今却变得如此复杂和混乱 。
事实上,文档管理对不同的人具有不同的含义。至于马尼拉纸文件卷宗是否算得上文档管理,说实话,只有从最广的含义上才能算得上。而当我们谈到在线文档系统时,就需要更狭
窄些的定义,它就不能算了。在流程图、文字获取、图像处理等技术中出现的冗余功能进一 步导致了概念上的混乱,当它们被集成进各种文档管理系统中时更是如此。
但是这些技术本身并不应属于文档管理。部分分析家、厂家和用户未能在市场上将它 们区分开来,因而更加剧了这种混乱。这就是为什么对文档管理业的市场年收入预测可以从
几百万美元直到几千万美元。因此,如果你要在这一市场调查上保持正确,就必须先对其技 术范围加以限定。
一、 究竟什么是文档管理
文档管理系统至少应提供存储功能、方便查找定位与获取的功能以及一定程序的对基 于文档的信息在其寿命期间的控制能力。即使根据这一有限的定义,其中仍然存在引起混乱
的可能。因为根据这一定义,文档管理的方法可以不只一种。作为信息系统专家,与其在定
义上费神,还不如更多地投入到确定必要的控制级别、合适的获取方法以及所要跟踪的文档
类型上。这些变化因素的确定可基本上将你所需要的文档管理系统的框架确定下来。
文档管理系统的框架大体上可分成三类:文件管理、库管理、组合文档管理。它们又可
进一步分成桌面、小组和企业这些细类。面向小组的产品,一般都是面向最终用户的。它们通常采用简易包装发行,尽管可以在单个网络环境里管理任意数量的文档,但一般不提供commit(数据修改提交)与rollback(恢复改动前数据)功能,以及整个文档恢复功能。面向企业
的产品是针对信息管理部门用户的,典型地是提供一组工具来在任意数量的局域网lan及广域网wan上解决文档管理问题。除了基本的产品分类以外,评价时还应关心产品的一些细微
特征,其中包括在哪些平台上可用,支持哪些文件类型,集成了哪些数据库,对文档管理标准
的支持程度,集成进来的文本获取,集成的流程图,对特定工程应用的支持以及api工具集等
。
在投资一个文档管理系统之前先要做到心中有数。首先,应尽可能选择以企业组合文档 管理为方向的供应商,其次考虑选择那些实现并支持目前最有影响力的标准的供应商。一定
不要将文件管理系统当作文档管理系统来使用。文件系统并不提供真正的文档管理功能。 密切注意microsoft的动向,她已计划在cairo操作系统中加入这一级功能。
随着那些面向对象的文档软件环境的出现,文档管理软件供应商将有责任进一步开发其 产品,提供新的功能与优势。例如可通过提供智能连接、电子签字、电子水印或鉴别及其它
类似功能来提高自己的竞争地位,以区别于其它供应商的常规产品。
最后,要记住这样一个事实,即文档管理很快就要重组,已成为几乎所有文档密集型应用 的必要组成部分。文档管理与流程图、文本获取、图像存取等基于文档的技术的集成是不
可避免的。
二、 文件管理器
位于文档控制及获取功能低端的即为文件管理器。这些产品通常都与流行的文档的映
像这一唯一的文件类型打交道。文件管理提供了两种方式来组织文档,轮廓(profile)与文
体(cabinet)。轮廓就是一种准数据库,允许为每一个文档登记有限的索引参数(如作者名、
日期、标题)。文体则就像抽屉及文件夹中所装的内容一样,对应着传统文件的内容。只是
现在每个文件体都有一个隐指其含义的图标(icon)与其对应。 获取功能则是基于其产品的存储/索引方法。但有时也有例外,比如caere公司的pagekeeper、mindworks公司的the knowdge builder,它们均提供了全文检索方法来获取信息。
尽管它们有这种高级获取能力,但仍然属于文件管理器。原因是缺乏必要的安全和寿命期管
理功能。由于文件管理的基础是文档图像,它们倾向于将所有文件当作图像来管理。因而一
般并不提供修改控制、调入调出和读写保护。这一类产品的例子还有keyfile公司的小组级
keyfile,ibm的visualinformation和王安实验室的企业级open/image。
三、 库管理器
库管理器提供了较高的文档控制功能,不再局限于一种文件格式。这类产品目前的趋势 就是在其本身的应用中支持几乎所有的文件格式,如图像、字处理系统、桌面印刷出版系统
、电子表格、计算机辅助设计文件等。获取的方式一般有两种:一种为索引方法,用户可通
过一个全功能的数据库(很可能是oracle、sybase等第三方数据库)定义和使用索引;另一种
为全集成的全文检索机制。这些产品具有完整的安全机理、获取跟踪与控制、文档的调入 调出和使用的审计与记录等。库管理器主要供多个用户同时使用,当然也支持单用户方式的
安装,以适应桌面应用的需要。
在小组这一级的主流库产品有:novell公司的softsolutions,salix系统公司的docstoe,saros公司的mezzanine。企业一级的产品有:xsoft公司的virtual
document library,ibm的virtual document library,novasoft系统公司的novamanage,pc
docs公司的pcdocsen,sonoran技术公司的tapestry和mobius管理系统公司的document direct。
四、 组合文档 管理器
组合文档管理器在功能上有很大不同,尽管它提供了类似库管理器的功能,但对文档的 定义作了重大改变,并相应提供了许多新功能。根据当前文档结构和著作工具领域的发展趋
势,组合文档管理器将文档看成一个虚拟的、动态的资源。
根据这种观点,文档不是单一来源的信息媒体,而是来自不同源、不同种类的一组信息 的集合。例如,一个文档中可能嵌入多条文字信息,链入一个电子表格,及插入一个描述的图
像。组合文档管理器跟踪和控制组合中的每一个成分,提供了比库管理器更多的灵活性的控
制级别。每一个成分的修改权都得到控制、审核和保护。这样,基于共同成分的文档之间的
关系可以得到跟踪。此外分布的处理/跟踪不仅在文档索引中得到实施,还在文档的各成分 上加以实施。
对这一领域供应商的最大挑战就是要在整个企业范围内提供这类控制,并保持对这些关 系的跟踪,以便当某一文档中一个部分被改变后,在其它共享这一部分的文档中反映(对链接
)或不反映(对嵌入)这一变化。此外,这类产品还应在组成一级提供rollback、恢复功能以 及审核跟踪记录能力,以维护文档的完整性。
文档管理中这一研究方向将最终导致对智能文档的支持。在诸如interleaf公司和uniplex集成系统公司的产品中,都提供了对文档之间各部分关系的跟踪能力。因而一个部件被
修改,将自动导致另一部分的改变;或至少会向作者发出警告,告之某部件已被访问,或已可 能过时等。
在企业范围内,全功能的智能跟踪能力在目前的产品中显然尚未完全达到,还有待明天 的努力。但是在桌面或小组环境内microsoft的windows 3.1及ole
2.0规范显然已为此作出 了卓越的努力。documentum管理软件分析——文档的使用随复杂性增加而减慢 完整的文档管理,加上面向对象和流程图能力,就是documentum公司的documentum所做
的承诺。它在client/server的高端工具集中提供了傻瓜性最好的9001cc金沙的解决方案。使用具有很多
重要特征的documentum产品有许多明显的优点,但同时也有很多缺点。它需要一个尺度可伸
缩的硬件基础,同时学习过程也令人难以接受。因为仅仅让用户理解这些技术和自动化文档
管理的处理过程本身就已很艰巨了,因而将其所有的特点一股脑地全部教授给学生非但无益 反而有害。位于坎布里奇的genetics研究所的应用部门主管bob
o'leary就说道:"让我们的 用户理解合文档和流程图概念对我们来说觉得非常困难,障碍重重。就我们自己而言,我
们所要的功能documentum都有,工作起来倒没有什么太难的事,而一旦有一天要突然离开计算机去教别人如何使用它,那可是一场艰巨的考验。"
为了评价它,我们访问调查了一家公用事业公司、一家生物制药公司、一家航空企业和 一家工厂。
一、 文档开发
由于文档一般是从documentum中调用外部程序来创建,或单独创建后再合并进来,因而documentum与外部程序的集成能力就变得很关键。航空企业的人士说:"当我们使用microsoft公司的应用程序创立文档,或调入其创立的文档时一切顺利。"而另外两家使用novell公
司的wordperfect时遇到了麻烦。生物制药公司的人士说:"当我们从documentum中启动wordperfect来创立一个新的空白文档时会出问题,但读入wordperfect的文档却不会有问题。
只是创建工作不好。"公用事业公司的人士说:"我们无法使用wordperfect的动态数据交换功能dde(dynamic data exchange)。"
二、 流程图能力
尽管documentum具有流程图管理能力,但它并不直观,并且也无法与其它专业流程图管 理软件相匹敌。
被访问者说道,流程图管理能力为documentum增加了巨大的潜力,但是其表格驱动接口
却使设置非常困难,并且终端用户感到不直观。航空企业公司的人士说:"documentum的流程
图能力在现阶段还不是非常实用,如果你愿意编写程序,那你可以将它与其它工程管理软件结合起来使用。而我们则转向了microsoft的project,它提供了我们所需要的拖放接口。"生物制药公司的人士则说:"我们的用户还没有想到要用流程图,这种情况是要逐渐改变的。
"
三、 组合文档
documentum相对其它竞争对手的一个关键优势,就是通过其virtual文档管理器来承诺 其对组合文档的支持。
用户非常喜欢2.0版中新的类似文件管理方式的接口,该接口提供了查找、导向以及在 文档不同部分之间建立关系的能力。但跟流程图功能一样,用户觉得还是有一点问题。航空
公司的人士说:"在api这一层建立关系非常容易,2.0版由于提供了新接口,因而处理组合文
档的效率大为改善。但组合文档的概念理解起来还有点困难,还有待我们的人员去慢慢消化、理解。"
四、 库管理能力
流程图功能和virtual文档仅仅是表面能看见的现象,而documentum的库管理机制才是
它真正的精华所在。它的基本功能,如调入/调出、审核记录和查找,都处理得比较精巧;此
外一些不太平常又非常新颖的功能的推出,进一步引起了用户极大的兴趣。航空公司的人士
说:documentum在其它竞争公司尚未想到某些问题时已漂亮地把它做出来了。比如其关系对象的引入,将对象之间的连接关系也作为对象本身看待,因而开辟了许多有趣的可能性。"
五、 可用性
由于2.0版在界面上作出了重大改变,因而被访问者说,只要你熟悉它就会觉得非常好用
。尽管让用户掌握流程图处理过程和文档概念有点困难,并需要大量时间,但并没有人因为 这种原因或学习曲线的原因而没能学会documentum。制药公司的人士说:"1.0版在屏幕上要
打开许多窗口,并且其数量增长很快,用户总是感到有点束手无策。而2.0版,带上文件体和 文件夹概念,使这种情况有了显著的改变。"表二 documentum测试结果
注:数据来自对四家用户调查分数的平均。每项得分取自1至10分,其中10表示最好,1表示最不满意。
厂商对问题的答复:
1. 根版本问题(root version):一个文档的根版本是不能删除的。用户可以将当前版 本定义为根版本,然后删除一些老版本来腾出空间。但是documentum一般要求为每一个文档
保留两个版本。
2. wordperfect的问题:wordperfect不能启动的绝大多数原因可能是内存不足,它要求
至少8mb的ram。另外一种原因可能就是path路径设置错误。
3. 流程图使用的方便性:documentum公司打算在其后续版本中通过提供一个图形处理 映射工具来解决流程图方面的使用性。三种普及型文档管理软件评测——pc
docs:掌握容 易,规模可伸缩
目前市场上尚无十全十美的文档管理产品,不论供应商们如何吹嘘自己的产品,它们都 还只是部分解决了这一问题。事实上,应该将文档管理看成一个过程。其中每一种工具软件
都十分复杂,并且各个厂家的产品也差异较大,因而不可能有一种简单的9001cc金沙的解决方案。在选择
一种产品之前,用户必须首先确定自身应用的组成成份,哪些是基础的、必要的成份;哪些是 留待以后扩展的。
用户还必须理解文档是如何在计算机中生成、存储、应用的;以及当要进行一次精确查 找时,软件是如何工作的。我们在这里分析比较了三家应用最广泛的主流文档管理软件:pc
docs公司的pc docsopen,saros公司的saros文档管理器,以及interleaf公司的intellecte。
* pc docs open
据国际数据公司的scott mccready所说,它是特别容易安装与使用的产品,尤其适合于
一些小型工作组,当然也可用于其它场合。有好几家被访问的公司都在全球范围的网络上使 用了pc docs open。stites &
harbison公司的一位计算机技术人员pat tripure说:"我们 公司的本部在路易斯,有250个使用计算机的工作人员,另外还有两个分部在海外。每一个地
方都使用pc docs open,建有自己的库,工作时又可相互访问别的地方的库。但即使如此仍
不能说我们已充分发挥了它的作用。"当前的2.0版已移植到了windows平台,使产品更易于
使用。其中文档的简介部分全部可由用户自己确定,比如指定特定的名称,以及安排到屏幕
的特定位置上。尽管它的文档查找及索引功能得分很高,但索引有时还会导致备份出问题。 只要索引处于打开状态,备份工作便无法进行。
* saros文档管理器
它主要瞄准的是大型企业用户。它可以被安装到数量不限的服务器上,并且当一台服务 器正处于忙或过载状态时,文档管理器会将工作负荷划分出一部分交给另一台服务器。
位于旧金山的wells fargo银行的系统管理部部长jimmy chen说:"我们有1,000多个用
户在同时使用计算机,并且相当多的工作都是并行进行的。如果说有这种自动负荷转移功能,那么我们的系统随时都会阻塞。"
saros的基于sql的文档服务软件mezzanine可以装载到os/2、unix或microsoft的windows
nt之上,是目前最突出的产品。它采用了唯一可供选择的sql服务标准、文档管理专用机制和单一的系统管理器来取代那些分散的、常常不兼容的任务或应用驱动的系统。以mezzanine作为文档管理的基础,文档获取及查找能力难怪会得到高分,并获得好评。
* interleaf的intellecte它是面向client/server结构的高端集成软件包。
提供了流程图、浏览、发布等文档管
理所必需的功能。位于加利福尼亚的gartner集团研究事业部部长jim bair认为,它采用关
系文档管理机制,并用自己的格式存储文档,适用于研究开发等科学技术圈文档密集型用户使用。intellecte的核心就是它的寿命期管理方法学,并以此为中心构造了文档查找、获取 、安全机制等关键功能。
interleaf和用户项目小组在近期内还将构建一个展示基础环境,设计一种区别于windows的选择与点取图形用户界面。一旦完成以后,用户单位即可得到一个按自己需要裁剪的
文档管理系统来进行文档查询、获取,同时也得到一批经过充分受训的职员。表三 三家产品的测评结果。