2011年8月16日星期二

浅谈文档格式的选择

浅谈文档格式的选择

 

 

浅谈文档格式的选择

 

这篇文章我决定尝试改变一下文风,在开头只阐述几个立论要点和结论,有一些这方面知识的人可以一望而知我的推理过程。大段篇幅的解释留给没有这方面知识的人。

 

省略语:下文将使用OOOOpenOffice代指OpenOffice.org;使用MS代指Microsoft;使用MS Office代指Microsoft OfficeWPS专指金山公司的WPS软件

 

对于电子文档,在它的生命周期内无非要承担这样一些任务:

撰写

编写

修改

审阅

读取

发布

打印

分享

 

相应地有几个基本要求:

1,保存文本资料(这点TXT可以满足)

2,保存丰富的格式与图片(这点RTF PDF可以满足)

3,有强大好用的编辑器(这点doc docx odt wps tex可以满足)

4,文档内容不会被"套牢"而无法打开。(难以过时,即使过时也可以方便地将文档转成流行格式,避免文档在若干年后无法打开。)

5,难以失真,可以携带到各种地方查看、编辑、打印却不走样。

 

五点全部具备的格式是没有的,所以我们只能对于不同要求选择不同格式。

 

因此,关于撰写:

编写

推荐使用docxodttex撰写功能丰富的文档。避免使用doc

推荐使用RTF撰写一般要求的文档。

推荐使用TXT撰写只需要文本而不需要格式的一切文档。

 

如果需要审阅者直接在原文档修改,则应协调撰写人与审阅者所使用的软件及格式。对于MS Word来说此时应尤其注意格式选项和字体问题。

doc格式惟一的用途是用来发给不能"编辑"docx的人。没有其它交换格式可用时也可以用作交换格式。

对于简单文档,RTF格式是一个不错的交换格式(尤其是在OOOMS平台之间交换),但欠缺显示修订之类的丰富功能。

 

 

关于发布

PDFXPS格式如应用得当,将是纸质文档的完美替代品。

对于以下几种场合,PDF是当之无愧的第一选择。

交付打印时

仅需让对方查看格式精美的文档却没有必要让对方修改时

不希望对方能轻易改动源文档时

其它需要使分发的电子文档取代纸质文档的场合

 

简单概括一下各文件格式的最重要作用吧:

PDF:打印文档的替代物(可靠,不失真,难编辑,长久可用)

DOC:仅为兼容旧软件而存在。(不可靠,易失真,易编辑,不长久可用)

DOCXMS平台下文档推荐格式(可靠,易失真,易编辑,长久可用)

TEXTEX控的专属

RTF:很好的交换格式

 

 

总结:对于绝大多数使用MS Office的人,简单地说,就是用docx写文档,用PDF分发和打印。除非有人非要你用doc格式,否则不用doc。推荐对于任何花费大量心血的文档,保存为docxPDF两份。doc视情况需要。

 

 

这里着重阐述一下前述文档基本要求的第四点和第五点。因为它们往往被忽视而带来大量实际困扰。

第四点意在避免这样一种情况:你创建的大量旧格式的文档在若干年后无法找到合适的软件来打开它们或者转换它们,于是它们就报废了。

这个问题并非杞人忧天。像十几年前的Windows Writewri格式,现下就没什么软件支持。好在它是一种非常简单的格式,WordWordPad虽然取消了文件关联,但还是可以打开它。更好的是wri可以用纯文本编辑器查看,其格式置标也不难理解。即使有一天Word也不再支持wri格式,总归还是有可能开发一个软件完整恢复出其内容的。而DOS年代创建的WPS文档所面临的情况就要糟得多――虽然也不是全然没有办法。

一旦有一天,你当初所习用的那个文字处理软件不再有人使用,或者它的新版不再支持旧格式,你手中的巨量旧文档就会面临困境。数据是无价的,你将如何挽救它们呢?

文档格式恐怕并不存在永久可用的格式,IT市场风云变幻。我们只能在可以选择的范围内尽量做出明智的选择。

这就要求:

格式标准应该是公开的;

它应该被尽可能多的编辑器支持;

很简单,一个开放的,标准公开的格式,即使有一天不再为软件商所支持,也很容易编写程序转换已有文档。反之就非常困难。

时下流行的格式中,其文档规范已经公开的有:docxodttexRTFPDFWPS格式我不太清楚。其中docxodt已经成为国际标准,可望有较长的生命力。

特别说明:doc格式是一个私有格式且除了微软没人知道它是怎么回事。目前其它软件编辑doc格式都是靠猜,不能保证支持它的全部功能。

其中,DOCX虽然目前使用率可能不如DOC,但是以MS Office的影响力,今后一定是主流。ODT已经成为国际标准,相信会得到开源社区的长久支持和维护,且得到了几乎所有主流文字处理软件的支持。TEX并不易用,但不会消亡,TEX的高度稳定性正是其生命力之一。RTF虽然功能稍弱但完全可以满足一般需要且广为支持。PDF最大的缺点,也可以算是部分优点,就是难以编辑。

最后,纯文本TXT是千秋万代永不过时的格式。

 

对于第五点――格式走样,恐怕很多人都被Word折腾过而心领神会。无数次doc文档带到别的电脑或者打印店就面目全非而让人大为光火。原因有两条:

控制Word格式显示的选项非常多,很难在一台新电脑上保证所有的选项都一致。

另外一个问题就是字体。有些人使用的字体在另一台电脑上可能会没有。

甚至于打印机的选择都会影响到文档显示效果

很遗憾,目前能保证在所有电脑上显示效果都一样的常用格式只有PDFXPS。只要注意使用官方查看器,嵌入字体,这两种格式无可挑剔。

前文为什么推荐重要文档存一份PDF副本呢?因为即使是创作者自己日后也未必有当初所用的字体,查看源docx还是会不免走样。(如果特别要求长久保存,PDF/A更为合适)

作为第五点的附属,在这里简单讨论一下格式的兼容问题。也就是说,一个用OpenOffice的人如何和一个用MS Office的人协作。

docx目前虽然号称公开,但只有MS Word可以完美支持。OpenOfficeWPS打开会走样。

odtMS Office打开同样会存在轻微走样。

如果不要求编辑,PDF是完美的交换格式。

如果不要求高级功能,RTF也是相当理想的交换格式。

doc格式目前已经被WPSOOO研究得很透彻,所以如果不使用高级功能,WPSOOO对它的支持都是不错的,可以用作交换格式。

至于用TEX的同学,木有办法和其它平台协作。

 

 

没有评论:

发表评论