2011年8月16日星期二

浅谈文档格式的选择

浅谈文档格式的选择

 

 

浅谈文档格式的选择

 

这篇文章我决定尝试改变一下文风,在开头只阐述几个立论要点和结论,有一些这方面知识的人可以一望而知我的推理过程。大段篇幅的解释留给没有这方面知识的人。

 

省略语:下文将使用OOOOpenOffice代指OpenOffice.org;使用MS代指Microsoft;使用MS Office代指Microsoft OfficeWPS专指金山公司的WPS软件

 

对于电子文档,在它的生命周期内无非要承担这样一些任务:

撰写

编写

修改

审阅

读取

发布

打印

分享

 

相应地有几个基本要求:

1,保存文本资料(这点TXT可以满足)

2,保存丰富的格式与图片(这点RTF PDF可以满足)

3,有强大好用的编辑器(这点doc docx odt wps tex可以满足)

4,文档内容不会被"套牢"而无法打开。(难以过时,即使过时也可以方便地将文档转成流行格式,避免文档在若干年后无法打开。)

5,难以失真,可以携带到各种地方查看、编辑、打印却不走样。

 

五点全部具备的格式是没有的,所以我们只能对于不同要求选择不同格式。

 

因此,关于撰写:

编写

推荐使用docxodttex撰写功能丰富的文档。避免使用doc

推荐使用RTF撰写一般要求的文档。

推荐使用TXT撰写只需要文本而不需要格式的一切文档。

 

如果需要审阅者直接在原文档修改,则应协调撰写人与审阅者所使用的软件及格式。对于MS Word来说此时应尤其注意格式选项和字体问题。

doc格式惟一的用途是用来发给不能"编辑"docx的人。没有其它交换格式可用时也可以用作交换格式。

对于简单文档,RTF格式是一个不错的交换格式(尤其是在OOOMS平台之间交换),但欠缺显示修订之类的丰富功能。

 

 

关于发布

PDFXPS格式如应用得当,将是纸质文档的完美替代品。

对于以下几种场合,PDF是当之无愧的第一选择。

交付打印时

仅需让对方查看格式精美的文档却没有必要让对方修改时

不希望对方能轻易改动源文档时

其它需要使分发的电子文档取代纸质文档的场合

 

简单概括一下各文件格式的最重要作用吧:

PDF:打印文档的替代物(可靠,不失真,难编辑,长久可用)

DOC:仅为兼容旧软件而存在。(不可靠,易失真,易编辑,不长久可用)

DOCXMS平台下文档推荐格式(可靠,易失真,易编辑,长久可用)

TEXTEX控的专属

RTF:很好的交换格式

 

 

总结:对于绝大多数使用MS Office的人,简单地说,就是用docx写文档,用PDF分发和打印。除非有人非要你用doc格式,否则不用doc。推荐对于任何花费大量心血的文档,保存为docxPDF两份。doc视情况需要。

 

 

这里着重阐述一下前述文档基本要求的第四点和第五点。因为它们往往被忽视而带来大量实际困扰。

第四点意在避免这样一种情况:你创建的大量旧格式的文档在若干年后无法找到合适的软件来打开它们或者转换它们,于是它们就报废了。

这个问题并非杞人忧天。像十几年前的Windows Writewri格式,现下就没什么软件支持。好在它是一种非常简单的格式,WordWordPad虽然取消了文件关联,但还是可以打开它。更好的是wri可以用纯文本编辑器查看,其格式置标也不难理解。即使有一天Word也不再支持wri格式,总归还是有可能开发一个软件完整恢复出其内容的。而DOS年代创建的WPS文档所面临的情况就要糟得多――虽然也不是全然没有办法。

一旦有一天,你当初所习用的那个文字处理软件不再有人使用,或者它的新版不再支持旧格式,你手中的巨量旧文档就会面临困境。数据是无价的,你将如何挽救它们呢?

文档格式恐怕并不存在永久可用的格式,IT市场风云变幻。我们只能在可以选择的范围内尽量做出明智的选择。

这就要求:

格式标准应该是公开的;

它应该被尽可能多的编辑器支持;

很简单,一个开放的,标准公开的格式,即使有一天不再为软件商所支持,也很容易编写程序转换已有文档。反之就非常困难。

时下流行的格式中,其文档规范已经公开的有:docxodttexRTFPDFWPS格式我不太清楚。其中docxodt已经成为国际标准,可望有较长的生命力。

特别说明:doc格式是一个私有格式且除了微软没人知道它是怎么回事。目前其它软件编辑doc格式都是靠猜,不能保证支持它的全部功能。

其中,DOCX虽然目前使用率可能不如DOC,但是以MS Office的影响力,今后一定是主流。ODT已经成为国际标准,相信会得到开源社区的长久支持和维护,且得到了几乎所有主流文字处理软件的支持。TEX并不易用,但不会消亡,TEX的高度稳定性正是其生命力之一。RTF虽然功能稍弱但完全可以满足一般需要且广为支持。PDF最大的缺点,也可以算是部分优点,就是难以编辑。

最后,纯文本TXT是千秋万代永不过时的格式。

 

对于第五点――格式走样,恐怕很多人都被Word折腾过而心领神会。无数次doc文档带到别的电脑或者打印店就面目全非而让人大为光火。原因有两条:

控制Word格式显示的选项非常多,很难在一台新电脑上保证所有的选项都一致。

另外一个问题就是字体。有些人使用的字体在另一台电脑上可能会没有。

甚至于打印机的选择都会影响到文档显示效果

很遗憾,目前能保证在所有电脑上显示效果都一样的常用格式只有PDFXPS。只要注意使用官方查看器,嵌入字体,这两种格式无可挑剔。

前文为什么推荐重要文档存一份PDF副本呢?因为即使是创作者自己日后也未必有当初所用的字体,查看源docx还是会不免走样。(如果特别要求长久保存,PDF/A更为合适)

作为第五点的附属,在这里简单讨论一下格式的兼容问题。也就是说,一个用OpenOffice的人如何和一个用MS Office的人协作。

docx目前虽然号称公开,但只有MS Word可以完美支持。OpenOfficeWPS打开会走样。

odtMS Office打开同样会存在轻微走样。

如果不要求编辑,PDF是完美的交换格式。

如果不要求高级功能,RTF也是相当理想的交换格式。

doc格式目前已经被WPSOOO研究得很透彻,所以如果不使用高级功能,WPSOOO对它的支持都是不错的,可以用作交换格式。

至于用TEX的同学,木有办法和其它平台协作。

 

 

如何使用记事本(notepad)记日记

如何使用记事本(notepad)记日记

 

 

――两条记事本的使用小技巧

记日记可以用很多软件来做。比如说,你当然可以用Word来记日记,然后插入日期和时间。目前而言我更喜欢用OneNote,不仅因为它可以自动加入时间戳,更看重的则是它方便的管理和加密。

但其实用记事本来记日记也可以做得很好呢。

在记事本中插入当前的时间和日期只需要很简单的一个键:F5

相较之下,在WordAlt Shift D插入日期域,Alt Shift T插入时间域,不仅按键麻烦,而且当你全选并按F9更新域之后,所有的时间日期都会被更新为当前时间日期,那可就糟大发了。而插入不会被更新的文本时间日期,则只能点击插入-文本-日期和时间,没有快捷键可用(当然对于Word2010你可以自定义快捷键)

更棒的是,记事本有一个连帮助中都没有写明的功能:自动插入时间日期。

新建一个TXT文档,第一行写上".LOG"(不带引号,大写),每次打开时,记事本就会向最后一行自动添加时间日期。

这样的话,记日记就很方便了,不再需要自己敲日期。

 

PS:其实记事本虽然是个很烂的纯文本编辑器,但是依然有不少功能很少有人注意到。比如说,显示行号列号、打印时自动插入页眉页脚……

 

2011年8月3日星期三

汉王D21 评测

汉王D21 评测

 

 

汉王D21A到手已经近一周,各种功能大致都试过。

随便吐点槽:

第一代eink屏确实比较灰,没有kindle3的珍珠屏白。不过8阶灰度看书是完全足够,甚至看一些图片(比如人像)也是够的。

WinCE系统的痕迹很明显哇,和Windows Mobile何其相似的右上角托盘区。

输入法图标和Windows Mobile完全一样有木有!

UI做得比较一般,和两年前试用N510时相比没有太大长进。一些设置有着浓浓的半成品味――如果出自爱好者自己捣鼓的系统那倒一点也不奇怪――但作为正式产品实在有失大家风范。说明书中相应的段落也像开发人员自己写的。对于Geek们这些可能无碍,但我很怀疑普通人会觉得它寨。(比如说,设置开机屏幕之类的必须以指定文件名放在指定位置再做设置;图片不放在图片目录下竟然不能看)

 

下面说正经的。

 

 

首先,它硬件上的最大亮点(区别于Kindle)无疑是它的手写笔。关于这点值得专门讨论。

先简单介绍一下它的手写技术:

汉王的手写使用电磁感应式手写板,无线无源。耗电量还是比较低的(不过我看TXT的时候一般还是会关掉手写)。

电磁式是目前电纸书唯一可采用的触控方式。

传统应用于手机上的电阻屏和电容屏,因为需要在屏幕表面加一层基板(尤其是电容屏要加一层玻璃基板),会严重影响e-ink的显示效果。也就是说,必须牺牲e-ink类纸的感觉才能"用指头直接划",这是为什么Kindle没有触控的原因。

其手写识别的准确率还是不错的,用过Windows Mobile的人应该比较熟悉了,因为Windows Mobile的手写识别技术就是汉王提供的。

在以下几个操作上,手写笔带来了极大的便利:

它可以直接在文件上手写笔记(菜单中称作"批注"),甚至支持合并批注到PDF文件(不论是文本PDF还是扫描PDF)中。这点很好,有的时候看paper圈上个重点还是很方便的。但像我一样读纸书时极其不愿意沾污原书的人,就没有在书上做笔记的习惯了。其实在空白处书写笔记并不如想象的方便。因为并不总能找到空白,而字迹又做不到像在纸上写字时一样小。

支持屏幕取词即时翻译。如果没有手写笔,仅用方向键定位需要翻译的词语无疑是件相当麻烦的事情。

可以方便地选取一段文本摘录下来(菜单中称作"摘抄")。

最后,一个脱胎WinCE的标准UI的东东,总会有些界面让你发现没有手写笔就很难操作……这大概不能算是明显的优点,因为只要改进UI,没有手写笔也一样可以操作,但直接点击按钮总归比打开菜单选东西来得方便直观。

不同于手机或者电脑上,由于拼音输入依赖屏幕显示的待选字列表,以e-ink的刷新率,在电纸书上用全拼打汉字是没有手写快的。当然五笔或者郑码使用者不受影响仍然可以保持和全键盘手机一样的打字速度,但目前电纸书支持五笔郑码的并不多。所以支持手写使得做点文本录入会方便一些。

阅读PDF文章的时候,常常需要放大阅读。这时候使用笔来拖动文档就很方便。

 

至于功能与硬件,分成几块来说。

纯文本阅读

汉王电纸书支持两种纯文本:TXTHTXT。后者是汉王的加密格式,用于它的与设备绑定的加密书籍。

纯文本支持手写批注,但是不同字体设置下的批注是独立的。这让我猜想,它的批注是以"页码+坐标"的方式存储。而更改字体和字号会使页码变化,故而失效。

书签、词典、摘抄、查找、朗读这些功能自不必说。

在它所支持的所有格式中,只有TXT是支持编辑的。其它都是只读(PDF可以嵌入批注,也算可以部分编辑吧)

HTML

基本和纯文本阅读的功能相同。会自动忽略超链接、版式、页面颜色等,基本只留纯文本。但是可以显示网页中的图片。也就是说,纯文本段落中夹着几张图片。如果网页中的图片只是正文中的插图,那么效果还是不错的。而网页边角的各种装饰图片显然会干扰显示。所以对于装饰图片较多的网页在导入之前先用Word之类的软件删掉比较好。

TXT一样,手写批注也必须在同一种字体设置下。

PDF

支持自动切白边,对于文本PDF自动切边效果良好,对于扫描PDF效果一般。

支持横屏查看,支持缩放。对于文本PDF支持重排版查看(菜单中称为"流式"视图),支持将PDF连续显示(就是说若无法显示完整的一页,此页结尾不接空白分页而接下页页首;菜单中称为"卷轴模式")但流式和卷轴下会少很多功能。重排版查看对于英文支持有待改进,字符间距不大协调,虽然没有字符重叠的问题,但是显然得不够匀称悦目。

即使PDF体积庞大(比如说扫描版PDF),也可以比较快地打开。

书签、词典、摘抄、查找、朗读这些功能自不必说,只是多只能在"版式"(即PDF原版式)视图下使用。

EPUB

支持epub,但分页速度缓慢(长篇读物会在打开之后相当长的一段时间内还在计算页数(约每秒钟数页),虽然不影响阅读,但是耗电;未显示出书的总页数之前,目录功能不可用),相信会随固件升级而改善。

heb格式,汉王的一种格式,等于缩略图加epub,且有加密,主要用于汉王书城发行的电子报刊。在读报的时候先看到的是整版报纸的缩略图,用笔点击报纸缩略图上的任意一篇文章,则可以打开对应的epub章节。这样既可以概览报纸的整体排版,又可以epub格式来查看正文。

值得一提的是,对于epubheb,翻页延迟当然受文件复杂程度影响而快慢不一,但页面刷新速度奇快。这两种格式正是早期版本固件所不支持的,可见是旧系统挂了新软件,而新软件有效改进了局刷的速度。所以可以期望TXT格式也随着固件更新而加快刷新速度。

无批注、词典功能支持。

DOC

支持,但功能少。仅仅是能用而已。长篇文档当然转成PDF看比较方便。短篇文档可以一用。

PPT

如果PPT比较复杂,就会非常卡。还是另存为PDF查看好了。在这上面看PPT也确实没多大意义,PPT毕竟是彩色的。

图片

基本上不能打开大于1M的图片。8阶灰度,看碑帖效果绝佳,漫画也可,人像照片差不多,风景照片就不行了。

字体

有三种字体可选:宋体、雅黑、魏碑。中英混排文字以选择的字体显示。而纯英文文本会自动忽略字体设置,以雅黑(或者应该说是Segoe UI?)显示,这点很明智。因为宋体和魏碑的英文部分实在不是一般的难看。

对于TXTHTML有完全的字体选择自由。缺少字体(比如doc会出这种情况)时,以宋体为默认字体。epub下只能选用宋体。

TTS朗读

总体来说相当悦耳,甚至比Windows自带TTS引擎好听一些。但这功能估计没几个人会用――为啥不用手机或电脑听书呢?共普通话、粤语、英语三种。据说有些汉王电纸书还有东北话供选择。

双语阅读

没用过,不评论。

词典

快译大典、朗文当代(双解)、新华词典、古汉语词典、大英百科(双解)五部比较好的词典,还有四部不出名的杂牌词典,什么"网络词汇"、"地理辞典"、"医学字典"、"科学教育",也不知道是什么来头。

支持阅读时取词翻译是最大的方便之处,至于词典质量,也就一般。和PC上使用的LDOCE DVD光盘的质量当然不可同日而语。

生词本

没用过不评论。

音乐播放

不常用不评论。

支持LRC。汉王把一些书做成LRC配以真人朗诵,称作"有声读物"。其中的诗词朗诵部分么,不是出自同一人,有些还不错,有些就不咋样。

内存:

机身内存不可见。估计只存储书签位置、最近阅读书目之类的数据。电子书全部存放在卡上,连上电脑之后作为可移动磁盘来管理。

按键

只有左边有Page UpPage Down这点实在是糟糕。

QWERTY键盘手感不佳,好在也不常用,不指着用它打字。音量键手感极其差,好在我根本不用。

耗电:

27日中午收到,当日电量低。后一直未充电,只是经常连到电脑上传东西。直到2日中午提示需要充电(电未耗竭,只是提示需要充电,按照Windows Mobile的传统,很可能是剩10%的时候报警),使用整6天,期间未关机。

说明书说充电约需4小时,1500mAh的电池理论上应该是3小时充满。这6天连接电脑的总时间肯定未超过3小时,且主要在27日中午。所以可以认为这6天的使用,耗电量少于完整充电一次的电量。

6天的使用中,使用外放和耳机各几分钟,使用手写笔数以小时计,总阅读页数不少于几千页。所以虽然有手写笔,但是正常使用下(就是说,不要看纯文本的东西还用手写笔来翻页),耗电与续航水平是正常的eink产品的水准。一般人也不会像我这两天用的这么多,估计一两周充一次电差不多吧。

 

附录:

两年前我在图书馆试用汉王N510的时候,提了七条意见。现今全部实现。可见汉王做产品还是比较用心的。

原意见如下:

, 应该增加触屏

, 应该可以做笔记

, 速度太慢, 对于速读的人不能忍

, 应该增加页面预览, 至少在目录处可以让人快速定位到所需章节, 否则翻页太慢, 找到所需章节太费时间.

, 应该支持DOC PPT

, 打开大PDF的时候容易死机.

, 增加文本搜索功能.