自我去年从湖南乡下搬到台北来住以来,有三位中国大陆的朋友委托我在台湾找书,有位律师朋友委托我找《歷代名臣奏議》,王士奇委托我找《中國近百年政治史》,刘淼委托我找《非法流浪》,这些书有些是大陆禁书,有些是早年发行的现在很难找到,《歷代名臣奏議》和《中國近百年政治史》我都去诚品书店等书店找过,店员留下我电话帮我订货都最后被告知没货。而《非法流浪》我还没去书店问,不知道会不会有。找书是件不容易的事,有钱都不容易找得到,找到后又要花运费寄到大陆,甚至要冒着被中国的海关审查邮寄物品的风险,某些书籍会被中国海关没收掉。
我以前听刘淼提到过 http://www.1dollarscan.com ,这家公司的服务是提供书箱扫描服务,你买的书,寄到他们公司,他们公司会还给你电子版本,原来的纸质书会被消毁掉。这个网站表面上是1美元扫描,但事实上服务价格可不是一美元扫描一本书哦,如果一本书有300页,就要收3美元,如果是商业文档,1美元/10张,名片也是1美元/10张。
遗憾的是,这家公司是在美国,对我来说一来寄送不太方便,二来他们可能不支持中文书籍的扫描啊。
去年才来台北的时候,有次聚会时聊到传统出版业与数字出版的现状,张育章 (twitter)有介绍到他的数字化阅读的解决方案:买来的书切掉边,用扫描仪把书籍扫描,有一种扫描仪可以一次放50张,扫描速度很快,然后OCR(光学字符识别 Optical Character Recognition)成文字,存储为PDF格式,放在iPad里就很方便阅读了。我在一年前听过朱峰和胡舒淇讨论过电子化书籍为Kindle用户提供帮助,但后来他们放弃这个目标了,好像是觉得版权部分无法逾越,不可以当成商业创业项目。但我觉得,既然扫描成本都到了家庭可以接受的程度,也许帮助别人把家里的书籍数字化是一件有趣的事。李士杰(Ilya)也觉得将书籍数字化也是一件有意思的事,后来有次在网络星期二又同时遇到了张育章和李士杰,我们又聊到了书籍扫描解决方案,我们又一次表达了极大的兴趣。对我来说扫描书籍的应用场景就是帮助大陆朋友代购书籍可以用EMAIL来送货,省掉了运输成本; 对李士杰来说,这是“数位典藏”需要解决的技术问题,他有运行一个叫 Institute of Digital Culture and Social Art 的机构,翻译成中文应该叫“数字文化和社会艺术研究所”,所以他有兴趣把一些文化与艺术融入数字科技,“数位典藏”好像是台湾的科技达人在推动的一个国家计划,估计就是用数字化的方式把一些书籍保存下来。 我们的想法却很简单,我们觉得一个人买一台扫描仪放家里利用率也不高,不如一起出资买一台大家一起用,若是有一个公共空间,则放到公共空间里供大家一起使用。
最近正好Ilya有一个漫画行业的编辑有出差的需求,但携带大量漫画书籍在旅途中阅读显然不便,Ilya就建议他把书籍扫描放到iPad里读。于是Ilya网购了一台Fujitsu ScanSnap S1500M,这是一台双面扫描仪,每分钟能扫描20页,每次能放50张。价格应该是2万台币左右,合人民币4000多,亚马逊网站上报价是420美元,中关村在线报价是3500,太平洋电脑网报价是4850,而且是1500的型号, 型号1500和1500M的区别应该是软件的区别,带M就是for Mac的,提供的软件是苹果电脑上能安装的软件。
Ilya把收货地址改为我家,让我先体验一下,我先拿艾未未的借据扫描了一下,扫描效果在Flickr:
然后开始扫描漫画,我先拿了两本书到街边的文印店让人把书的边切掉,结果他每本收我20台币,太贵了。后来我用摩托车载着整旅行箱漫画书到台大公馆附近的文印店,40本人家才收我100台币。我把书套都取下,然后再切,扫描之后还有机会重新装订成一本完整的书。
安装扫描仪的时候会安装一个ScanSnap Manager软件,扫描时需要开启这个,还会附赠Adobe Acrobat 9 Pro和ABBYY FineReader for ScanSnap两个软件。在ScanSnap Managers可设置扫描时生成jpeg图片还是PDF文件。Acrobat是编辑PDF文件的好工具,可以给所有页面转90度,也可单独旋转某页,还可以把另一个PDF的页面拖进来,合并PDF很方便。ABBYY FineReader for ScanSnap则是一个很强的OCR软件,能把PDF识别成可搜索的PDF文档,也就是把图片中的文字都识别出来仍然保存为PDF,这样,一个100多M的英文书PDF,用ABBYY FineReader处理一下就只有几百KB的大小了,极大的节省了存储空间,能让你只有16G空间的iPad放更多的书哦。
Fujitsu ScanSnap S1500M很强,能用超声波识别纸张是否有重叠,然后让机器停下来,让你重新把纸分开再扫描一次,可以选择自动丢弃刚才没扫描好的。这个功能很有用,因为切书的边的时候,书的边上的胶可能没有处理干净导致仍然有些书页仍然粘在一起,这样就会导致卡纸或重叠现象发生。在我的使用过程中,我最多的时间都花在检查待扫描的书页是否有粘在一起的。下次切书我一定让人多切掉一点边。:)
还有,ScanSnap Manager本身也能像ABBYY一样提供OCR功能,但没有中文支持,还好有日文,我要扫描的都是日文书籍,所以这次初始设定的目标能实现。接下来我需要找一个在苹果电脑上的中文的OCR解决方案了。ABBYY FineReader 在 Mac App Store上有卖,但要99美元,中文Mac App Store上也有,要648元,虽然没有中文界面,但支持171种语言,听说还原图片为word或excel的能力超强,我还没试过呢。我先建议Ilya的研究所去买一个这软件吧。我现在对ABBYY的OCR能力感到惊艳。ABBYY和Fujitsu的产品一定会给出版业来一些影响,至少是融化掉了纸质化和数字化的边界。
地
那些漫畫書好想很不錯哦~