金牌译作 施乐PARC中心的革新

522个读者 译者: sniffer  05/09/2008 原文 引用 双语对照及眉批

简介

作为记者和博客我们被邀请参加施乐、PARC中心以及Fuji-Xerox不同部分的10个研究小组的成果介绍。

作为记者和博客我们被邀请参加施乐、PARC中心以及Fuji-Xerox不同部分的10个研究小组的成果介绍。形式很像科学展览或者学术会议的成果展示部分,你可以听听不同项目的介绍。和其他研究院采用大礼堂隆重介绍研究人员不同,我认为这种小型的、像科技展览一样的形式非常有利于参观者和研究人员的沟通。

我们看到的多是研究人员作的原型产品,所以像用户界面这样的东西做得不是很精细。下面是一些我们看到的亮点:

无缝文档阅读器

这是一个J2ME程序,来解决在小屏幕(移动电话和其他移动设备)上阅读文档的问题。它自动将文档分成多个 块然后显示每个文档块的关键字。这些关键字帮助用户快速找到感兴趣的部分。我们看到的演示手机使用了一个非常直观的触摸屏界面,以一种有趣的方式放大和缩 小文档的某一部分。因为通过这个应用程序阅读的文档需要提前处理和分析,所以很适合像PDF这样的静态文档,而不断更新的Web页面就不合适。

混合分类

文档自动分类是信息科学的一个老话题。很多工具只是依赖文档中的文本部分然后采用一些自然语言处理和机器学习技术组合来工作。

我很期待这个介绍因为我一直使用基于文本的自动分类器来组织一些我们的数据

混合分类技术使用文档中的文本和图片。我们看到的演示只是少量文档,还不清楚最多能处理多大规模的数据。从精确测量分类器的精确度以及一个学术竞赛的结果看施乐的混合(文本+图片)办法还是不错的。

可擦除纸

“可擦除纸”就是在纸外面涂上一层特殊材料然后用专门的紫外光打印机打印。打印出来的文档会在24小时之内退色,这样纸张就可以重复使用10次以 上。打印机也可以擦除纸上的文字然后打印新的内容。我们马上想到了另一种可能性——这种可擦除纸可以被逆向工程从而泄露敏感信息:比如安全部门或者狗仔队 翻你的垃圾箱。很吃惊的是研究人员还没有认真考虑过“恢复已擦除文档”的可能性。

这种带特殊涂层的纸成本是普通纸2-3倍,打印机和普通激光打印机成本一样。既然这样的纸可以重复用10次以上那环保方面的益处就很显然。

更多的好处是这种打印机:打印通过紫外光完成那么就不需要墨水或墨粉了。

智能节录

节录就是把文档中敏感信息删掉。常见的例子包括公布给公众的政府文件或者情报文件,还有医疗档案。文本节录通常是一种冗长乏味的人工处理,还要求工作人员掌握很多领域专有知识。比如,美国医疗档案的隐私法案要求节录掉与艾滋病病毒和艾滋病相关的词语,还有精神健康和药物/酒精问题相关的内容。我们看到的演示中软件工具检查了很多文档,自动掌握了指定疾病相关的名字和用语,然后将它们节录掉。

其他突出的内容:

  • 清洁技术:太阳能集中器和不用膜的水过滤技术
  • 环保塑料:使塑料增加30%
  • 癌症检测:稀少细胞检测

相关小组

标签:

内容有问题?请与我们联络。

译作评分

  • Currently 0.00/5
  • 1
  • 2
  • 3
  • 4
  • 5
 0.0  |  0 个评分

0条评论    0眉批

添加评论

欢迎访问译言网。在这里,您可以。。。

阅读
发现
翻译