lol英雄别称:PDF文档在基层档案管理中的应用

来源:百度文库 编辑:偶看新闻 时间:2024/04/29 15:17:32
                                                                             一、问题的提出

基层档案管理信息化已经提出了多年,多数单位的做法主要可以归结为以下三点:一是使用扫描仪及其自带扫描软件对纸质档案进行扫描,每一张纸对应一个jpg或bmp文件,从而导致大量的jpg或bmp文件堆放在电脑里,这样做,除了文件体积庞大外,还使得电子文档的检索难似大海捞针;二是将现存的Word文档及jpg照片等,按照主题或时间顺序进行分类整理并归档,但文档格式不统一,可能导致在不同的软件环境中难以使用;三是使用现成的档案管理付费软件进行档案管理。由于此类软件主要针对规模以上档案馆开发,因而需要档案管理人员具备较高业务素质并经过专业培训才能胜任工作。

基于以上考量,基层单位档案管理信息化实际上可以归结为找到一个能够出色完成以上任务的管理平台,使得纸质的、各种格式的文字图片甚至多媒体统一到一种通用文档上来,并且能够提供快捷方便的检索功能,以方便档案资料的查阅。为此,我们以南阳市宛城区教研室为基地,成立了技术攻关小组,通过查阅国内外大量的文献资料,终于找到一种国际通用的叫做PDF的文档及其编写软件Adobe Acrobat Professional。实践证明,PDF文档几乎可以解决基层馆室档案信息化过程中的所有问题。

二、PDF文档的特点

PDF系英文“便携式文档”Portable Document Format的缩写,是Adobe公司开发的独特的跨平台文件格式。这种文件格式与操作系统平台无关,这意味着PDF文件不管是在Windows,Unix还是在苹果公司的Mac OS操作系统中都能通用。这一特点使它成为在Internet上进行电子文档发行和数字化信息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件开始使用PDF格式文件。PDF格式文件目前已成为各行业信息化过程中所采用的一个工业标准。

PDF专业制作软件Adobe Acrobat Professional可把众多格式的文字连同字体、颜色、分辨率、链接及图形图像、声音、动画、视频、扫描仪获取图像等所有的信息封装在一个特殊的整合文件中,很好地解决了纸质和电子档案的整合问题。Adobe Acrobat 8 Professional技术起点高,功能全,实际功能大大的超过了现有的各种流行文档格式,已经成为美国乃至全球新一代电子文本的无可争议的行业标准。Adobe Reader浏览器可以和HTML网页格式一样拥有超文本链接,可导航阅读;极强的印刷排版功能,可满足档案管理中的各种打印要求;PDF文档得到大量第三方软件公司的支持,拥有多种浏览操作方式;并且比其他传统的文档格式占用磁盘的空间更小,更方便在Internet上传输。

另外为了帮助用户更好地浏览网络上的PDF文件,Acrobat Reader从4.0开始就提供了IE插件功能,它可以将自己作为IE浏览器的插件,为IE增加PDF文件浏览功能。激活此功能之后,我们在上网“冲浪”时若碰到PDF格式的文件,系统就会自动调用Acrobat Reader插件直接在IE内部显示指定PDF文件(再也无需将它们下载到硬盘上进行处理),也就是说我们可维持IE浏览器操作方式不变,但能浏览的内容却成倍扩展,从而极大地方便了远程用户对PDF文件的查阅。

PDF文档特点还在于能方便地对文档加密,设定查阅人的阅读权限,极好地保持了文档的原貌,很难被修改、拷贝和抓取,适用于需要作为档案、证据的材料的存储。PDF文档的表单功能也极大地方便了档案的调用和查阅。

三、创建PDF档案文档

诚然,创建PDF文档需要在计算机系统安装Adobe Acrobat 7或8 Professional版本(以下简称Acrobat)的软件。安装该软件后,基层单位常用的办公软件Word页面上将会自动添加转换为Adobe PDF的图标。档案资料中原有的Word文档便可通过点击该图标转换为PDF文件,同时高版本的WPS也具备另存为PDF文档的功能。

1、创建PDF档案文件大纲目录

从Adobe Acrobat 8 Professional版本开始,Acrobat也可以象Word那样从空白页面创建 PDF文档,以建立档案目录大纲,通过Acrobat 的“创建链接”来实现PDF文档包的有效整合,从而使基层单位的档案文件条理清晰并易于检索。

实践中发现,空白页面对于创建相对较小的大纲式 PDF(大约 12 页)比较有用。 对于较长、较复杂或有很多格式的新文档,通常在提供更多的布局和格式选项的创作应用程序,如Word、 Adobe InDesign 等各种商业软件产品中创建源文档会更好。PDF 编辑器仅能更改从空白页面创建的 PDF 的文本。 将空白页面添加到用其它方法创建的 PDF,应在其它应用程序中创建空白文档并将该文件转换为 PDF,然后将它导入现有的 PDF文档中。方法如下:

创建和添加文本至新的、空白的 PDF。选择“文件”>“创建 PDF”>“从空白页面”。开始键入要添加至空白页面的文本。

选择文本并在“新建文档”工具栏中选择选项来添加格式至文本。 根据需要选择要应用到 PDF 的其它工具和选项。选择“文件”>“保存”,然后选择 PDF 文件的名称和位置。当页面填满文本后,“PDF 编辑器”会自动添加新的空白页面至文档。

从空白页面创建的 PDF 中可以编辑文本。选择“文件”>“打开”,然后查找并选择用“PDF 编辑器”创建的 PDF(就是从空白页面创建的 PDF)。 选择“文档”>“继续编辑”。根据需要添加文本和格式。

2、转换现有文件为 PDF

Acrobat可以提供点击文件>创建PDF>从文件、从多个文件或从网页,来轻松地构建一个PDF文档,如果是多个Word文档, Acrobat则完全能够按照创作者的意志调整每一个文档的顺序。这一功能还可将以前扫描的JPG文件合并为一个有序的PDF文档。利用PDF优化器或Acrobat 文档>减小文件体积来节省磁盘空间。

3、用扫描仪将纸质文档直接转换为PDF

无需安装扫描仪的扫描程序,只需安装扫描仪的驱动程序,Acrobat即可自带的扫描程序来创建PDF文档。方法是:

在 Acrobat 中选择“文件”>“从扫描仪”,或从工具栏上的“创建 Adobe PDF”菜单中选择“从扫描仪”。

在“Acrobat 扫描”对话框中选择基本扫描选项。

除非选定“使内容可检索”(“运行 OCR”),“文本识别和元数据”下的“选项”菜单不可用。根据需要,单击“扫描仪选项”和两个“选项”按钮来访问我们选择的扫描仪的高级设置、“优化选项”和“识别文本-设置”。

如果我们指定了扫描仪本身的界面替换 Acrobat 界面,其它窗口和对话框会显示。单击“扫描”。

如果我们正在扫描多个页面,单击 “追加”,也可以从“文档”菜单中,选择“扫描为 PDF”。将纸质档案转换为PDF。

4、使用拖拽法创建 PDF

当文件大小和输出质量间的平衡不重要时,本方法通常最好保留为小的、简单的文件,例如小的图像文件或纯文本文件。本技术也可用于其它许多文件类型,但是我们在处理过程中没有机会调整任何转换设置。方法是:

使用“资源管理器”(Windows),选择我们要转换为 PDF 的一个或多个文件图标。

将该文件图标拖移到应用程序图标上。 (仅 Windows) 将文件拖放到打开的 Acrobat 窗口。

如果一条消息显示告知该文件无法用 Acrobat 打开,则该文件类型无法通过拖放方法转换为 PDF。 为该文件使用其它的一个转换方法。最后保存 PDF。

另外,也可在 Windows 的“资源管理器”中右键单击文件,然后选择“创建 PDF”。

应当注意,创建 PDF 最好的方式是通过Acrobat将文档和档案资源直接转换为“便携式文档格式”来创建 PDF。

Acrobat 是一个有许多功能的高级工具,但是它不是一个“创作应用程序”,也就是说,不是设计页面布局、书写文本或在空页面上创建和放置图像的应用程序。相反,它与其它应用程序和操作系统内建功能协作,来产生我们然后用于各种不同目的的 PDF。

我们可以从打印在纸张上的文档、Word 文档、InDesign 文件、来自数码相机的图像和电子表格来创建 PDF。 对于 PDF 转换,不同类型的资源文档使用不同的工具。

我们可以使用最方便的 Acrobat 转换功能来节省时间。 如果我们要转换的文档已在它的创作应用程序打开(例如,一份电子表格在 Excel 中打开),有若干种不打开 Acrobat 就可以将该文件转换为 PDF。 相类似,如果 Acrobat 已打开,我们不必打开创作应用程序将文件转换为 PDF。

每个 PDF 要求在效率(文件大小)和质量(像分辨率和颜色)之间的平衡。 当平衡成为任务的关键时,我们要使用一种方法,它包含访问作为该处理一部分的各种转换。例如,将文件拖放到桌面的 Acrobat 图标上来创建 PDF,但是,Acrobat 应用最近一次使用的转换设置,没有提供我们访问的那些设置。 如果我们要对过程有更多的控制,第三方软件如Photoshop的创建方法可能是更好的选择。

四、编辑 PDF 文档

PDF 确实不像其它文档格式一样让我们可以在其中自由的复制、粘贴和在页面上移动文本和图像。这一特点正是档案管理所必需的。当然,使用 Acrobat 增强文件的可读性和可分发性,并为我们的源应用程序保留更多的替换版本。

1、添加书签

书签是PDF文档一大亮点,是实现PDF超文本链接,目录结构条理化,检索便利化的纽带。一个书签指向PDF文档的一个特定位置,点击某个书签,PDF便会自动跳转至所对应页面的视图。

实际上,在创建PDF档案文档的同时,我们就应该建立分级的书签结构。如右图所示:

     每一级书签还可以继续分级,直至对应一个PDF文档

要为文本加书签,选择所需文本。单击导览窗格中的“书签”按钮,然后从“选项”菜单中选择“新的书签”。键入或编辑书签名称。我们也可以添加书签到页面的特殊的位置,例如图像或表格,或到其它的 PDF。创建书签的方法如下:

打开我们想要书签链接的页面,并调整视图设置。使用“选择”工具 来创建书签:

要将单个图像加为书签,单击图像或在图像周围拖拽一个矩形。

要为图像的某个部分建立书签,按 Ctrl 键(Windows)并拖动出一个矩形于图像该部分区域周围。

要为选定的文本建立书签,拖动选择文本。选定的文本成为新书签的标题。我们可以编辑书签标题。

单击“书签”按钮,并选择我们要在其下放置新书签的书签。如果我们尚未选定书签,则新书签会自动添加到书签列表的最后。

从“选项”菜单中选择“新建书签”,或在“书签”面板的顶部选择“新建书签”图标

键入或编辑新建书签的名称,并按回车键(Windows)。使用页面缩略图添加动作

要增强文档的交互质量,我们可以指定要页面打开或关闭时的动作,如更改缩放比率。

单击左侧的“页面”按钮。选定与页面对应的页面缩略图,然后从“选项”菜单选择“页面属性”。单击“动作”标签。从“选择触发器”菜单中,选择“页面打开”来设置页面打开时动作,或选择“页面关闭”来设置页面关闭时动作。从“选择动作”菜单中选择动作,然后单击“添加”。指定动作选项,然后单击“确认”。可用的选项与选定的动作有关。要创建一系列动作,从菜单选择其它动作,然后再次单击“添加”。使用“上移”和“下移”按钮可按照我们要它们发生的顺序安排这些动作。如果我们设置了一个可在“打开页面”或“关闭页面”时切换为“全屏视图”的动作,则下次相同页面打开或关闭时,“全屏视图”被关闭。我们可以为链接、书签、页面、媒体剪辑和表单域指派以下动作:

“执行菜单项”将指定的菜单命令作为动作执行。 “跳至 3D 视图”跳至指定的 3D 视图。 “跳至页面视图”跳至当前文档或其它文档中的指定目标。 “导入表单数据”从其它文件导入表单数据,并将其放置在活动的表单中。 “打开文件”启动和打开文件。如果我们正在分发的 PDF 文件包含指向其它文件的链接,则读者需要该链接文件的应用程序才能将其成功打开。(我们可能需要添加目标文件的打开首选项。)“打开网络链接”跳至因特网上指定的目标。我们可以使用 http、ftp 和 mailto 协议来定义链接。 “播放声音”播放指定的声音文件。声音以跨平台格式(在 Windows 和 Mac OS 系统中均可播放)嵌入到 PDF 文档中。 “播放媒体(与 Acrobat 5 兼容)”播放指定的 QuickTime 或 AVI 电影,其在创建时设置为与 Acrobat 5 兼容。指定的电影必须嵌入在 PDF 文档中。 “播放媒体(与 Acrobat 6 和更高版本兼容)”播放指定的电影,其在创建时设置为与 Acrobat 6 兼容。指定的电影必须嵌入在 PDF 文档中。 “读文章”顺着当前文档中或其他 PDF 文档中的文章线索阅读。 “重置表单”清除表单中以前输入的数据。我们可以使用“选择域”对话框来控制被重置的域。 “运行 JavaScript”运行指定的 JavaScript。 “设置图层可见性”决定激活的图层设置。在我们可以添加本动作之前,指定适当的图层设置。 “显示/隐藏域”在显示和隐藏 PDF 文档中的域之间切换。本选项在表单域中非常有用。例如,如果当指针置于按钮上时我们想要弹出对象,我们可以设置一个动作当“鼠标进入”时触发显示域并在“鼠标退出”时触发隐藏域。 “提交表单”将表单数据发送到指定的 UR。

2、PDF 优化器与PDF减肥

PDF 优化器提供了许多用于减小 Adobe PDF 文件大小的设置。某些“PDF 优化器”设置同使用 Acrobat Distiller 创建 Adobe PDF 文件时的可用设置相同。是否使用所有设置取决于我们使用文件的目的和文件自身的本质要求。通常情况下,默认设置通过删除某些嵌入字体,压缩图像,以及从文件删除不再需要的项目来最大程度的优化存储空间。

在优化文件前,我们最好统计文件空间使用情况。空间统计结果可以告诉我们减小文件大小的最佳情况。通过使用“减小文件大小”命令,也可以减小我们的 PDF 的大小。要“PDF 优化器”对话框,执行以下任一操作:

选择“高级”>“PDF 优化器”。

选择“高级”>“印刷制作”>“PDF 优化器”。

单击“印刷制作”工具栏中的“PDF 优化器”图标 。 。

 3、创建 PDF 档案包

PDF 档案包特别适用于数据量不大的中小单位。它能将各种不同格式、在不同的应用程序中创建的多个文件转换并集成到集成的 PDF 单元中。 原始文件是 PDF 档案包文件的一部分,但会保留其自己的身份。每个组件文件可以与 PDF 档案包中的其它组件文件分别被打开、阅读、编辑和格式化。

我们可以使用“合并文件”向导创建 PDF 档案包,可以从“快速入门”窗口启动,也可以从“任务”工具栏启动,或者选择“文件”>“合并文件”命令。 在 Windows 中,Outlook 和 Lotus Notes 中的 Acrobat PDF Maker 会在我们转换电子邮件为 PDF 或转换在 Acrobat 较早版本中创建的 PDF 电子邮件归档的时候创建 PDF 档案包。

根据不同情况,PDF 档案包除能合并多个文件到普通的 PDF 之外还能提供多种功能。

 “添加和删除” 我们可以方便的添加或删除组件文档,而不用查找和选择该文件中的所有页面。

 “查看” 组件文件不在单独的窗口中打开,因此我们可以快速的浏览并进行更改,而不用为“打开”或“保存”对话框暂停。选择“文件”>“保存”将一次性保存 PDF 档案包的所有组件的更改。

 “编辑” 我们可以在 PDF 档案包中更改个别的 PDF 而不会影响其它组件 PDF。例如,我们可以更改该 PDF 的页码、数字签名、选择不同的安全性设置等,而不用将这些更改应用到其它组件文档。我们可以重命名组件。

 “分发” 因为 PDF 档案包是一个文件,我们可以与他人共享并确保他们获得了所有的组件部件。

 “排序” PDF 档案包中的组件 PDF 会在我们可以添加、删除、隐藏和自定义的种类的分类下列出。然后,我们可以方便的单击种类名称来排序列表。

 “打印” “文件”菜单中的“打印”命令包含打印当前打开的文档、PDF 档案包中的所有文档或 PDF 档案包列表中选定的多个组件文档的命令。

 “检索” “高级检索”窗口包含检索当前打开的文档、PDF 档案包中的所有文档或 PDF 档案包列表中选定的多个组件文档的选项。

 “合并其它格式” 我们可以添加非 PDF 文件到现有的 PDF 档案包,而不用将其转换为 PDF。这个可以通过将文件从桌面、Microsoft 资源管理器拖拽到打开的 PDF 档案包组件列表中来完成。当然,非 PDF 文件不能享有包中 PDF 的所有优势。

“独立于源文件” 当我们创建 PDF 时,PDF 档案包的源文件(甚至是我们添加至包的现有 PDF)不会更改。我们在 PDF 档案包中对 PDF 所做的更改不会更改我们创建 PDF 的原始文件。我们可以将 PDF 移动至我们的计算机或网络上的任何位置,而不会有丢失或连接不上组件的风险。

 “重新使用” 我们可以将相同的原始源文件包含或转换到多个 PDF 档案包。

PDF 有两点局限性。它们不能使用某种正常向导审阅,也不能在数据收集工作流程中发送。

PDF 档案包与我们在 Acrobat “管理器”中创建的“收藏”完全不同。“管理器”的“收藏”只是帮助我们查找相关的 PDF 的工具,无论 PDF 储存在我们的计算机上的何种文件夹结构中。PDF 档案包是真实的 PDF 文件,每个都储存在我们的计算机的单独的位置上。同样,附加到其它 PDF 的 PDF 不具备 PDF 档案包所提供的优势。

4、将 PDF 作为链接的文件置入其它文档中

我们可以将 PDF 合并到其它支持“对象链接和嵌入”(OLE)类型的文件中,例如 InDesign 或 Word 文件。这些文件叫做 OLE“容器文档”。稍后,如果我们更改原始的 PDF,容器应用程序中的 OLE 功能可以更新容器文档中嵌入的文件,将我们的更改映射到原始的 PDF 中。

执行以下任一操作:

选择 OLE 容器应用程序的“插入对象”命令或“插入超链接”命令。

在 Acrobat 中,选择“编辑”>“复制文件到剪贴板”,然后选择容器应用程序中的“粘贴特殊”命令。

另外,电影、声音和 3D 模型也可以插入到PDF文档中。Adobe PDF 可以通过广泛的多媒体交流。PDF 可以包括视频剪辑、数字音频和读者能移动、旋转、缩放和按部件检查的 3D 模型。

五、创建PDF文档的索引与检索

(一)创建和管理 PDF 中的索引

我们可以通过在文档中嵌入词的索引来减少检索长 PDF 的时间。 Acrobat 检索索引比在文档中检索更快。 嵌入索引包括在已分发或已共享的 PDF 副本中。用户使用嵌入索引检索 PDF 和他们不使用嵌入索引检索完全一样;不需要额外的步骤。

1、添加索引到 PDF

使用 Acrobat 中打开的文档,选择“高级”>“文档处理”>“管理嵌入索引”。

在“管理嵌入索引”对话框中,单击“嵌入索引”。

阅读出现的说明,并单击“是”。

在 Outlook 和 Lotus Notes 中,当我们转换电子邮件或文件夹到 PDF 时有嵌入索引的选项。 特别建议针对文件夹包含很多电子邮件时使用。

更新或删除 PDF 中的嵌入索引

选择“高级”>“文档处理”>“管理嵌入索引”。

单击“更新索引”或“删除索引”。

在确认消息中单击“确定”。

2、准备 PDF 来构建索引

首先,创建文件夹来将所需构建索引的 PDF 档案包含到其中。所有 PDF 应该内容和电子功能完整,例如链接、书签和表单域。如果要构建索引的文件包含扫描文档,确保文本可检索。将长文档分割成短文档,按章节分割文档,可以增加检索效率。我们还可以添加信息到文件的文档属性来增加文件的可检索性。

在我们为文档集合构建索引之前,我们必须在硬盘驱动器或网络服务器卷上设置文档结构并验证跨平台文件名。在跨平台检索中,文件名可能被截断并难于恢复。要防止这种问题,注意以下几点:

使用 MS-DOS 文件命名规则(8 个或 8 个以下字符文件名加 3 个字符扩展名)重命名文件、文件夹和索引,尤其我们计划在 ISO 9660 格式 CD-ROM 上发送文档集合和索引的情况更应注意。

删除文件和文件夹名称中的扩展字符,例如重音字符和某些非英文字符。(“编录”功能使用的字体不支持字符编码 133 到 159。)

如果文档结构中包含我们不想构建索引的子目录,可以在构建索引过程中排除它们。

3、使用编录功能

我们可以将特定的一组 PDF 定义为“编录”,并为整个集合的文档创建统一的索引。当用户检索已编录的 PDF 的特定信息时,索引可以加快检索处理。

当在 CD 上或网站上分发或发布集合时,我们可以在 PDF 中包含索引。

我们可以编录罗马、中文、日文或韩文字符的文档。我们可以编录的项目包括文档文本、注释、书签、表单域、标签、对象和文档元数据、附件、文档信息、数字签名、图像 XIF(扩展图像文件格式)元数据和自定义文档属性。

4、添加元数据到文档属性

要使 PDF 便于检索,我们可以添加被称为“元数据”的文件信息到文档属性。具体步骤是:

选择“文件”>“文档属性”,然后单击“说明”标签来查看当前打开 PDF 的属性。

我们也可以从桌面输入和阅读数据属性信息。在 Windows 的“资源管理器”中右键单击文档,选择“属性”,然后单击“PDF”标签。我们在本对话框中键入或编辑的任何信息均会在打开文件时出现在“文档属性”的“说明”中。

当添加文档属性数据时,考虑以下因素:

在“标题”域中使用说明准确的标题。文档的文件名会出现在“检索结果”对话框中。

总是为相似信息使用相同选项(栏位)。例如,不要为一些文档添加重要项目到“主题”选项,而另一些添加到“关键字”选项。

为相同的信息使用单一、统一的项目。例如,不要为一些文档使用生物学而为另一些使用生命科学。

使用“作者”选项来标识文档的负责方。例如,教研室文档的作者可能是“区电教馆”。

如果我们使用文档部件号,将它们作为关键字来添加。例如,添加“doc#=m234”到“关键字”选项来在关于特殊对象的一系列数百个文档中指名特定的文档。

单独或同时使用“主题”或“关键字”选项来按类型对文档分类。例如,我们可以使用状态报告作为“主题”项目,并使用“每月”或“每周”作为单个文档的“关键字”项目。

如果对 Adobe PDF 非常熟悉,我们可以在创建索引时定义自定义数据域,例如,“文档类型”、“文档编号”和“文档标识符”。建议仅高级用户使用,且在Acrobat“完整的 Acrobat 帮助”中并未加以说明。

5、为集合创建索引

当我们构建新的索引时,Acrobat 创建“.pdx”扩展名的文件和新的支持目录,其中包含了一个或多个“.idx”扩展名的文件。IDX 文件包含索引条目。所有这些文档必须对要检索索引的用户可用。

查看完全大小图形

对于创建索引处理的对话框

选择“高级”>“文档处理”>“含有目录的全文索引”,然后单击“新建索引”。

在“索引标题”中,键入索引文件名。

在“索引描述”中,键入一些关于索引类型或意义的单词。

单击“选项”,选择我们希望应用的索引的高级选项,然后单击“确定”。

在“包含这些目录”选项下,单击“添加”,选择包含要构建索引的 PDF 文件的文件夹,然后单击“确定”。要添加其他文件夹,重复本步骤。

任何包含文件夹下的子文件夹也会包含在构建索引的处理中。如果我们不打算移动索引或任何文档集合中项目,我们就可以从多个服务器或磁盘驱动添加文件夹。

在“排除这些子目录”选项下,单击“添加”,然后选择包含不要创建索引的 PDF 文件的子文件夹。单击“确定”,如果需要重复本步骤。

审阅我们的选择。要更改包括或排除的文件夹列表,选择我们要更改的文件夹,然后单击“删除”。

单击“构建”,然后指定索引文件的位置。单击“保存”,然后:

当构建索引完成后,单击“关闭”。

单击“停止”来取消构建索引处理。

如果停止构建索引,我们无法继续同一索引构建过程,但是无须重复上述工作。选项和文件夹选择仍然完整保留。我们可以单击“打开索引”选择部分完成的索引,进行修改。

 如果长路径名在“包含这些目录”和“排除这些子目录”选项中被缩短,将指针悬停到每个省略号(...)上方,直到工具提示出现为止,其中会显示包含和排除文件夹的完整路径。

6、修改索引

我们可以更新、重建或清空现有的索引。

选择“高级”>“文档处理”>“含有目录的全文索引”,然后单击“打开索引”。

为索引查找并选择索引定义文件(PDX),然后单击“打开”。

如果索引是使用 Acrobat 5.0 或更低版本创建的,选择“创建副本”来新建索引(不替换早期版本),或者选择“替换旧索引”来替换早期版本索引。

在“索引定义”对话框中,根据需要更改设置,然后单击想要 Acrobat来执行:选项 说明

“构建”  使用现有信息新建 IDX 文件,并通过添加新项目并将更改的或过期的项目标记为无效来进行更新。如果我们做了大量的更改,或者重复使用本选项,而不是新建索引,检索时间可能会增加。

 “重建” 新建索引,替换现有的索引文件夹和其内容(IDX 文件)。

 “清空”  删除索引内容(IDX 文件),而不删除索引文件本身(PDX)。

7、编录首选项

我们可以为构建索引设置首选项,以后它将应用于我们构建的所有索引。我们可以在索引定义过程中选择不同设置来使个别索引忽略其中的某些首选项。

我们可以通过选择“编辑”>“首选项”(Windows)打开编录首选项,然后在“种类”下选择“编录”。许多选项的描述与索引构建工程中的完全一致。

定时更新索引。我们可以使用“编录”功能和编录批处理 PDX 文件(.bpdx),来设置自动构建、重建和清空索引的时间和频率。BPDX 文件是包含与平台有关的编录索引文件路径和标志的列表的文本文件。可以使用计划任务应用程序(例如 Windows 的“计划任务”或 Mac OS 的 Scheduler)来将 BPDX 文件显示在Acrobat。 Acrobat 会按照 BPDX 文件中的标志重新创建索引。

(二) 检索PDF档案文档

我们执行检索来查找 PDF 指定的项目。 我们可以执行简单的检索,在单个文件中查找,或者执行复杂的检索在一个或多个 PDF 中查找各种不同的数据。

我们可以使用“检索”窗口或“查找”工具栏执行检索。 在这两种情况下,Acrobat检索 PDF 主体文本、层、表单域和数字签名。 我们也可以在检索中包括书签和注释。

 “检索”窗口比“查找”工具栏提供更多的选项和检索的种类。 如果我们使用“检索”窗口,也可以检索对象数据和图像 XIF(扩展的图像文件格式)元数据。 要在多个 PDF 检索,Acrobat也可看到文档属性和 XMP 元数据并且当检索 PDF 索引时,它检索索引结构标签。 如果我们检索的 PDF 档案包含附件 PDF,我们可以在检索中包含附件。

PDF 可以有多个图层。 如果检索结果包含隐藏图层上的示例,选择该示例时将会显示警告,来询问我们是否使图层可见。

我们也可以将检索作为密文处理的一部分,其将敏感的和专用的信息从我们分布的 PDF 中删除。参阅“删除敏感内容”。

1、访问检索功能

在此处我们可以根据要执行的检索的类型开始我们的检索。 为快速检索 PDF 内容使用“查找”工具栏。使用“检索”窗口来查找多个 PDF 的单词或文档属性,使用“高级”检索选项和检索 PDF 索引。

显示“查找”工具栏

默认情况下,“查找”工具栏已经打开。如果其已经关闭,可以使用本过程来打开它。

执行以下任一操作:

选择“编辑”>“查找”。

右键单击或按 Control 键单击工具栏区域,并选择上下文菜单中的“查找”。

按 Ctrl+F 或 Command+F。

打开“检索”窗口

 执行以下任一操作:

选择“编辑”>“检索”。

在“查找”工具栏,单击箭头  并选择“打开完整的 Acrobat 检索”。

检索会显示在单独窗口中,你可以将其移动、调整大小、最小化或者部分或全部的排列在 PDF 窗口后面。

排列 PDF 文档窗口和“检索”窗口

 在“检索”窗口中,单击“排列窗口”。

Acrobat调整两个窗口的大小并排列使其一起占据整个屏幕。

注: 单击“排列窗口”按钮两次调整文档窗口,但是保持“检索”窗口不变。 如果我们要使“检索”窗口变大或变小,拖到角落或边缘,像我们在操作系统中调整窗口一样。

2、在 PDF 中查找文本

“查找”工具栏查找当前打开的 PDF。

在“查找”工具栏文本框中键入我们要检索的文本。

(可选)单击位于文本框旁边的箭头 选择以下一个或多个选项:选项 说明

“全字匹配” 仅查找在文本框我们键入全字示例。 例如,如果我们检索单词“stick”,不会显示单词“tick”和“sticky”。

 “匹配大小写” 仅查找匹配我们键入大小写单词的示例。 例如,如果我们检索单词“Web”,不会显示单词“web”和“WEB”。

 “包括书签” 也检索“书签”窗格中的文本。

 “包含注释” 也检索其它注释的文本。

按 Enter 键。

Acrobat跳至检索项目第一个实例,其以高亮显示。

重复按 Enter 键,跳至检索项目下一个实例

我们可以在多个 PDF 中查找文本。 “检索”窗口允许我们在多个 PDF 查找项目。 例如,我们可以在所有打开的 PDF 文档、指定的文档或一个 PDF 档案包检索。

如果文档已加密(已应用安全性),我们无法将它们作为多文档检索的一部分来检索。我们必须首先打开这些文档并逐个检索它们。但是,文档作为“数字出版物”加密是一个特例,我们可以作为多文档检索的一部分来进行检索。

在指定文件夹的 PDF 中查找文本

在我们的桌面打开Acrobat (不是网络浏览器)。

执行以下任一操作。

在“查找”工具栏,键入我们要查找的文本然后从弹出菜单选择“打开完整的 Acrobat 检索”。

在“检索”窗口,在文本框键入我们要查找的文本。

在“检索”窗口,选择“所有 PDF 文档,位于”。 从本选项下方弹出菜单选择“查找位置”。

选择我们要查找的位置,或者在我们的计算机,或网络然后单击“确定”。

如果我们要指定附加检索条件,单击“使用高级检索选项”并选择我们要的选项。

单击“检索”。

在检索过程中,我们可以单击结果或使用键盘快捷键来导览结果但不中断检索。单击检索进度栏下方的“停止”按钮可取消继续检索,仅显示已找到的示例结果。该按钮不会关闭“检索”窗口或删除“结果”列表。要查看更多结果,我们必须运行新的检索。

检索 PDF 档案包

在我们的桌面用Acrobat打开 PDF(不是网络浏览器)。

执行以下任一操作。

在“查找”工具栏,在文本框中键入我们要查找的文本,然后从弹出菜单选择“打开完整的 Acrobat 检索”。

在“检索”窗口,在文本框键入我们要查找的文本。

在“检索”窗口,从“检索范围”菜单选择以下一个项目:

要检索包中的所有 PDF,选择“在整个 PDF 档案包中”。

要仅检索包中的某些 PDF,选择“在选定的 PDF 文档中”。 然后在 PDF 档案包导览区选择我们要检索的 PDF。

如果我们要指定附加检索条件,单击“使用高级检索选项”并选择我们要的选项。

单击“检索”。

3、查看检索结果

在我们从“检索”窗口执行检索后,结果按照页面顺序显示,嵌入在每个检索文档名称下方。每个列出的项目包括不多的上下文单词(若应用)并且一个图标表示示例的类型。

跳至检索结果中指定的实例

如有需要,单击加号(+)Windows)以展开检索结果。然后在结果中选择实例来查看 PDF 的实例。

要查看其它实例,执行下列操作之一:

单击结果中其它实例。

按“下移箭头”键移动到下一实例,或按“上移箭头”键移动到上一实例。

选择“编辑”>“检索结果”,然后选择“下一结果”或“上一结果”。

4、在检索结果中排序

从“检索”窗口底部附近的“排序,按”菜单选择选项。 结果可以按照“相关程度”、“修改日期”、“文件名”或“位置”排序。

5、优化检索结果

如果检索结果中有部分是无用的,要精简结果的最快方法是优化当前结果,而不是重新运行检索。优化是迅速的,因为它仅检索当前的检索结果。如果我们优化检索,会产生原始结果的新的子列表。

在列出首次检索结果后,单击“检索”窗口底部的“优化检索结果”。

指定附加检索条件。

单击“优化检索结果”。

通过重复此过程来不断地优化结果。

6、检索结果显示的图标

检索结果旁边的图标表示了实例出现的检索区域。 选择含有以下效果的图标:

“文档图标”

<在文档窗口中使 PDF 激活。 单击图标旁边的加号(+)(Windows)可以显示 PDF 中单个检索结果的列表。

 “(一般)检索结果图标”

跳至检索项目第一个实例,通常在 PDF 正文中。 检索项目的实例在文档被高亮。

“书签图标”

打开“书签”面板并高亮检索项目的实例。

“注释图标”

打开“注释”面板并高亮检索项目的实例。

“图层图标”

可能打开消息表示图层被隐藏,并询问我们是否要使其可见。

“附件图标”

打开检索父 PDF 中的某个 PDF 文件附件,并高亮显示检索项目的实例。

7、高级检索选项

默认情况下,“检索”窗口显示基本的选项。单击靠近窗口下方的“使用高级检索选项”来显示其它选项。 要恢复基本选项,单击靠近窗口下方的“使用基本检索选项”。

我们可以设置首选项以便高级检索选项总是在“检索”窗口显示。 通过选择“编辑”>“首选项”(Windows)或“Acrobat”> 然后在”种类“下方选择”检索“。

“返回结果中包含”

根据我们选择的选项,限制检索结果。

“精确匹配单词或短语”

检索完整的字符串(包括空格),按照其在文本框中相同的顺序显示。

 “匹配所有单词”

检索至少有一个键入单词的所有实例。 例如,检索“each of”,结果包括所有出现一个或两个单词的实例: each、of、each of、或者 of each。

 “匹配所有单词”

检索包含所有要检索单词的实例,但是不是所有单词都与我们键入的顺序相同。 仅对多个 PDF 检索或索引定义文件可用。

 8、“布尔查询”

使用的布尔操作符和检索单词一起键入“我们想要检索什么单词或短语”框。 仅对检索多个 PDF 或 PDF 索引可用。

我们无法使用(*)或(?)执行]通配符检索 当检索 PDF 索引。

 “使用这些附加条件(文本选项)”

包括基本选项加四个附加选项:

“检索范围”

限制检索当前的 PDF,当前打开的 PDF 部分的或所有部分(若应用),索引或我们的计算机上的位置。如果我们选择检索索引,计算机上的位置、PDF 档案包,附加选项将出现在“使用这些附加的条件”下方。

 “近似”。对于两个或更多独立的单词检索,根据在“检索”首选项中设置情况,其单词不超过一个指定的数量。 仅对多个文档或索引定义文件并选择“匹配所有单词”时可用。

 “词干”。查找的单词是包含指定检索单词的部分(词干)。例如,检索“opening”找到“open”、“opened”、“opens”和“openly”实例。当我们检索当前 PDF,文件夹或用 Acrobat 6.0 或更高版本创建的索引,本选项应用于单个单词和短语,通配符(*,?) 在词干检索中不允许。如果选择“全字匹配”或“匹配大小写”,词干不可用。

 “包括书签”

像在“书签”窗格中看到的一样检索所有书签的文本。

 “包含注释”

像在“注释”窗格中看到的一样检索所有注释的文本。

 “包括附件”

检索附件到当前 PDF,或它附件的 PDF 的 PDF(至多两级)。

 “使用这些附加条件(文本属性)”

仅对检索多个 PDF 或 PDF 索引显示。我们可以选择多个属性修改值合并和应用它们到检索。

我们可以通过将“检索”窗口顶部的“我们想要检索什么单词或短语”框保持为空的文档属性检索。 或者,我们可以使用和指定文本检索组合的文档属性选项。

“复选框”

在要检索的三个连接的选项中应用条件组。 (当我们为设置在所有的三个选项输入信息时,复选框自动被选择。 在我们输入选项后、取消选择复选框不清除该选项;它们不仅是应用到检索。)

 “首个菜单(属性)”

表示要检索的文档特性。 可用的选项包括创“建日期”、“修改日期”、“作者”、“标题”、“题目”、“文件名”、“关键字”、“书签”、“注释”、“JPEG 图像”、“XMP 元数据”和“对象数据”。

 “第二个菜单(修改)”

表示匹配的级别。 如果首个选项是日期,在第二个菜单中可用的选项是“精确为”、“在此前”、“在此后”、“不是”。 否则,可用的选项是“包含”和“不包含”。

 “第三个框(值或文本)”

表示我们键入的要匹配的信息。 如果首个菜单选择是日期,我们可以单击箭头来打开可以导览来查找并选择日期的日历。

检索已编录 PDF 的索引文件

当用户使用 Acrobat 来定义 PDF 的“编录”时,全文索引被创建。 我们可以检索要查找单词的索引而不是执行对在目录中每个独立的 PDF 全文检索。 索引检索会制作可链接到索引文档示例的结果列表。

要检索 Adobe PDF 索引,我们必须将Acrobat作为独立程序打开,而非在网络浏览器中打开。Acrobat较早版本创建的索引和Acrobat 8.0 “检索”功能不兼容,并且必须在我们使用Acrobat 8.0 检索它们之前更新。

打开“检索”窗口,键入我们要查找的单词,然后单击“使用高级检索选项”(在窗口底部)。

在“检索范围”中,选择“选择索引”。

在“索引选项”对话框中,选择一个索引,如果我们要检索的索引可用,或单击“添加”然后定位并选择要检索的索引,单击“打开”。 根据需要重复直到我们要检索的所有索引都已列出。

通过单击“信息”,我们可以阅读关于选择索引的文件数据,我们可以通过选择它们并且选择“删除”或清除该索引的复选框来排除索引。

单击“确定”来关闭“索引选项”对话框,然后在“检索范围”弹出菜单上选择“当前选定的索引”。

继续我们的检索,选择我们要应用的其它选项,然后单击“检索”。

要减少检索索引返回结果的时间,选择“全字匹配”选项。

 

(三)利用大纲式书签检索PDF

最为简单实用的检索方法当属建立大纲式书签。当基层单位的PDF档案文档的创建、编辑工作完成后,便可以着手从空白文档创建大纲式PDF,书签的最后一级对应一页个本,每一个文本链接一个PDF文件,方法如下:

选择 工具>框选一行文本>右击该文本行>选择创建链接>打开文件>浏览>选择与该文本名称一致的PDF文档>在新窗口打开>确定。这样,一个脉络清晰的基层单位档案管理分级图便呈现在我们眼前,点击PDF页面上每一个文件索引文本框,档案PDF文档便在新窗口中打开,对原有的大纲式页面不产生影响。这种方法特别适于数据量大的单位采用。如果数据量太大,也不意味着排除建立PDF索引文件以方便查阅。

至此,基层单位需要的档案PDF文档的创建、编辑、检索的问题初步得到解决。由于Adobe Acrobat 8 Professional具备非常强大的功能,因此,应用该软件解决档案信息化过程中遇到的其他问题,仍然需要我们进一步探索和研究。