杭州宝马汇棋牌足浴:PdgCntEditor 书签目录-接口文件格式说明
来源:百度文库 编辑:偶看新闻 时间:2024/04/30 14:49:01
接口文件格式说明
一、接口文件简介
接口文件为其它软件(目前主要是Pdg2Pic)提供接口,通过它可以控制FreePic2Pdf的一些行为,包括:
定义多层页面的层次关系。
统一页面宽度。
定义多段页码的起始范围。
定义文本字体。
定义添加到PDF文件尾部的文本信息。
定义多级书签。
用户可以手工对接口文件进行编辑。为了压制一本好书,通常需要反复编辑、制作,在这个过程中建议先将“黑白图像”的压缩算法设置成“CCITT G4”,以加快对黑白页面的处理速度;在最终定稿后再设置为“JBig2无损”制作一遍,以获取最佳压缩比。
二、接口文件格式
接口文件是一个INI格式的文本文件,可以用FreePic2Pdf内置的编辑器编辑,也可以用任何文本编辑器(如Windows下的“记事本”)编辑。接口文件的文件名固定为FreePic2Pdf.itf,存放在源图像文件夹下,只有选择“转换选定文件夹中的文件”时才有效。
如果觉得对接口文件格式理解有困难,最简单的办法就是找一本带目录的PDG书,用Pdg2Pic转换一下,然后对照看Pdg2Pic生成的接口文件。
接口文件按段存放,段与段之间用空行分隔,各段的含义如下:
1、[Images]段
该段定义多层页面的层信息。多层页面是指:在PDF中一个页面由几张图片构成,一张是底图(通常是黑白文字图),其余是插图,插图浮现在底图上。
对于每一个多层页面,需要用以下项表示:
文件名=插图数
文件名_三位编号=left,top,width,height
其中“文件名”表示图像文件的主文件名,left、top、width、height分别是底图(编号为0)和插图(从1开始编号)的左上角坐标、宽度、长度,单位为象素。
多层图像的原始图像文件统一命名为:文件名.三位编号
2、[Font]段
说明文本页中使用的字体。由于种种原因,FreePic2Pdf只支持Acrobat为PDF提供的内建字体,不支持外部字体,如TrueType Font。
该段包括下列字段:
FontName=字体名称,合法内建字体名称见Adobe公司出版的PDF Reference。
Encode=字体编码,合法内建字体编码见Adobe公司出版的PDF Reference。
FontSize=字号,单位为磅。
Margin=页边距,单位为英寸,浮点数。
3、[TextPage]段
FreePic2Pdf的目的是将图像压成PDF,但是如果PDF中只包含图像信息,将不能用PDF Reader进行搜索,不便于资料的再利用,因此可以写一个简短的小文本文件,说明书籍的名称、关键字等(如果图像是用Pdg2Pic从PDG转过来的,会自动使用BookInfo.dat),在制作PDF时作为文本页自动添加到PDF文件尾。
该段包含如下字段:
Files=需要添加的文本文件数。
Fn=文本文件的文件名。n从1开始编号。
文本文件必须与接口文件在同一个文件夹下。如果制作成PDF后觉得字太小,可以手工增加[Font]段FontSize字段的指,然后重新制作。
4、[Bkmk]段
该段说明是否需要在PDF中制作书签,及书签文件名。该段包含下列字段:
File:书签文件名。固定为FreePic2Pdf_bkmk.txt。
Unicode:为1时书签在PDF中采用Unicode编码,否则用ANSI编码。对于中日韩(CJK)文字,这个字段必须为1,否则书签显示为乱码。
AddAsText:为1时将把书签文件作为文本页添加到PDF尾部,0不添加。
ShowBkmk:为1时打开PDF文件即显示书签,0不显示。
ShowAll:为1时展开PDF文件中的所有书签,0只显示顶级书签。
BasePage:书签基准页码。作用见后面叙述,此值必须大于等于1。此值为绝对页码:从PDF文件的第一页(绝对页码为1)开始连续编排。
书签文件是一个标准Windows文本文件,文件名固定为FreePic2Pdf_bkmk.txt,可以用任何文本编辑器(如Windows下的“记事本”)打开、编辑。书签文件必须与接口文件在同一个文件夹下。书签文件中每一行包含如下内容:
0个或多个TAB字符:用缩进表示书签级别。
书签标题:显示在PDF书签上的文字。
分隔TAB字符:分隔“书签标题”和“页面文件名”。
书签对应页码:可以是正整数或负整数,0视为无效。从接口文件中“书签基本页码”(BasePage)字段规定的页码值开始算,基准页码及其之后的页码为正数,之前的页码为负数。即如果书签对应的页面就是基准页面,则书签对应页码为1;如果书签对应的页面是基准页面的后一页,则书签对应页码为2;如果书签对应的页面是基准页面的前一页,则书签对应页码为-1。
用书签基准页码对书签页码进行调节,可以方便手工录入书签:在录入的时候,只需对照实体书的目录页录入书签标题,书签对应页码直接照书上目录对应页码录入;然后在接口文件中将书签基准页码设置为正文第一页的绝对页码即可。
“书签对应页码”部分如果是一个数字(整数或负数),则表示是页码;如果是一个带非数字字符的字符串,则表示Named Destinations,即Acrobat中所称的“已命名的目标”。
下面是一个从图像PDG文件生成的书签文件的片断,此书签为单级书签(书签标题前面没有TAB字符) ,注意正文页之前的页码为负数,正文页之后的为正数(BasePage=6):
封面页 -5
书名页 -4
版权页 -3
目录页 -2
1. 感恩的民众 1
2. 兄弟俩 13
3. 约翰·德·维特的学生 24
4. 凶手们 36
5. 郁金香迷和他的邻居 48
6. 一个郁金香培植者的仇恨 58
7. 幸运的人交上了恶运 67
8. 侵入 80
下面是一个从文本PDG文件生成的书签文件的片断,此书签为多级书签(注意书签标题前面的TAB字符构成的缩进表示出了书签的级别关系) ,注意正文页之前的页码为负数,正文页之后的为正数(BasePage=9):
封面页 -8
前言页 -7
目录页 -2
第一章 三星堆文明的发现与探索 1
一、惊世之发现 2
二、探索者之路 9
三、研究之现状 43
第二章 三星堆文明的基础——宝墩文化 58
一、宝墩文化的发现与认识 59
二、宝墩文化的年代及其变迁 67
三、宝墩文化的成就及其对三星堆文化的影响 74
四、宝墩时期的社会——文明的孕育时期 82
由于采用缩进表示书签级别,因此很容易用UltraEdit、EditPlus等能够记忆缩进位置的文本编辑器进行编辑,也可以采用专门的编辑软件——PdgCntEditor进行编辑。
注意:为了避免因为书签项过多而造成软件崩,软件内部对书签数目有限制,最多允许3000个书签项。
5、[Info]段
该段定义PDF文件的Document Properties,包括如下字段:
Title=PDF文件标题。
Author=PDF文件作者。
Subject=PDF文件主题。
Keywords=PDF文件关键字。
Unicode=为1时在PDF中采用Unicode编码,否则用ANSI编码。对于中日韩(CJK)文字,这个字段必须为1,否则Document Properties显示为乱码。
通常Pdg2Pic用BookInfo.dat中的书名、作者、参考文件格式、主题词字段填充Title、Author、Subject、Keywords。当然不是所有下载工具生成的BookInfo.dat中都有这些字段。
6、[Main]段
该段是个杂烩,包括下列字段:
MinWidth=页面的最小宽度,单位为象素。如果页面宽度不统一,做出来的PDF会很难看,所以用这个参数统一页宽。通常Pdg2Pic是用PDG文件的最大页宽来填这个值。 在转换成PDF的时候,实际页宽根据此值,按照“参数设置”中的“固定DPI”值进行计算。
ContentsPage=目录页的起始页码。在这个页码之前的页编码为大写英文字母,该页及其之后的页编码为小写罗马字母。
TextPage=设置正文的起始页码。从该页起编码为阿拉伯数字。
ContentsPage、TextPage共同构成PDF中的多段(其实是三段)页码,其值必须是绝对页码:从PDF文件的第一页(绝对页码为1)开始连续编排。
注意:如果“参数设置”中“前言页面前缀”、“目录页码前缀”均为空,则上述两段页面用大写英文字母和罗马数字,否则用前缀+数字。如将“目录页码前缀”设置为c,则PDF中目录页就是c1、c2,……。
三、接口文件示例
下面是一个有效接口文件的内容,供第三方软件开发人员参考:
[Images]
00000003_001=208,837,1336,528
00000003_000=0,0,1778,2688
00000003=1
00000082_001=320,666,1096,1058
00000082_000=0,0,1770,2683
00000082=1
[Font]
FontName=STSong-Light
Encode=GBK-EUC-H
FontSize=28
Margin=2.0
[TextPage]
Files=1
F1=FreePic2Pdf.txt
[Bkmk]
File=FreePic2Pdf_bkmk.txt
Unicode=1
AddAsText=1
ShowBkmk=1
ShowAll=1
BasePage=22
[Info]
Title=民间性巫术
Author=宋北麟著
Subject=宋北麟著.民间性巫术.团结出版社,2005.
Keywords=巫术 研究 中国 古代
Unicode=1
[Main]
MinWidth=1778
ContentsPage=16
TextPage=22
一、接口文件简介
接口文件为其它软件(目前主要是Pdg2Pic)提供接口,通过它可以控制FreePic2Pdf的一些行为,包括:
定义多层页面的层次关系。
统一页面宽度。
定义多段页码的起始范围。
定义文本字体。
定义添加到PDF文件尾部的文本信息。
定义多级书签。
用户可以手工对接口文件进行编辑。为了压制一本好书,通常需要反复编辑、制作,在这个过程中建议先将“黑白图像”的压缩算法设置成“CCITT G4”,以加快对黑白页面的处理速度;在最终定稿后再设置为“JBig2无损”制作一遍,以获取最佳压缩比。
二、接口文件格式
接口文件是一个INI格式的文本文件,可以用FreePic2Pdf内置的编辑器编辑,也可以用任何文本编辑器(如Windows下的“记事本”)编辑。接口文件的文件名固定为FreePic2Pdf.itf,存放在源图像文件夹下,只有选择“转换选定文件夹中的文件”时才有效。
如果觉得对接口文件格式理解有困难,最简单的办法就是找一本带目录的PDG书,用Pdg2Pic转换一下,然后对照看Pdg2Pic生成的接口文件。
接口文件按段存放,段与段之间用空行分隔,各段的含义如下:
1、[Images]段
该段定义多层页面的层信息。多层页面是指:在PDF中一个页面由几张图片构成,一张是底图(通常是黑白文字图),其余是插图,插图浮现在底图上。
对于每一个多层页面,需要用以下项表示:
文件名=插图数
文件名_三位编号=left,top,width,height
其中“文件名”表示图像文件的主文件名,left、top、width、height分别是底图(编号为0)和插图(从1开始编号)的左上角坐标、宽度、长度,单位为象素。
多层图像的原始图像文件统一命名为:文件名.三位编号
2、[Font]段
说明文本页中使用的字体。由于种种原因,FreePic2Pdf只支持Acrobat为PDF提供的内建字体,不支持外部字体,如TrueType Font。
该段包括下列字段:
FontName=字体名称,合法内建字体名称见Adobe公司出版的PDF Reference。
Encode=字体编码,合法内建字体编码见Adobe公司出版的PDF Reference。
FontSize=字号,单位为磅。
Margin=页边距,单位为英寸,浮点数。
3、[TextPage]段
FreePic2Pdf的目的是将图像压成PDF,但是如果PDF中只包含图像信息,将不能用PDF Reader进行搜索,不便于资料的再利用,因此可以写一个简短的小文本文件,说明书籍的名称、关键字等(如果图像是用Pdg2Pic从PDG转过来的,会自动使用BookInfo.dat),在制作PDF时作为文本页自动添加到PDF文件尾。
该段包含如下字段:
Files=需要添加的文本文件数。
Fn=文本文件的文件名。n从1开始编号。
文本文件必须与接口文件在同一个文件夹下。如果制作成PDF后觉得字太小,可以手工增加[Font]段FontSize字段的指,然后重新制作。
4、[Bkmk]段
该段说明是否需要在PDF中制作书签,及书签文件名。该段包含下列字段:
File:书签文件名。固定为FreePic2Pdf_bkmk.txt。
Unicode:为1时书签在PDF中采用Unicode编码,否则用ANSI编码。对于中日韩(CJK)文字,这个字段必须为1,否则书签显示为乱码。
AddAsText:为1时将把书签文件作为文本页添加到PDF尾部,0不添加。
ShowBkmk:为1时打开PDF文件即显示书签,0不显示。
ShowAll:为1时展开PDF文件中的所有书签,0只显示顶级书签。
BasePage:书签基准页码。作用见后面叙述,此值必须大于等于1。此值为绝对页码:从PDF文件的第一页(绝对页码为1)开始连续编排。
书签文件是一个标准Windows文本文件,文件名固定为FreePic2Pdf_bkmk.txt,可以用任何文本编辑器(如Windows下的“记事本”)打开、编辑。书签文件必须与接口文件在同一个文件夹下。书签文件中每一行包含如下内容:
0个或多个TAB字符:用缩进表示书签级别。
书签标题:显示在PDF书签上的文字。
分隔TAB字符:分隔“书签标题”和“页面文件名”。
书签对应页码:可以是正整数或负整数,0视为无效。从接口文件中“书签基本页码”(BasePage)字段规定的页码值开始算,基准页码及其之后的页码为正数,之前的页码为负数。即如果书签对应的页面就是基准页面,则书签对应页码为1;如果书签对应的页面是基准页面的后一页,则书签对应页码为2;如果书签对应的页面是基准页面的前一页,则书签对应页码为-1。
用书签基准页码对书签页码进行调节,可以方便手工录入书签:在录入的时候,只需对照实体书的目录页录入书签标题,书签对应页码直接照书上目录对应页码录入;然后在接口文件中将书签基准页码设置为正文第一页的绝对页码即可。
“书签对应页码”部分如果是一个数字(整数或负数),则表示是页码;如果是一个带非数字字符的字符串,则表示Named Destinations,即Acrobat中所称的“已命名的目标”。
下面是一个从图像PDG文件生成的书签文件的片断,此书签为单级书签(书签标题前面没有TAB字符) ,注意正文页之前的页码为负数,正文页之后的为正数(BasePage=6):
封面页 -5
书名页 -4
版权页 -3
目录页 -2
1. 感恩的民众 1
2. 兄弟俩 13
3. 约翰·德·维特的学生 24
4. 凶手们 36
5. 郁金香迷和他的邻居 48
6. 一个郁金香培植者的仇恨 58
7. 幸运的人交上了恶运 67
8. 侵入 80
下面是一个从文本PDG文件生成的书签文件的片断,此书签为多级书签(注意书签标题前面的TAB字符构成的缩进表示出了书签的级别关系) ,注意正文页之前的页码为负数,正文页之后的为正数(BasePage=9):
封面页 -8
前言页 -7
目录页 -2
第一章 三星堆文明的发现与探索 1
一、惊世之发现 2
二、探索者之路 9
三、研究之现状 43
第二章 三星堆文明的基础——宝墩文化 58
一、宝墩文化的发现与认识 59
二、宝墩文化的年代及其变迁 67
三、宝墩文化的成就及其对三星堆文化的影响 74
四、宝墩时期的社会——文明的孕育时期 82
由于采用缩进表示书签级别,因此很容易用UltraEdit、EditPlus等能够记忆缩进位置的文本编辑器进行编辑,也可以采用专门的编辑软件——PdgCntEditor进行编辑。
注意:为了避免因为书签项过多而造成软件崩,软件内部对书签数目有限制,最多允许3000个书签项。
5、[Info]段
该段定义PDF文件的Document Properties,包括如下字段:
Title=PDF文件标题。
Author=PDF文件作者。
Subject=PDF文件主题。
Keywords=PDF文件关键字。
Unicode=为1时在PDF中采用Unicode编码,否则用ANSI编码。对于中日韩(CJK)文字,这个字段必须为1,否则Document Properties显示为乱码。
通常Pdg2Pic用BookInfo.dat中的书名、作者、参考文件格式、主题词字段填充Title、Author、Subject、Keywords。当然不是所有下载工具生成的BookInfo.dat中都有这些字段。
6、[Main]段
该段是个杂烩,包括下列字段:
MinWidth=页面的最小宽度,单位为象素。如果页面宽度不统一,做出来的PDF会很难看,所以用这个参数统一页宽。通常Pdg2Pic是用PDG文件的最大页宽来填这个值。 在转换成PDF的时候,实际页宽根据此值,按照“参数设置”中的“固定DPI”值进行计算。
ContentsPage=目录页的起始页码。在这个页码之前的页编码为大写英文字母,该页及其之后的页编码为小写罗马字母。
TextPage=设置正文的起始页码。从该页起编码为阿拉伯数字。
ContentsPage、TextPage共同构成PDF中的多段(其实是三段)页码,其值必须是绝对页码:从PDF文件的第一页(绝对页码为1)开始连续编排。
注意:如果“参数设置”中“前言页面前缀”、“目录页码前缀”均为空,则上述两段页面用大写英文字母和罗马数字,否则用前缀+数字。如将“目录页码前缀”设置为c,则PDF中目录页就是c1、c2,……。
三、接口文件示例
下面是一个有效接口文件的内容,供第三方软件开发人员参考:
[Images]
00000003_001=208,837,1336,528
00000003_000=0,0,1778,2688
00000003=1
00000082_001=320,666,1096,1058
00000082_000=0,0,1770,2683
00000082=1
[Font]
FontName=STSong-Light
Encode=GBK-EUC-H
FontSize=28
Margin=2.0
[TextPage]
Files=1
F1=FreePic2Pdf.txt
[Bkmk]
File=FreePic2Pdf_bkmk.txt
Unicode=1
AddAsText=1
ShowBkmk=1
ShowAll=1
BasePage=22
[Info]
Title=民间性巫术
Author=宋北麟著
Subject=宋北麟著.民间性巫术.团结出版社,2005.
Keywords=巫术 研究 中国 古代
Unicode=1
[Main]
MinWidth=1778
ContentsPage=16
TextPage=22