Pdfium,PDF提取目录

具体代码参照http://download.csdn.net/detail/u011569253/9729619

说明:本人是基于pdfium源码 及其例子工程修改的。同时也参照了一些其他人的相关代码,汇总而得到的。由于前一阵公司需要获取pdf文件的目录信息。我在网上找了很多工程,什么pdfbookmark等 很多工具。首先大部分是收费软件。就拿pdfbookmark来说吧 他是通过命令行导出一个xml。但是如果遇到中文目录则会乱码。而且在转码的时候不容易转。对再次读入xml影响很大。所以我都放弃了这些软件。打算着手找一个开源的pdf库。最后确定在pdfium库了。pdfium库在网上例子很少。只有一些如何安装的相关信息。还有一个pdfium内带的例子,但是例子只是实现如何把pdf画出来的解析内容。没有如何获取pdf目录相关内容。之后再pdf接口中找到了FPDFBookmark_Find、FPDFBookmark_GetDest等相关接口,但是这都不是获取bookmark相关信息内容。之后在网上找到了FPDFBookmark_Collect函数。这个函数就是具体目录信通过一个结构体来保存信息,结构体具体信息我都标注了。

struct FPDF_BOOKMARKNODE {
char *title;//目录名称
wchar_t *wtitle;//宽字节的目录名称
int page;//页数
FPDF_BOOKMARKNODE *firstChild;//用来保存第一个子节点
FPDF_BOOKMARKNODE *nextSibling;//用来保存同级目录下一个节点
};

FPDFBookmark_Collect这个函数飞艇稳赚不赔的打法

具体代码参照http://download.csdn.net/detail/u011569253/9729619

说明:本人是基于pdfium源码 及其例子工程修改的。同时也参照了一些其他人的相关代码,汇总而得到的。由于前一阵公司需要获取pdf文件的目录信息。我在网上找了很多工程,什么pdfbookmark等 很多工具。首先大部分是收费软件。就拿pdfbookmark来说吧 他是通过命令行导出一个xml。但是如果遇到中文目录则会乱码。而且在转码的时候不容易转。对再次读入xml影响很大。所以我都放弃了这些软件。打算着手找一个开源的pdf库。最后确定在pdfium库了。pdfium库在网上例子很少。只有一些如何安装的相关信息。还有一个pdfium内带的例子,但是例子只是实现如何把pdf画出来的解析内容。没有如何获取pdf目录相关内容。之后再pdf接口中找到了FPDFBookmark_Find、FPDFBookmark_GetDest等相关接口,但是这都不是获取bookmark相关信息内容。之后在网上找到了FPDFBookmark_Collect函数。这个函数就是具体目录信通过一个结构体来保存信息,结构体具体信息我都标注了。

struct FPDF_BOOKMARKNODE {
char *title;//目录名称
wchar_t *wtitle;//宽字节的目录名称
int page;//页数
FPDF_BOOKMARKNODE *firstChild;//用来保存第一个子节点
FPDF_BOOKMARKNODE *nextSibling;//用来保存同级目录下一个节点
};

FPDFBookmark_Collect这个函数调用需要在创建FPDFAvail_IsPageAvail调用这个函数之后 在使用。因为查找页数的时候需要比对,m_PageList的设置值就在上面函数里。同时还需要注意的是如果pfd的跳转页是Action跳转。而不是具体页数,那么这个函数将无法获取到pdf页数。这时候就需要通过CPDF_Action这个类来获取具体页数。希望能对大家有所帮助。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注