首页编程java编程java pdf(java程序设计教程电子版)

java pdf(java程序设计教程电子版)

编程之家2026-06-05655次浏览

大家好,今天给各位分享java pdf的一些知识,其中也会对java程序设计教程电子版进行解释,文章篇幅可能偏长,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在就马上开始吧!

java pdf(java程序设计教程电子版)

如何运用Java组件itext生成pdf

如何使用Java组件itext生成pdf?iText是一个能够快速产生PDF文件的java类库。iText的java类对于那些要产生包含文本,表格,图形的只读文档是很有用的。它的类库尤其与java Servlet有很好的给合。使用iText与PDF能够使你正确的控制Servlet的输出。

在企业的信息系统中,报表处理一直占比较重要的作用,Java组件——iText可以非常快速的生成PDF报表。iText是着名的开放源码的站点sourceforge一个项目,是用于生成PDF文档的一个java类库。通过iText不仅可以生成PDF或rtf的文档,而且可以将XML、 Html文件转化为PDF文件。通过在服务器端使用Jsp或JavaBean生成PDF报表,客户端采用超级连接显示或下载得到生成的报表,这样就很好的解决了B/S系统的报表处理问题了。

一、iText介绍

iText是着名的开放源码的站点sourceforge一个项目,是用于生成PDF文档的一个java类库。通过iText不仅可以生成PDF或rtf的文档,而且可以将XML、Html文件转化为PDF文件。

iText的安装非常方便,在 download网站上下载iText.jar文件后,只需要在系统的CLASSPATH中加入iText.jar的路径,在程序中就可以使用iText类库了。

二、建立第一个PDF文档

java pdf(java程序设计教程电子版)

用iText生成PDF文档需要5个步骤:

①建立com.lowagie.text.Document对象的实例。

Document document= new Document();

②建立一个书写器(Writer)与document对象关联,通过书写器(Writer)可以将文档写入到磁盘中。

PDFWriter.getInstance(document, new FileOutputStream("Helloworld.PDF"));

③打开文档。

java pdf(java程序设计教程电子版)

document.open();

④向文档中添加内容。

document.add(new Paragraph("Hello World"));

⑤关闭文档。

document.close();

通过上面的5个步骤,就能产生一个Helloworld.PDF的文件,文件内容为"Hello World"。

建立com.lowagie.text.Document对象的实例

com.lowagie.text.Document对象的构建函数有三个,分别是:

public Document();

public Document(Rectangle pageSize);

public Document(Rectangle pageSize,

int marginLeft,

int marginRight,

int marginTop,

int marginBottom);

构建函数的参数pageSize是文档页面的大小,对于第一个构建函数,页面的大小为A4,同Document(PageSize.A4)的效果一样;对于第三个构建函数,参数marginLeft、marginRight、marginTop、marginBottom分别为左、右、上、下的页边距。

通过参数pageSize可以设定页面大小、面背景色、以及页面横向/纵向等属性。iText定义了A0-A10、AL、LETTER、 HALFLETTER、_11x17、LEDGER、NOTE、B0-B5、ARCH_A-ARCH_E、FLSA和FLSE等纸张类型,也可以通过Rectangle pageSize= new Rectangle(144, 720);自定义纸张。通过Rectangle方法rotate()可以将页面设置成横向。

书写器(Writer)对象

一旦文档(document)对象建立好之后,需要建立一个或多个书写器(Writer)对象与之关联。通过书写器(Writer)对象可以将具体文档存盘成需要的格式,如com.lowagie.text.PDF.PDFWriter可以将文档存成PDF文件, com.lowagie.text.html.HtmlWriter可以将文档存成html文件。

设定文档属性

在文档打开之前,可以设定文档的标题、主题、作者、关键字、装订方式、创建者、生产者、创建日期等属性,调用的方法分别是:

public boolean addTitle(String title)

public boolean addSubject(String subject)

public boolean addKeywords(String keywords)

public boolean addAuthor(String author)

public boolean addCreator(String creator)

public boolean addProducer()

public boolean addCreationDate()

public boolean addHeader(String name, String content)

其中方法addHeader对于PDF文档无效,addHeader仅对html文档有效,用于添加文档的头信息。

当新的页面产生之前,可以设定页面的大小、书签、脚注(HeaderFooter)等信息,调用的方法是:

public boolean setPageSize(Rectangle pageSize)

public boolean add(Watermark watermark)

public void removeWatermark()

public void setHeader(HeaderFooter header)

public void resetHeader()

public void setFooter(HeaderFooter footer)

public void resetFooter()

public void resetPageCount()

public void setPageCount(int pageN)

如果要设定第一页的页面属性,这些方法必须在文档打开之前调用。

对于PDF文档,iText还提供了文档的显示属性,通过调用书写器的setViewerPreferences方法可以控制文档打开时Acrobat Reader的显示属性,如是否单页显示、是否全屏显示、是否隐藏状态条等属性。

另外,iText也提供了对PDF文件的安全保护,通过书写器(Writer)的setEncryption方法,可以设定文档的用户口令、只读、可打印等属性。

添加文档内容

所有向文档添加的内容都是以对象为单位的,如Phrase、Paragraph、Table、Graphic对象等。比较常用的是段落(Paragraph)对象,用于向文档中添加一段文字。

三、文本处理

iText中用文本块(Chunk)、短语(Phrase)和段落(paragraph)处理文本。

文本块(Chunk)是处理文本的最小单位,有一串带格式(包括字体、颜色、大小)的字符串组成。如以下代码就是产生一个字体为HELVETICA、大小为10、带下划线的字符串:

Chunk chunk1= new Chunk("This text is underlined", FontFactory.getFont(FontFactory.HELVETICA, 12, Font.UNDERLINE));

短语(Phrase)由一个或多个文本块(Chunk)组成,短语(Phrase)也可以设定字体,但对于其中以设定过字体的文本块(Chunk)无效。通过短语(Phrase)成员函数add可以将一个文本块(Chunk)加到短语(Phrase)中,如:phrase6.add(chunk);

段落(paragraph)由一个或多个文本块(Chunk)或短语(Phrase)组成,相当于WORD文档中的段落概念,同样可以设定段落的字体大小、颜色等属性。另外也可以设定段落的首行缩进、对齐方式(左对齐、右对齐、居中对齐)。通过函数setAlignment可以设定段落的对齐方式, setAlignment的参数1为居中对齐、2为右对齐、3为左对齐,默认为左对齐。

四、表格处理

iText中处理表格的类为:com.lowagie.text.Table和com.lowagie.text.PDF.PDFPTable,对于比较简单的表格处理可以用com.lowagie.text.Table,但是如果要处理复杂的表格,这就需要 com.lowagie.text.PDF.PDFPTable进行处理。这里就类com.lowagie.text.Table进行说明。

类com.lowagie.text.Table的构造函数有三个:

①Table(int columns)

②Table(int columns, int rows)

③Table(Properties attributes)

参数columns、rows、attributes分别为表格的列数、行数、表格属性。创建表格时必须指定表格的列数,而对于行数可以不用指定。

建立表格之后,可以设定表格的属性,如:边框宽度、边框颜色、衬距(padding space即单元格之间的间距)大小等属性。下面通过一个简单的例子说明如何使用表格,代码如下:

1:Table table= new Table(3);

2:table.setBorderWidth(1);

3:table.setBorderColor(new Color(0, 0, 255));

4:table.setPadding(5);

5:table.setSpacing(5);

6:Cell cell= new Cell("header");

7:cell.setHeader(true);

8:cell.setColspan(3);

9:table.addCell(cell);

10:table.endHeaders();

11:cell= new Cell("example cell with colspan 1 and rowspan 2");

12:cell.setRowspan(2);

13:cell.setBorderColor(new Color(255, 0, 0));

14:table.addCell(cell);

15:table.addCell("1.1");

16:table.addCell("2.1");

17:table.addCell("1.2");

18:table.addCell("2.2");

19:table.addCell("cell test1");

20:cell= new Cell("big cell");

21:cell.setRowspan(2);

22:cell.setColspan(2);

23:table.addCell(cell);

24:table.addCell("cell test2");

运行结果如下:

header

example cell with colspan 1 and rowspan 2 1.1 2.1

1.2 2.2

cell test1 big cell

cell test2

代码1-5行用于新建一个表格,如代码所示,建立了一个列数为3的表格,并将边框宽度设为1,颜色为蓝色,衬距为5。

代码6-10行用于设定表格的表头,第7行cell.setHeader(true);是将该单元格作为表头信息显示;第8行 cell.setColspan(3);指定了该单元格占3列;为表格添加表头信息时,要注意的是一旦表头信息添加完了之后,必须调用 endHeaders()方法,如第10行,否则当表格跨页后,表头信息不会再显示。

代码11-14行是向表格中添加一个宽度占一列,长度占二行的单元格。

往表格中添加单元格(cell)时,按自左向右、从上而下的次序添加。如执行完11行代码后,表格的右下方出现2行2列的空白,这是再往表格添加单元格时,先填满这个空白,然后再另起一行,15-24行代码说明了这种添加顺序。

五、图像处理

iText中处理表格的类为com.lowagie.text.Image,目前iText支持的图像格式有:GIF, Jpeg, PNG, wmf等格式,对于不同的图像格式,iText用同样的构造函数自动识别图像格式。通过下面的代码分别获得gif、jpg、png图像的实例。

Image gif= Image.getInstance("vonnegut.gif");

Image jpeg= Image.getInstance("myKids.jpg");

Image png= Image.getInstance("hitchcock.png");

图像的位置

图像的位置主要是指图像在文档中的对齐方式、图像和文本的位置关系。IText中通过函数public void setAlignment(int alignment)进行处理,参数alignment为Image.RIGHT、Image.MIDDLE、Image.LEFT分别指右对齐、居中、左对齐;当参数alignment为Image.TEXTWRAP、Image.UNDERLYING分别指文字绕图形显示、图形作为文字的背景显示。这两种参数可以结合以达到预期的效果,如setAlignment(Image.RIGHT|Image.TEXTWRAP)显示的效果为图像右对齐,文字围绕图像显示。

图像的尺寸和旋转

如果图像在文档中不按原尺寸显示,可以通过下面的函数进行设定:

public void scaleAbsolute(int newWidth, int newHeight)

public void scalePercent(int percent)

public void scalePercent(int percentX, int percentY)

函数public void scaleAbsolute(int newWidth, int newHeight)直接设定显示尺寸;函数public void scalePercent(int percent)设定显示比例,如scalePercent(50)表示显示的大小为原尺寸的50%;而函数scalePercent(int percentX, int percentY)则图像高宽的显示比例。

如果图像需要旋转一定角度之后在文档中显示,可以通过函数public void setRotation(double r)设定,参数r为弧度,如果旋转角度为30度,则参数r= Math.PI/ 6。

六、中文处理

默认的iText字体设置不支持中文字体,需要下载远东字体包iTextAsian.jar,否则不能往PDF文档中输出中文字体。通过下面的代码就可以在文档中使用中文了:

BaseFont bfChinese= BaseFont.createFont("STSong-Light","UniGB-UCS2-H", BaseFont.NOT_EMBEDDED);

com.lowagie.text.Font FontChinese= new com.lowagie.text.Font(bfChinese, 12, com.lowagie.text.Font.NORMAL);

Paragraph pragraph=new Paragraph("你好", FontChinese);

java解析pdf使用哪种方式更精准

在Java中解析PDF,有多种方式可供选择,每种方式都有其特点,精准度也因具体需求而异。

一、使用Apache PDFBox

• Apache PDFBox是一个用于处理PDF文件的Java库。它提供了丰富的功能,可以精准地提取文本、图像、表单数据等。

•对于文本提取,它能够较好地保留PDF中原有的格式和内容。比如在解析包含复杂排版、表格、图表的PDF时,它能准确识别文本的位置和顺序。例如,对于一份技术文档类的PDF,其中有代码示例、公式等特殊格式内容,Apache PDFBox可以正确解析并提取出清晰准确的文本。

•在图像提取方面,它可以将PDF中的图像无损提取出来,并且能准确获取图像的位置和尺寸信息。

二、使用iText

• iText是一个广泛应用的Java PDF处理库。它在处理PDF文本时也具有较高的精准度。

•它支持对PDF进行各种操作,包括文本的添加、修改和提取。在解析文本时,能够适应不同字体、字号、颜色等设置,准确提取出可见文本。例如,对于一份商务合同类的PDF,其中可能包含多种字体和格式来区分条款、正文等,iText可以精准地识别并提取出各个部分的文本内容。

•同时,iText在处理PDF的页面布局和元素定位上也有不错的表现,能够准确判断文本在页面中的位置关系。

三、使用PDFBox结合PDFRenderer

• PDFRenderer是Java中的一个用于渲染PDF页面为图像的库。结合PDFBox使用,可以先将PDF页面渲染为图像,然后再对图像进行进一步的处理,如文本识别。

•这种方式在某些情况下可以提高精准度,特别是对于一些包含模糊文本、水印等难以直接通过文本提取库解析的内容。通过将页面转换为图像,可以利用图像识别技术来更准确地识别文本。例如,对于一份扫描生成的PDF,其中部分文字可能存在模糊或变形,通过这种方式可以先将页面转换为清晰的图像,再借助图像识别工具更精准地提取文本。

总体而言,Apache PDFBox和iText在常规的PDF文本解析方面表现较为出色且精准度较高。而PDFBox结合PDFRenderer则为处理一些特殊复杂的PDF提供了另一种有效的途径。具体选择哪种方式,需要根据实际的PDF文件内容和解析需求来决定。

Java怎样生成双层PDF

双层PDF生成系统是一种高效的技术,它允许用户将扫描的文档通过去污和纠偏处理,再通过OCR技术识别,从而生成一种特殊的PDF文件。这种PDF文件具有两层结构:上层是原始的图像,下层则是经过OCR处理后的文本。这样的设计不仅能够完全保留原始文档的版面效果,同时也支持文本的选择、复制和检索功能。

这种双层PDF文件非常适合存储在光盘、硬盘或磁盘阵列中,方便进行长期保存和管理。通过建立索引数据库,可以实现对这些文件的科学管理和检索。对于需要保存大量文档的企业或组织来说,这种技术能够大大提高工作效率,减少手动处理的时间和错误。

在Java中,生成双层PDF的过程相对复杂,需要使用到一些特定的库和工具。比如,可以使用Apache PDFBox和Tesseract OCR库来实现。首先,使用PDFBox读取扫描图像文件,然后进行去污和纠偏处理。接着,通过Tesseract将图像转换为文本,并将文本信息嵌入到PDF文件的下层。最后,将处理后的PDF文件保存,形成双层结构。

值得注意的是,为了确保双层PDF文件的质量,整个处理过程需要严格控制。例如,图像的扫描质量直接影响OCR识别的准确性,而OCR识别的准确性又决定了文本层的质量。因此,在实际操作中,需要对每个步骤进行细致的检查和调整,确保最终生成的双层PDF文件既美观又实用。

双层PDF生成系统在文档管理和检索方面具有独特的优势,尤其适用于需要长期保存和频繁检索的文档。对于需要处理大量文档的企业或组织来说,掌握这种技术可以大大提高工作效率,减少错误和重复劳动。

虽然生成双层PDF的过程需要一定的技术知识,但通过合理使用Java相关的库和工具,可以实现自动化处理,减轻工作人员的负担。此外,这种技术还可以与其他文档管理系统集成,进一步提高文档处理的效率。

文章分享结束,java pdf和java程序设计教程电子版的答案你都知道了吗?欢迎再次光临本站哦!

可莉事件图片 可莉事件原图高清全集下载傲之追猎者攻略 傲之追猎者原型