Asp.Net 页面中 PDF 文件的读取方法
2014-10-08来源:易贤网

注意 一定要引用这个两个命名空间

using org.pdfbox.pdmodel;

using org.pdfbox.util;

//PDF 文件读取

//FileInfo file = new FileInfo(Server.MapPath("file\\巅峰销售心理学.pdf"));

//FileInfo txtfile = new FileInfo(Server.MapPath("file\\index.txt"));//文件名不可相同

//pdf2txt(file,txtfile);

/// <summary>

/// PDF 文件读取方法

/// </summary>

/// <param name="file"></param>

/// <param name="txtfile"></param>

public void pdf2txt(FileInfo file, FileInfo txtfile)

{

PDDocument doc = PDDocument.load(file.FullName);

PDFTextStripper pdfStripper = new PDFTextStripper();

String txt = pdfStripper.getText(doc);

StreamWriter swPdfChange = new StreamWriter(txtfile.FullName, false, Encoding.GetEncoding("gb2312"));

this.div1.InnerHtml += txt.Replace("\r", "&nbsp;").Replace("\n", "<br>");

swPdfChange.Close();

}

更多信息请查看IT技术专栏

2025公考·省考培训课程试听预约报名

  • 报班类型
  • 姓名
  • 手机号
  • 验证码
推荐信息