📜  pdf 到 word 转换器 - TypeScript (1)

📅  最后修改于: 2023-12-03 15:18:17.115000             🧑  作者: Mango

PDF to Word Converter - TypeScript

简介

PDF to Word Converter - TypeScript 是一款基于 TypeScript 的开源软件,用于将 PDF 文件转换为 Word 文档。该软件使用了 PDF.js 作为 PDF 解析器,将 PDF 文件中的内容解析为 HTML,再使用 docx 库生成对应的 Word 文档。

特性
  • 基于 TypeScript,代码更加稳定、健壮;
  • 使用 PDF.js 解析 PDF 文件,支持解析多种 PDF 文件;
  • 将 PDF 文件解析为 HTML 文件,方便后续处理;
  • 使用简单、灵活易扩展的 docx 库生成 Word 文档;
  • 支持多种配置参数,如页边距、字体大小、颜色等。
安装
npm 安装
npm install pdf-to-word-ts
使用
TypeScript 示例
import { PDF2WordConverter } from 'pdf-to-word-ts';

const filePath = 'test.pdf'; // 待转换的 PDF 文件路径
const outputFilePath = 'output.docx'; // Word 文件输出路径
const options = { margin: { top: 720, bottom: 720, left: 720, right: 720 } }; // 转换选项

const converter = new PDF2WordConverter();
converter.convert(filePath, outputFilePath, options).then(() => {
  console.log('转换成功');
}).catch((err) => {
  console.error('转换失败', err);
});
JavaScript 示例
const { PDF2WordConverter } = require('pdf-to-word-ts');

const filePath = 'test.pdf'; // 待转换的 PDF 文件路径
const outputFilePath = 'output.docx'; // Word 文件输出路径
const options = { margin: { top: 720, bottom: 720, left: 720, right: 720 } }; // 转换选项

const converter = new PDF2WordConverter();
converter.convert(filePath, outputFilePath, options).then(() => {
  console.log('转换成功');
}).catch((err) => {
  console.error('转换失败', err);
});
API
PDF2WordConverter

PDF2WordConverter 用于将 PDF 文件转换为 Word 文档。

构造函数

constructor();

convert

转换 PDF 文件为 Word 文档。

async convert(filePath: string, outputFilePath: string, options?: ConvertOptions): Promise<void>;
  • 参数:
    • filePath:(必选)待转换的 PDF 文件路径;
    • outputFilePath:(必选)转换后的 Word 文件输出路径;
    • options:(可选)转换选项;
  • 返回值:返回 Promise,表示文件转换结果。

ConvertOptions

转换选项。

interface ConvertOptions {
  margin?: MarginOptions; // 页面边距,单位:磅,1 磅=1/72 英寸,默认值 { top: 720, bottom: 720, left: 720, right: 720 };
  fontSize?: number; // 字体大小,单位:磅,默认值 12;
  color?: string; // 字体颜色,默认值 #000000;
  debug?: boolean; // 是否开启调试模式,默认值 false;
}

MarginOptions

边距选项。

interface MarginOptions {
  top?: number; // 上边距,单位:磅,默认值 720;
  bottom?: number; // 下边距,单位:磅,默认值 720;
  left?: number; // 左边距,单位:磅,默认值 720;
  right?: number; // 右边距,单位:磅,默认值 720;
}
贡献

欢迎为 PDF to Word Converter - TypeScript 贡献代码!如果您对本项目感兴趣,可以提供代码、提出问题、发布 PR 或在 GitHub 上 star 本项目。

开源许可

PDF to Word Converter - TypeScript 使用 MIT 开源协议。