基于PhilGale92/docx原始工作的PHP Docx 解析器

0.1.1 2016-06-15 12:47 UTC

This package is not auto-updated.

Last update: 2019-10-22 19:28:12 UTC


README

此PHP解析器可以解析任何docx文件,并创建一个包含其结构、内容和样式的PHP数组。只需导入任何样式数据(如index.php中所示),使用单词样式名称和任何所需属性,然后运行解析器。

====

支持

  • Word样式
  • 段落
  • 文本缩进/制表符
  • 嵌套列表(内联列表)
  • 表格(垂直单元格合并 + 列跨度)
  • 图片(以及找到所需图片大小)
  • 超链接(支持mailto:)
  • 粗体/下划线/斜体文本
  • 文本框(解析器支持已添加,但未渲染)
  • 目录功能(您可能需要扩展docx类并修改->render()类)

====

已知错误

  • 使用以下模式的表格单元格无法正确渲染
示例(错误渲染)
单元格 1
单元格 2
--------
单元格 3
单元格 4

单元格 1 和 2 垂直合并。然后有一个边框,单元格 3 和 4 合并。渲染器无法区分它们之间没有标准单元格的多个垂直合并。

以下布局是可行的,因为单元格 3 是一个标准单元格,分隔了两个垂直合并

示例(正常工作)
单元格 1
单元格 2
--------
单元格 3
--------
单元格 4
单元格 5

====

注意事项

  • 图片以与Word中相同的尺寸显示,但包含的渲染类不包含调整原始图片文件大小的功能(因为该项目范围外)
  • 解析器在处理较大文档时可能需要一些时间
  • 在Word中修改文本以使其看起来像标题样式,并不等同于将其样式名称设置为'header'

====

需求

  • PHP 5.3或更高版本
  • PHP可写/tmp