lmerotta / docx
基于PHP的Docx解析器,基于PhilGale92/docx的原始工作
0.1.1
2016-06-15 12:47 UTC
This package is auto-updated.
Last update: 2024-09-09 06:00:58 UTC
README
这个基于PHP的解析器可以处理任何docx文件,并创建一个包含其结构、内容和样式信息的PHP数组。只需导入任何样式数据(如index.php中所示),使用单词样式名称和任何所需属性,然后运行解析器。
====
支持
- Word样式
- 段落
- 文本缩进/制表符
- 嵌套列表(内联列表)
- 表格(垂直单元格合并 + 跨列)
- 图像(查找所需图像大小)
- 超链接(支持mailto:)
- 粗体/下划线/斜体文本
- 文本框(解析器支持已添加,但未渲染)
- 目录功能(您可能需要扩展docx类并修改render()类)
====
已知问题
- 以下模式的表格单元格无法正确渲染
单元格1 + 2垂直合并。然后有一个边框,单元格3 + 4合并。渲染器无法区分没有标准单元格分隔的多个垂直合并。
以下布局是正常的,因为单元格3是标准单元格,分隔了两个垂直合并
====
注意事项
- 图像以与Word中相同的尺寸显示,但包含的渲染类不包含调整原始图像文件大小的功能(因为这不在这个项目范围内)
- 大型文档的解析可能需要一些时间
- 将Word中的文本修改为与标题样式外观相同,并不等同于将其样式名称设置为'header'
====
要求
- PHP 5.3或更高版本
- /tmp可由PHP写入