timgws/cleanhtml

快速且轻松地清除HTML文本,确保只留下最基本的内容

dev-master 2016-03-11 04:02 UTC

This package is auto-updated.

Last update: 2024-09-08 11:36:14 UTC


README

Test Coverage Code Climate

自2012年末以来一直在清理HTML!

需求

  • PHP 5.2+
  • php-xml

如何安装

    composer require timgws/cleanhtml

如何使用

use timgws\CleanHTML\CleanHTML;
$tidy = new CleanHTML();
$output = $tidy->clean('<p><strong>I need a shower. I am dirty HTML.</strong>');

$output现在应包含

<h2>I need a shower. I am dirty HTML.</h2>

使用Clean函数将删除表格、任何您可能不希望看到的用户提交的HTML中的JavaScript或其他非友好项目。

如果您想看一些示例,最佳查看位置是一些CleanHTML测试

它做什么?

  1. 从HTML中移除额外空格
  2. 将多个<br />标签替换为段落标签
  3. 移除任何<script>标签
  4. 将任何<h1>标签重命名为<h2>
  5. <p><strong>标签更改为<h2>
  6. <h2><strong>替换为仅包含<h2>标签
  7. 移除奇特的<p><span>标签
  8. 仅允许h1,h2,h3,h4,h5,p,strong,b,ul,ol,li,hr,pre,code标签使用HTML purifier
  9. 运行步骤3->7一次,以便捕获可能被允许的标签遗漏的任何内容
  10. 输出干净漂亮的HTML \o/