timgws / cleanhtml
快速且轻松地清除HTML文本,确保只留下最基本的内容
dev-master
2016-03-11 04:02 UTC
Requires
- ext-simplexml: *
- ext-xml: *
- ezyang/htmlpurifier: dev-master
Requires (Dev)
- phpunit/phpunit: 4.7.*@dev
This package is auto-updated.
Last update: 2024-09-08 11:36:14 UTC
README
自2012年末以来一直在清理HTML!
需求
- PHP 5.2+
- php-xml
如何安装
composer require timgws/cleanhtml
如何使用
use timgws\CleanHTML\CleanHTML; $tidy = new CleanHTML(); $output = $tidy->clean('<p><strong>I need a shower. I am dirty HTML.</strong>');
$output现在应包含
<h2>I need a shower. I am dirty HTML.</h2>
使用Clean函数将删除表格、任何您可能不希望看到的用户提交的HTML中的JavaScript或其他非友好项目。
如果您想看一些示例,最佳查看位置是一些CleanHTML测试
它做什么?
- 从HTML中移除额外空格
- 将多个
<br />
标签替换为段落标签 - 移除任何
<script>
标签 - 将任何
<h1>
标签重命名为<h2>
- 将
<p><strong>
标签更改为<h2>
- 将
<h2><strong>
替换为仅包含<h2>
标签 - 移除奇特的
<p><span>
标签 - 仅允许h1,h2,h3,h4,h5,p,strong,b,ul,ol,li,hr,pre,code标签使用HTML purifier
- 运行步骤3->7一次,以便捕获可能被允许的标签遗漏的任何内容
- 输出干净漂亮的HTML \o/