php版getElementById , 栈的查找匹配,html标签多层嵌套也很ok

功能: 成对匹配html标签对, 跟javascript的$.getElementById() 方法 一样.多层嵌套也很ok

不使用递归方法,而是利用栈的知识,通过位置回退方法、顺序进行匹配关闭标签。

<?php
/*
* 功能: 成对匹配html标签对, 跟javascript的$.getElementById() 方法 一样.
* 实现方法: 成对匹配html标签对(多层嵌套也能完整匹配)
        ( 没有用到递归, 而是通过位置回退方法、顺序进行匹配 )
* 参数:
@string: $content: 输入内容;
@string: $id 标签的id;
@string: $return_type   设定返回值的类型,
            可选返回 'endpos'(结束位置) 或者 'substr'(截取结果).
* 返回:  数字 或 字符串 , 取决于 $return_type的设置.
* @author: 王奇疏
*/
function getElementById( $content , $id , $return_type='substr' ) {
    // 匹配唯一标记的标签对
    if ( preg_match( '@<([a-z]+)[^>]*id=[\"\']?'.$id.'[\"\']?[^>]*>@i' , $content , $res ) ){
        $start = $next_pos = strpos( $content , $res[0] );
        ++$next_pos;
        $start_tag = '<'.$res[1]; // 开始标签
        $end_tag = '</'.$res[1].'>'; // 结束标签
        $i = 1;
        $j = 0; // 防死循环    
        // 只要计数大于0, 就继续查,查到计数器为0为止, 就是最终的关闭标签.
        while ( $i > 0 && $j < 1024 ){
            $p_start = stripos( $content , $start_tag , $next_pos );
            $p_end = stripos( $content , $end_tag , $next_pos );
            if ( false === $p_start && false !== $p_end ){
                $next_pos = $p_end + 1;
                break;
            }
            // 如果
            elseif ( $p_start > $p_end ){
                $next_pos = $p_end + 1;
                --$i;
            }
            else{
                $next_pos = $p_start + 1;
                ++$i;
            }
        }
        if ( $j == 1024 ){
            exit( '调用getElementById时出现错误::<font color="red">您的标签'.htmlspecialchars( "{$start_tag} id='{$id}'>" ).' 在使用时根本没有闭合,不符合xhtml,系统强制停止匹配</font>.' );
        }
        // 返回结果
        if ( 'substr' == $return_type ){
            return substr( $content , $start , $next_pos-$start + strlen( $end_tag ) );
        }
        elseif ( 'endpos' == $return_type ){
            return $next_pos + strlen( $end_tag ) - 1 ;
        }
        else{
            return false;
        }
    }
    else{
        return false;
    }
}
$str = '
    <div id="left" class="*xxx" style="float: left;width:520px; height: 200px; " >
        <div class="new_model1">
            <p> <a href="#" >title</a> </p>
        </div>
        <div class="new_model2">
            <p> <a href="#" >title</a> </p>
        </div>
        <div>
            dsss
            <div>dsss</div>    
            <div>dsss</div>    
            <div>dsss</div>    
        </div>    
        <!-- 多层嵌套 -->
        <div class="000"><div class="000"><div class="000"><div class="000"><div class="000"></div></div></div></div><div class="000"></div></div>
    </div>
    <div class="111"><div class="111"><div class="111"><div class="111"><div class="111"></div></div></div></div><div class="111"></div><div class="111"><div class="111"><div class="111"></div></div></div><div class="111"></div></div>
';
var_dump( getElementById( $str , 'left' ) );


输出结果:
    <div id="left" class="*xxx" style="float: left;width:520px; height: 200px; " >
           ...
        <!-- 多层嵌套 -->
        <div class="000"><div class="000"><div class="000"><div class="000"><div class="000"></div></div></div></div><div class="000"></div></div>
    </div>

 多层嵌套的结果符合预期。欢迎测试如有bug留言。


本文转载自: http://www.cnblogs.com/wangqishu/archive/2012/10/27/2742716.html

老刘博客
请先登录后发表评论
  • 最新评论
  • 总共0条评论
  • 老刘博客 laoliu.pro © 2018-2019 版权所有
  • 辽ICP备19003301号-1