JQuery/PHP

巧妙使用PHP正则匹配图片地址

阿里云

最近在 WordPress 某项目中需要从文章内容中匹配多个图片,在实践的过程中掉进坑里爬了很久才出来。最开始我使用的正则表达式如下:

  1. <img.*?src=[\'|\"](.*?(?:[\.gif|\.jpg|\.png|\.jpeg]))[\'|\"].*?[\/]?>
也想出现在这里?联系我们
创客主机

然而使用这个正则表达式来匹配图片的话就会有一个缺陷,如果 src 里面的值不是一个标准的图片地址,那么很有可能就会匹配出错。比如下面的代码,内容中共有三个 img 标签,其中第二个 img 的 src 属性是 http://image-demo.oss-cn-hangzhou.aliyuncs.com/example.jpg?x-oss-process=image/resize,m_fixed,h_100,w_100

  1. <?php
  2. $content = '<p>我是第一段</p><p>我是第二段图片前文字<img src="http://image-demo.oss-cn-hangzhou.aliyuncs.com/example.jpg" />我是第三段图片前文字<img src="http://image-demo.oss-cn-hangzhou.aliyuncs.com/example.jpg?x-oss-process=image/resize,m_fixed,h_100,w_100" /><img src="http://image-demo.oss-cn-hangzhou.aliyuncs.com/example.jpg" /></p><p>我是第四段文字</p>';
  3.  
  4. $image_pattern = "/<img.*?src=[\'|\"](.*?(?:[\.gif|\.jpg|\.png|\.jpeg]))[\'|\"].*?[\/]?>/";
  5. preg_match_all( $image_pattern, $content, $matches );
  6.  
  7. var_dump( $matches );

执行结果如下,可以看到因为第二个 img 标签里面的 src 并不是一个预想的那样,导致匹配第二个 img 的时候直接把第三个 img 一起包含进来了。当然我这里只是举了一个阿里云 oss 图片处理地址,真实的情况里面可能还有更偏离预想的,比如可能干脆是一个错误的地址。

  1. array(2) {
  2.   [0]=>
  3.   array(2) {
  4.     [0]=>
  5.     string(72) "<img src="http://image-demo.oss-cn-hangzhou.aliyuncs.com/example.jpg" />"
  6.     [1]=>
  7.     string(191) "<img src="http://image-demo.oss-cn-hangzhou.aliyuncs.com/example.jpg?x-oss-process=image/resize,m_fixed,h_100,w_100" /><img src="http://image-demo.oss-cn-hangzhou.aliyuncs.com/example.jpg" />"
  8.   }
  9.   [1]=>
  10.   array(2) {
  11.     [0]=>
  12.     string(58) "http://image-demo.oss-cn-hangzhou.aliyuncs.com/example.jpg"
  13.     [1]=>
  14.     string(177) "http://image-demo.oss-cn-hangzhou.aliyuncs.com/example.jpg?x-oss-process=image/resize,m_fixed,h_100,w_100" /><img src="http://image-demo.oss-cn-hangzhou.aliyuncs.com/example.jpg"
  15.   }
  16. }

正确匹配方法

指导思想:我们匹配的时候,不要限定图片路径格式,也就是不管图片的 src 属性值是合规还是不合规,先匹配出来,再处理。所以使用下面的正则表达式即可。

  1. <img.*?src=[\'|\"](.*?)[\'|\"].*?[\/]?>

先把 img 标签里面的 src 值匹配出来,判断这个值是否合规,参考代码如下:

  1. <?php
  2. $content = '<p>我是第一段</p><p>我是第二段图片前文字<img src="http://image-demo.oss-cn-hangzhou.aliyuncs.com/example.jpg" />我是第三段图片前文字<img src="http://image-demo.oss-cn-hangzhou.aliyuncs.com/example.jpg?x-oss-process=image/resize,m_fixed,h_100,w_100" /><img src="http://image-demo.oss-cn-hangzhou.aliyuncs.com/example.jpg" /></p><p>我是第四段文字</p>';
  3.  
  4. $image_pattern = "/<img.*?src=[\'|\"](.*?)[\'|\"].*?[\/]?>/";
  5. preg_match_all( $image_pattern, $content, $matches );
  6.  
  7. if( !empty( $matches[1]) ){
  8. 	//循环匹配到的src
  9. 	foreach ($matches[1] as $src) {
  10. 		$src_real = strtok($src,'?'); //分割,去掉请求参数
  11. 		$ext = pathinfo( $src_real, PATHINFO_EXTENSION ); //获取拓展名
  12. 		if( in_array( $ext, ['jpg','jpeg','gif','png'] ) ){
  13. 			echo $src_real.PHP_EOL;
  14. 		}
  15. 	}
  16. }

输出结果符合要求,如下:

  1. http://image-demo.oss-cn-hangzhou.aliyuncs.com/example.jpg
  2. http://image-demo.oss-cn-hangzhou.aliyuncs.com/example.jpg
  3. http://image-demo.oss-cn-hangzhou.aliyuncs.com/example.jpg

巧妙使用 PHP 正则匹配图片地址

已有 450 人购买
查看演示升级 VIP立刻购买

收藏
(0)

发表回复

热销模板

Ashade - 作品展示摄影相册WordPress汉化主题
LensNews

本站承接 WordPress / PbootCMS / DedeCMS 等
系统建站、仿站、开发、定制等业务!