当前位置 : 主页 > 网页制作 > html >

获取HTML中所有图片的 URL

来源:互联网 收集:自由互联 发布时间:2021-06-12
/// summary /// 获取HTML中所有图片的 URL /// /summary /// param name="strHtml" HTML代码 /param /// returns 图片的URL列表 /returns public static string [] GetHtmlImageUrlArr( string strHtml) { // 定义正则表达式用来匹配
/// <summary>
        /// 获取HTML中所有图片的 URL
        /// </summary>
        /// <param name="strHtml">HTML代码</param>
        /// <returns>图片的URL列表</returns>
        public static string[] GetHtmlImageUrlArr(string strHtml)
        {
            // 定义正则表达式用来匹配 img 标签   
            Regex regImg = new Regex(@"<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*[""‘]?[\s\t\r\n]*(?<imgUrl>[^\s\t\r\n""‘<>]*)[^<>]*?/?[\s\t\r\n]*>", RegexOptions.IgnoreCase);

            // 搜索匹配的字符串   
            MatchCollection matches = regImg.Matches(strHtml);
            int i = 0;
            string[] sUrlarr = new string[matches.Count];

            // 取得匹配项列表   
            foreach (Match match in matches)
                sUrlarr[i++] = match.Groups["imgUrl"].Value;
            return sUrlArr;
        }
网友评论