/// summary /// 获取HTML中所有图片的 URL /// /summary /// param name="strHtml" HTML代码 /param /// returns 图片的URL列表 /returns public static string [] GetHtmlImageUrlArr( string strHtml) { // 定义正则表达式用来匹配
/// <summary> /// 获取HTML中所有图片的 URL /// </summary> /// <param name="strHtml">HTML代码</param> /// <returns>图片的URL列表</returns> public static string[] GetHtmlImageUrlArr(string strHtml) { // 定义正则表达式用来匹配 img 标签 Regex regImg = new Regex(@"<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*[""‘]?[\s\t\r\n]*(?<imgUrl>[^\s\t\r\n""‘<>]*)[^<>]*?/?[\s\t\r\n]*>", RegexOptions.IgnoreCase); // 搜索匹配的字符串 MatchCollection matches = regImg.Matches(strHtml); int i = 0; string[] sUrlarr = new string[matches.Count]; // 取得匹配项列表 foreach (Match match in matches) sUrlarr[i++] = match.Groups["imgUrl"].Value; return sUrlArr; }