去除文章版权
//火车头采集器v9及以上 运行c#代码 using System; using System.Collections.Generic; using SpiderInterface; using System.Text.RegularExpressions; class LocoyCode{ /// <summary> /// 执行方法,不能修改类和方法名称。 /// </summary> /// <param name="content">标签内容</param> /// <param name="response">页面响应,包含了Url、原始Html等属性</param> /// <returns>返回处理后的标签内容</returns> public string Run(string content,ResponseEntry response){ List<string>duanluos=new List<string>(); Regex regex = new Regex("<p>[\\s\\S]*?</p>"); MatchCollection matchCollection = regex.Matches(content); foreach (object item in matchCollection) { duanluos.Add(item.ToString()); } duanluos.Remove(duanluos[duanluos.Count-1]); content=string.Join("", duanluos.ToArray()); return content; } } //移除最后一个段落