主页 > 2019免费公开会员料 >

我想抽取网页中的文本例如网易新闻中的新闻内容但是我看了网页源

  我想抽取网页中的文本,例如网易新闻中的新闻内容,但是我看了网页源代码,大部分是javascript代码。

  百度知道电脑/网络编程语言JavaScript

  我想抽取网页中的文本,118资料区,例如网易新闻中的新闻内容,但是我看了网页源代码,大部分是javascript代码。

  并且大部分是广告和我不关心的内容,有什么办法能够只让我提取出新闻内容?...

  并且大部分是广告和我不关心的内容,有什么办法能够只让我提取出新闻内容?

  可选中1个或多个下面的关键词,搜索相关资料。也可直接点“搜索资料”搜索整个问题。

  好的,我试试,是不是每个新闻网站的格式都不一样,要每个网站都单独处理。是的,这个确实是不方便的地方,不过为了便于维护人员读,一般新闻的主要的内容所在的标签的class都累死与content,con,例如新浪的是blkContainer,网易endContent,美了网cont等,可以自己摸索或写正则

  是想抓取别人的数据吧。这个可以用正则表达式抓取的。不过也要有一定的规律性,不然也不好抓。

阅读本文的人还阅读:

ASP新闻发布系统源码