R语言中利用XML进行数据抓取时,报错Error: failed to load external entity。
可以结合RCurl库进行数据抓取。
示例代码如下:
library(XML)
library(RCurl)
urlData = paste0("http://www.amazon.cn/gp/bestsellers/digital-text/116169071/ref=sa_menu_kindle_l3_116169071#",1:5)
URL <- getURL(urlData)
Sys.sleep(runif(1,1,2))
doc <- htmlParse(URL[1], encoding = "UTF-8")
至于为什么报错,有待分析!
本文介绍使用R语言中的XML和RCurl库从Amazon网站抓取数据的方法,并提供了一段示例代码。针对出现的Error: failed to load external entity错误进行了初步探讨。

7151

被折叠的 条评论
为什么被折叠?



