Python如何爬取网页文本内容？我想爬取网页的内容然而，这样只爱问知识人

首页

电脑/网络

程序设计

Python如何爬取网页文本内容？

我想爬取网页的内容然而，这样只能获取到源代码。

孙***

提交回答

全部答案

  可以安装BeautifulSoup，然后查找DOM找到你要的文本标签例如是<div id="content"><p>文本内容</p></div>使用get_text()我用的python3from bs4 import BeautifulSoupfrom request。
  urllib import urlopenhtml = urlopen("网址")bsObj =BeautifulSoup(html,"html。parser")getP = bsObj。find("div",{"id":"content"})。
  find("p")contentText = getP。get_text()#contentText就是你要的文本内容print(ccontentText)可能会有错误，大概就是这么个意思可能你用别的库，或者python2会有点区别你还不会抓取文本内容，应该刚学，建议你先把基础内容学好，看书《python网络数据采集》,看教程"崔庆才的个人网站"这些东西网上很好查的，多查，查不到了再问。
  后面难的东西还很多，要想自学就要多自己动手祝你学有所成。

仰***

2019-06-20 12:00:26

0 0 评论

提交评论

类似问题

换一换

1

问：获取远程网页的源代码 winform windows程序

答：可以通过流的方式来获取数据 net名称空间详情>>
2 一切网页只能浏览不能复制,怎么才能复制这样的网页的内容回答2
3 怎么查看网页源代码？？回答2
4 怎么查看网页源代码？回答2
5 你们谁知道怎么获取源代码啊？回答2
1

问：vb怎么获取网页中的每个元素内容

答：如果这个元素有：ID,Name或TagName，那就最简单不过， GetElementByID或相应的函数就能得到，得到之后，你需要用这个元素的InnerHtm...详情>>
2 搜索到的网页链接如果不能访问，如何获取其内容？回答2
3 搜索到的网页链接如果不能访问，如何获取其内容？回答2
4 如何通过源代码下载网页视频如何利用源代码下载网页视频<b...回答2
5 你们谁知道怎么获取源代码啊？回答2
1

问：怎样获取软件的源代码？

答：已经生成的软件是没有源代码的　要源代码只能是向编程的要第一手代码!详情>>
2 如何打开网页源代码,并修改它回答2
3 为什么网页源代码是.psd格式的?回答2
4 python爬取网页数据教程在哪里下载？回答2
5 怎么获取protege中owl源代？回答2
1

问：什么是网页源代码？

答：详情>>
2 javascript 怎么获取指定url网页中的内？回答2
3 javascript 怎么获取指定url网页中的内？回答2
4 源代码怎么看？回答2
5 网页的源代码在哪里？回答2
1

问：vb怎么获取网页中的每个元素内？

答：详情>>
2 pixhawk源代码如何获？回答2
3 获取网页源代码出现乱码怎么办？回答2
4 一切网页只能浏览不能复制,怎么才能复制这样的网页的内容回答2
5 获取远程网页的源代码 winform windows程序回答2
1

问：javascript 怎么获取指定url网页中的内？

答：详情>>
2 怎么查看网页源代码？回答2
3 怎样获取软件的源代码？回答2
4 vb怎么获取网页中的每个元素内容回答2
5 如何用python爬取网页中隐藏的div内容？回答2

程序设计相关知识

Python如何爬取网页文本内容？

Python如何爬取网页文本内容？

我想爬取网页的内容然而，这样只能获取到源代码。
全部

全部答案

类似问题

程序设计相关知识

相关推荐

【求助】关于华硕adsl 与 TP

SO2为什么是极性分子而CO2不是？

罗马音和拼音

喝酒对乙肝疫苗注射有没有影响

笔记本电脑永远是解决笔记本故障的卡片屏幕...

xp电脑显示屏调节屏幕亮度怎么调节_XP...

计算机不能重新启动所有时间重新启动如何解...

如果笔记本不能上网，我该怎么办

现在移民需要多少钱(留学移民要多少钱)

高迪安集团公司的实力怎么样？

有人了解高迪安集团这个公司吗？

高迪安集团旗下的人工智能产业发展好吗？

高迪安这个公司现在旗下现在主要有哪些产业...

高迪安之前开发的第一个新房是哪个楼盘？

热点检索

确定举报此问题

Python如何爬取网页文本内容？

Python如何爬取网页文本内容？ 我想爬取网页的内容然而，这样只能获取到源代码。全部

全部答案 if(window.executeBaiduJs){ if(typeof(contingency) != "undefined" && contingency == "contingencyBd"){ var cpro_id = "u2022717"; document.write('<script type="text/javascript" src="https://cpro.baidustatic.com/cpro/ui/c.js"></scr'+'ipt>'); }else{ } }

类似问题

程序设计 相关知识

相关推荐

热点检索

确定举报此问题

Python如何爬取网页文本内容？

我想爬取网页的内容然而，这样只能获取到源代码。
全部

全部答案

程序设计相关知识