百度抓取图片比例-百度图片都是从哪抓取的呢？如题都是从哪抓取的？爱问知识人

百度图片都是从哪抓取的呢？

如题 都是从哪抓取的？

2***

提交回答

好评回答

确实来自百度网内和网外，最大的抓取量是百度空间，因为他们有自己的图片审核，比较放心自己的，所以你如果想让抓取到就去百度空间上传就行了

从***

2012-03-20 01:38:31

193 110 评论

提交评论

其他答案

  答：Ruby代码 
require 'rubygems' 
require 'hpricot' 
require 'open-uri' 
require 'net/http' 
       
class BaiduPicture   
    def initialize(url,size)   
        @urls = []   
        @size = size   
        @urls  e   
          p "exception in get_picture_elements" 
          p e   
            []   
        end 
    end 
# 获取图片   
    def get_picture(url)   
        get_picture_elements(url)。
  each do |link|   
            begin    
                href =  t_attribute("href")   
                if /^u。*/ =~ href。
  split("&")[1]   
                    pic_addr = href。split("&")[1]。split("=")[1]   
                    p pic_addr   
                    str = Net:: t( rse(URI。
  encode(pic_addr)))   
                  file =  w(pic_addr。split("/")。last,"wb")   
                  file。write(str)   
                     ose   
                else 
                    hole_link = " " + href   
                    p hole_link   
                    tmp = open(hole_link)   
                tmp_doc = Hpricot(tmp)   
                pic_tag = tmp_ t_element_by_id("main_pic")。
  get_elements_by_tag_name("img")。first   
                pic_addr = pic_ t_attribute("src")   
                str =    Net:: t( rse(URI。
  encode(pic_addr)))   
                file =  w(pic_addr。split("/")。last,"wb")   
                file。write str   
                 ose   
                end 
            rescue Exception => e   
                p "exception in get_picture" 
                next 
            end 
        end 
    end 
# 轮询页面   
def loop_pages   
    @urls。
  each do |url|   
      get_picture(url)   
      sleep(10)   
    end     
    p "pictures over" 
end 
end 
require 'rubygems'
require 'hpricot'
require 'open-uri'
require 'net/http'
    
class BaiduPicture
    def initialize(url,size)
        @urls = []
        @size = size
        @urls  e
          p "exception in get_picture_elements"
          p e
            []
        end
    end
# 获取图片
    def get_picture(url)
        get_picture_elements(url)。
  each do |link|
            begin 
                href =  t_attribute("href")
                if /^u。*/ =~ href。split("&")[1]
                    pic_addr = href。
  split("&")[1]。split("=")[1]
                    p pic_addr
                    str = Net:: t( rse(URI。encode(pic_addr)))
                  file =  w(pic_addr。
  split("/")。last,"wb")
                  file。write(str)
                     ose
                else
                    hole_link = " " + href
                    p hole_link
                    tmp = open(hole_link)
                tmp_doc = Hpricot(tmp)
                pic_tag = tmp_ t_element_by_id("main_pic")。
  get_elements_by_tag_name("img")。first
                pic_addr = pic_ t_attribute("src")
                str =    Net:: t( rse(URI。
  encode(pic_addr)))
                file =  w(pic_addr。split("/")。last,"wb")
                file。write str
                 ose
                end
            rescue Exception => e
                p "exception in get_picture"
                next
            end
        end
    end
# 轮询页面
def loop_pages
    @urls。
  each do |url|
      get_picture(url)
      sleep(10)
    end 
    p "pictures over"
end
end
Ruby代码 
 w(" ",10)。loop_pages 
 w(" ",10)。
  loop_pages抓取10页
这个url使用需要 
  
这样的格式，点击搜索结果的第二页连接能够得到这个连接
。

篾***

2012-03-19 23:49:57

203 111 评论

提交评论

来自百度网内和网外。网内是各个空间相册里的图片，网外是互联网上。百度只是将缩略图及其链接收录在检索数据库里，这个数据库并不存储图片，用户搜索图片时，系统根据用户提供的信息，在数据库里搜索出相应的图片，我们搜索图片时，先看到的是缩略图，点击后才是原图。

残***

2012-03-19 22:12:00

204 111 评论

提交评论

百度的图片都是爬虫从各个网站抓取来的，打开比喻，山有一伙强盗，他们会从各个地方打家劫舍，就就是他们的财产来源。百度的图片就是这样来的。爬虫去搜索所有的.jpg、.bmp等图片文件，判断文件名，然后添加进自己的数据库。

l***

2012-03-19 21:28:52

189 114 评论

提交评论

```
不得而知，俺也很关心介果。。。
```
全部
****

2012-03-19 21:21:34

173 117 评论
分享
提交评论

是不是想知道要怎样才能保存百度图片在自己电脑里，可以在图片上右击，选择[另存为]，然后选择存放地点即可。

松***

2012-03-19 21:18:40

187 114 评论

提交评论

类似问题

换一换

1

问：数学已知|a|=√2,|b|=3,a,

答：ab=|a||b|cos45°=3 则向量a+λb与λa+b的夹角是锐角时有： (a+λb)(λa+b)>0 则 λa²+(1+λ²)ab+...详情>>
2 win7色调标准的是多少？回答2
3 我的世界怎样登陆服务器回答2
4 三角函数已知a为锐角，且tan〔π/4回答2
5 百度的图片是从哪里来的？在百度里搜索出回答2
1

问：大阴唇在哪？什么颜色？

答：红色详情>>
2 问1些暗月问题?=...我家暗月里面怎回答2
3 节奏大师结算时GREAT数怎么打才能不回答2
4 百度图片上传我要上传照片回答2
5 计算机硬盘的存储名词解释有哪些？回答2
1

问：计算机硬盘的存储名词解释有哪些?

答：为了进一步提高效能，现在的厂商莲本都应用了分段式缓存技术(MultipleSegmentCache)，将缓冲区划分成多个/jH用来存储不同的写入数据，而不必为小...详情>>
2 谁有JJ的图片？谁有JJ的图片？回答2
3 如何安装微软楷体？？？？？？如何安装微回答2
4 BootVi软件主要的作用是什么？回答2
5 如何将图片和表格存储到mysql数据库中回答2
1

问：如何让网站在百度搜索结果带图片百度搜索

答：详情>>
2 我的图片是照片没有违规为什么都4天了还没回答2
3 怎么截影片的动态图片？我想截取影片的几回答2
4 南海影视城图片除了百度图片，在哪里还能回答2
5 A卡和N卡有哪些区别？回答2
1

问：大一挂科对出国留学美国有影响吗？如题，

答：详情>>

互联网相关知识
电脑网络技术
电脑网络

1

问：电脑网络电脑网络电脑网络

答：高手很难的问题详情>>
2 网络的创始人是谁呢？回答1
3 如何查看自己电脑的网络地址回答1
4 PING默认网关和DNS不通，上不了网，网卡灯亮的，为什么啊回答3
5 网络的进网络的进电脑买起了。该选择网络了。他们说宽带（就拿艾普来说）比电信AD... 回答1

百度图片都是从哪抓取的呢？

百度图片都是从哪抓取的呢？

如题都是从哪抓取的？
全部

其他答案

类似问题

互联网相关知识

相关推荐

【求助】关于华硕adsl 与 TP

根据医学资料记载

世界上海鸟多少种国内海鸟多少种

怎样管理好一个班？

笔记本电脑永远是解决笔记本故障的卡片屏幕...

xp电脑显示屏调节屏幕亮度怎么调节_XP...

计算机不能重新启动所有时间重新启动如何解...

如果笔记本不能上网，我该怎么办

现在移民需要多少钱(留学移民要多少钱)

高迪安集团公司的实力怎么样？

有人了解高迪安集团这个公司吗？

高迪安集团旗下的人工智能产业发展好吗？

高迪安这个公司现在旗下现在主要有哪些产业...

高迪安之前开发的第一个新房是哪个楼盘？

怎样把图片传到百度`

百度是抓取关键字还是网址

百度图片都是从哪抓取的呢？

百度图片里的图片怎么来的

快照问题

怎样发文章增大百度的抓取

怎么选择你网站的域名？如何让百度有效的抓...

百度快照抓取的规率有哪些？

可以从百度转载图片吗

什么是比例的项百度知道

热点检索

确定举报此问题

百度图片都是从哪抓取的呢？

百度图片都是从哪抓取的呢？ 如题 都是从哪抓取的？全部

其他答案 if(window.executeBaiduJs){ if(typeof(contingency) != "undefined" && contingency == "contingencyBd"){ var cpro_id = "u2022717"; document.write('<script type="text/javascript" src="https://cpro.baidustatic.com/cpro/ui/c.js"></scr'+'ipt>'); }else{ } }

类似问题

互联网 相关知识

相关推荐

热点检索

确定举报此问题

百度图片都是从哪抓取的呢？

如题都是从哪抓取的？
全部

其他答案

互联网相关知识