注册
闽南网 > 新闻中心 > 消费主张 > 正文

低价票难抢或被爬虫吃了 2018年春运航空票抢票太难

来源:科技日报 2017-12-27 09:16 http://www.mnw.cn/

  不到两个月,2018年春节要来了。

  “今年我得早下手,抢张回家的低价机票。”在北京打工的小王对科技日报记者说,由于老家在云南,春节机票太贵,他都选择坐两天两夜的火车回去,长途跋涉,苦不堪言。

  然而,就在小王摩拳擦掌,准备使出“洪荒之力”抢张便宜机票时,看到网上曝出这样一则消息:航空公司放出的低价机票,80%以上被票务公司的“爬虫”抢走,普通用户很少能买到。

  小王傻眼了,“爬虫”究竟是什么鬼?它又是怎么抢机票的?难道就没有办法治理吗?

  借助超链接信息抓取网页

  “‘爬虫’技术是实现网页信息采集的关键技术之一,通俗来说,‘爬虫’就是一段用来批量、自动化采集网站数据的程序,几乎不需要人工干预。”北京理工大学网络科学与技术研究院副教授闫怀志告诉科技日报记者。

  闫怀志介绍,“爬虫”又称网页“蜘蛛”、网络机器人,它是一种按照一定规则自动抓取网页信息的程序或者脚本,通常驻留在服务器上。在Web网页中,既包含可供用户阅读的文字、图片等信息,还包含一些超链接信息。网络“爬虫”正是借助这些超链接信息来不断抓取网络上的其他网页。

  “这种信息采集过程很像一个爬虫或蜘蛛在网络上漫游,网络‘爬虫’或网页‘蜘蛛’因此得名。”闫怀志说,“爬虫”最早应用在搜索引擎领域,比如谷歌、百度、搜狗等搜索引擎工具每天需要抓取互联网上数百亿的网页,它们需要借助庞大的“爬虫”集群来实现搜索功能。

  当前,“爬虫”已被广泛用于电子商务、互联网金融等诸多领域。比如,“爬虫”可以抓取航空公司官网的机票价格,发现低价或紧俏机票后,“爬虫”可以利用虚假客源的真实身份信息实现抢先预订。再有,很多互联网浏览器都推出了自己的抢票插件,以高订票成功率来推广浏览器。

  根据抓取任务和目标的不同,网络“爬虫”可大致分为批量型、增量型和垂直型。批量型“爬虫”的抓取范围和目标较为明确,可以是网页的设定数量,也可以是消耗时间的设定。增量型“爬虫”主要用于持续抓取更新的网页,以适应网页的不断变化。垂直型“爬虫”主要是用于特定主题内容或特定行业的网页。

相关阅读:
新闻 娱乐 福建 泉州 漳州 厦门
猜你喜欢:
热门评论:
频道推荐
  • 反对“中正路”改名!民进党强推“去蒋化”
  • 中国国民党嘉义县党部遭搜查 9人被带走2人
  • 罢免吴思瑶二阶冲刺!蓝营议员林杏儿再送23
  • 新闻推荐
    @所有人 多项民生礼包加速落地快来查收 三峡大坝变形?专家:又有人在恶意炒作 北京新一波疫情为什么没出现死亡病例? 戴口罩、一米线 疫情改变了哪些习惯? 呼伦贝尔现幻日奇观 彩虹光带环绕太阳
    视觉焦点
    石狮:秋风起,紫菜香 石狮:秋风起,紫菜香
    石狮环湾生态公园内粉黛乱子草盛放 石狮环湾生态公园内粉黛乱子草盛放
    精彩视频
    世遗少年说|江俞羲:千年梨园戏 童声传新韵(视频)
    世遗少年说|江俞羲:千年梨园戏 童声传新韵(视频)
    泉州晋江:特色民俗迎端午 水上掠鸭趣味多(视频)
    泉州晋江:特色民俗迎端午 水上掠鸭趣味多(视频)
    专题推荐
    关注泉城养老服务 打造幸福老年生活
    关注泉城养老服务 打造幸福老年生活

    闽南网推出专题报道,以图、文、视频等形式,展现泉州在补齐养老事业短板,提升养老服

    新征程,再出发——聚焦2021年全国两会
    2020福建高考招录
     
    48小时点击排行榜
    美国宣布对国际刑事法院4名法官实施制裁 丰泽区六届人大常委会召开第三十一次会议 丰泽区召开优化营商环境暨县域重点产业链 以军称对黎巴嫩真主党在贝鲁特南郊目标实 破除不正当交易!医药价格招采信用评价标 商务部:敦促美方彻底取消包括301关税在 乍得总统指示政府暂停向美国公民发放签证 北约年度大规模军演在拉脱维亚启动