当前位置: 代码迷 >> 综合 >> 6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了
  详细解决方案

6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了

热度:53   发布时间:2023-12-17 12:21:11.0

欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直社区,学习,问答、求职一站式搞定!

对商业智能BI、大数据分析挖掘、机器学习,python,R等数据领域感兴趣的同学加微信:tsaiedu,并注明消息来源,邀请你进入数据爱好者交流群,数据爱好者们都在这儿。

作者:胡萝卜酱
公众号:经管人学数据分析

国庆7天长假,就问你们激不激动!

可是,出门游玩,走哪里都是人,人,人,人……。你的脑海里是否出现了以下画面:

3901436-a872d31bb0e4a249
image
3901436-b0737bdb85e4e2fd
image
3901436-afacab97a17e745c
image

为了方便大家的出游选择,小编爬取了去哪儿网上面的6000多个景点数据,包含景点评级、热度、销量等等数据,汇总成这篇出游参考指南。

爬虫


爬虫继续用的是胡萝卜酱最近的心头爱selenium,用法可以参考爬虫神器selenium之猫眼电影榜单实例。打开去哪儿网站,右键,分析网页。

3901436-ae9fd2b0de23c96c.gif
image.gif

我们需要的数据非常的清晰:

3901436-2fb38737307e7f13.gif
image.gif

话不多说,只要定位到自己想要的信息,那么代码非常简单。

<pre style="margin: 0px; padding: 0px; max-width: 100%; box-sizing: border-box; word-wrap: break-word !important; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: 0.544000029563904px; orphans: auto; text-align: justify; text-indent: 0px; text-transform: none; widows: 1; word-spacing: 0px; -webkit-text-stroke-width: 0px; font-size: 16px; color: rgb(62, 62, 62); line-height: inherit; background-color: rgb(255, 255, 255);">

1from tqdm import tqdm
2import time
3from selenium import webdriver
4from selenium.common.exceptions import TimeoutException, WebDriverException
5import pandas as pd
6import numpy as np
7position = ["北京","天津","上海","重庆","河北","山西","辽宁","吉林","黑龙江","江苏","浙江","安徽","福建","江西","山东","河南","湖北","湖南","广东","海南","四川","贵州","云南","陕西&#