西雅图治安

介绍 (Introduction)

Airbnb provides an online platform for hosts to accommodate guests with short-term lodging. Guests can search for lodging using filters such as lodging type, dates, location, and price, and can search for specific types of homes, such as bed and breakfasts, unique homes, and vacation homes.

Airbnb为房东提供了一个在线平台,可以为短期住宿的客人提供住宿。 访客可以使用诸如住宿类型,日期,位置和价格之类的过滤器搜索住宿,还可以搜索特定类型的房屋,例如住宿加早餐旅馆,独特房屋和度假屋。

By reviewing the 2016 Seattle Airbnb Open Data, I will explore some interesting questions related to the lodging availability, pricing, and reviews. in addition I will try to predict the price of home listings based on the descriptive and non descriptive features.

通过回顾2016 Seattle Airbnb开放数据 ,我将探索一些与住宿可用性,价格和评论有关的有趣问题。 此外,我将尝试根据描述性和非描述性功能预测房屋清单的价格。

While analyzing the data I found that 63% of the listings are one-bedroom property, 42% accommodates 2 guests, 37% has a strict cancelation policy and 30% has a flexible cancelation policy. Capitol Hill and Ballard are the most popular neighborhoods in the listings.

在分析数据时,我发现63%的房源为一居室物业,42%的客房可容纳2位客人,37%的房屋实行严格的取消政策,30%的房屋实行灵活的取消政策。 国会山和巴拉德(Ballard)是清单中最受欢迎的街区。

一年中最繁忙的时间是西雅图? 价格上涨多少? (What are the busiest times of the year to visit Seattle? By how much do prices spike?)

Summer season is more expensive among the year, June July and August are showing the three highest average price per home listing than the other months. The price keeps going from January (122 average) and reached the peak on July (152 average), costing on average over 23.7% than January.

一年中的夏季价格更高,6月,7月和8月是每个房屋挂牌价格最高的三个月。 价格从1月份开始(平ASP格为122),并在7月份达到峰值(平ASP格为152),比1月份平ASP格高出23.7%。

When I observed the rate of change of average price of lodging listings for each month, I discovered that the biggest rate of change occurred in June and the lowest in September. The first 7 months of the year also experienced a positive percentage rate of change and then subsequently August, September, October and November experienced a negative rate of change and the rate of change becomes positive again in December. This shows that there is a significant dip for around 4 months in the fall until December.

当我观察到每个月房租平ASP格的变化率时,我发现最大的变化率发生在6月 ,而最低的变化发生在9月。 一年的前七个月也经历了正百分比变化率,然后随后的八月,九月,十月和十一月经历了负变化率,并且变化率在12月再次变为正。 这表明秋季直到12月的4个月左右都有明显的下降。

By analyzing the reviews data, I found that the number of home listings have been exponentially increased from 2009 to 2015 and were directly correlated with the number of visitors.

通过分析评论数据,我发现从2009年到2015年 ,房屋列表的数量呈指数增长,并且与访客数量直接相关。

西雅图最受欢迎的Airbnb房源是什么? (What is the most popular Seattle neighborhood for Airbnb listings?)

By analyzing the listings data, I found that Capitol Hill and Ballard are the most popular neighborhoods in the Seattle listings, the below bar chart shows that Capitol Hill has 10.31 % Seattle listings, followed by Ballard with 6.26% of the listings.

通过分析清单数据,我发现Capitol Hill和Ballard是西雅图清单中最受欢迎的社区,下面的条形图显示Capitol Hill拥有10.31%西雅图清单,其次是Ballard,占6.26%。

我们可以预测西雅图Airbnb房源的价格吗? 哪些方面与价格有很好的关联? (Can we predict a price of Seattle Airbnb listings? What aspects correlate well to price?)

It could be possible to predict the price of Seattle Airbnb listings, however its not as straight forward as it seems to be. For modeling of price prediction, I tried three algorithms, ‘Linear Regression’, ‘Random Forest Regressor’, and ‘Gradient Boosting Regressor’.

可以预测西雅图Airbnb房源的价格,但是它并不像看起来那样简单。 为了对价格预测建模,我尝试了三种算法:“线性回归”,“随机森林回归”和“梯度提升回归”。

Compared to other two models, Linear Regression achieved the best result this time where it gave an accuracy of 56% on the training set and 58% on our test set. This is due to the lack of historical data and the data requiring a huge amount of transformation to be more accurate.

与其他两个模型相比,线性回归这次获得了最佳结果, 其训练集的准确性为56%,测试集的准确性为58%。 这是由于缺乏历史数据,并且数据需要大量转换才能更准确。

Further analysis, I manage to find some factors that cloud influence the price of a listing in order of importance are:

进一步分析后,我设法找到一些因素会影响重要性,这些因素会影响上市价格:

· Number of bedrooms

·卧室数量

· Number of accommodates

·容纳人数

· Number of Bathrooms

·浴室数量

· Room Type

· 房型

· Listing description

·清单说明

· Listing Neighborhood

·列出邻居

结论 (Conclusion)

In this article, I tried to analyze the 2016 Airbnb Seattle data in order to answer the below questions:

在本文中,我试图分析2016年Airbnb Seattle数据,以回答以下问题:

1. What are the busiest times of the year to visit Seattle? By how much do prices spike?

1.一年中最繁忙的时间是西雅图? 价格上涨多少?

2. Is there a general upward trend of both new Airbnb listings and total Airbnb visitors to Seattle?

2.新的Airbnb房源和西雅图的Airbnb访客总数是否都有总体上升趋势?

3. What is the most populate Seattle neighborhood for Airbnb listings?

3. Airbnb房源在西雅图人口最多的地区是什么?

4. Can we predict a price of Seattle Airbnb listings? What aspects correlate well to price?

4.我们可以预测西雅图Airbnb房源的价格吗? 哪些方面与价格有很好的关联?

To see more about this analysis, see the link to my Github available here

要了解有关此分析的更多信息,请参见此处的我的Github链接。

翻译自: https://medium.com/analytics-vidhya/airbnb-seattle-homes-fa73adb2a477

西雅图治安


http://www.taodudu.cc/news/show-997526.html

相关文章:

  • 创意产品 分析_使用联合分析来发展创意
  • 多层感知机 深度神经网络_使用深度神经网络和合同感知损失的能源产量预测...
  • 使用Matplotlib Numpy Pandas构想泰坦尼克号高潮
  • pca数学推导_PCA背后的统计和数学概念
  • 鼠标移动到ul图片会摆动_我们可以从摆动时序分析中学到的三件事
  • 神经网络 卷积神经网络_如何愚弄神经网络?
  • 如何在Pandas中使用Excel文件
  • tableau使用_使用Tableau升级Kaplan-Meier曲线
  • numpy 线性代数_数据科学家的线性代数—用NumPy解释
  • 数据eda_银行数据EDA:逐步
  • Bigmart数据集销售预测
  • dt决策树_决策树:构建DT的分步方法
  • 已知两点坐标拾取怎么操作_已知的操作员学习-第3部分
  • 特征工程之特征选择_特征工程与特征选择
  • 熊猫tv新功能介绍_熊猫简单介绍
  • matlab界area_Matlab的数据科学界
  • hdf5文件和csv的区别_使用HDF5文件并创建CSV文件
  • 机器学习常用模型:决策树_fairmodels:让我们与有偏见的机器学习模型作斗争
  • 100米队伍,从队伍后到前_我们的队伍
  • mongodb数据可视化_使用MongoDB实时可视化开放数据
  • Python:在Pandas数据框中查找缺失值
  • Tableau Desktop认证:为什么要关心以及如何通过
  • js值的拷贝和值的引用_到达P值的底部:直观的解释
  • struts实现分页_在TensorFlow中实现点Struts
  • 钉钉设置jira机器人_这是当您机器学习JIRA票证时发生的事情
  • 小程序点击地图气泡获取气泡_气泡上的气泡
  • PopTheBubble —测量媒体偏差的产品创意
  • 面向Tableau开发人员的Python简要介绍(第3部分)
  • pymc3使用_使用PyMC3了解飞机事故趋势
  • 吴恩达神经网络1-2-2_图神经网络进行药物发现-第2部分

西雅图治安_数据科学家对西雅图住宿业务的分析相关推荐

  1. 数据探查_数据科学家,开始使用探查器

    数据探查 Data scientists often need to write a lot of complex, slow, CPU- and I/O-heavy code - whether y ...

  2. 数据科学家 数据工程师_数据科学家实际上赚了多少钱?

    数据科学家 数据工程师 目录 (Table of Contents) Introduction介绍 Junior Data Scientist初级数据科学家 Mid-Level Data Scient ...

  3. 面向数据科学家的实用统计学_数据科学家必知的统计数据

    面向数据科学家的实用统计学 Beginners usually ignore most foundational statistical knowledge. To understand differ ...

  4. 数据科学家 数据工程师_数据科学家应该对数据进行版本控制的4个理由

    数据科学家 数据工程师 While working in a software project it is very common and, in fact, a standard to start ...

  5. 边际概率条件概率_数据科学家解释的边际联合和条件概率

    边际概率条件概率 Probability plays a very important role in Data Science, as Data Scientist regularly attemp ...

  6. hadoop将消亡_数据科学家:适应还是消亡!

    hadoop将消亡 Harvard Business Review marked the boom of Data Scientists in their famous 2012 article &q ...

  7. 快速近似最近邻算法_数据科学家指南,以选择最佳近似最近邻算法

    快速近似最近邻算法 by Braden Riggs and George Williams (gwilliams@gsitechnology.com) Braden Riggs和George Will ...

  8. 知识产权大数据平台_数据科学家的知识产权

    知识产权大数据平台 Data Scientists use software they didn't write and data they don't own pretty much all the ...

  9. ipynb是什么文件_数据科学家的神器:为什么大家都用Kaggle?

    全文共2451字,预计学习时长7分钟 图源:viaboxx 学习数据科学绝非易事.能找到一个可以分享代码.数据和想法的社区对我们的学习大有裨益,有一个地方汇聚了这些特质,那就是Kaggle. 我在大学 ...

最新文章

  1. Qt中如何改变三角形图形项的包围盒
  2. 服务器温度3d显示,智能问答助手、3D可视化展示,腾讯医典“黑科技”助力科普更有温度...
  3. 软考下午题详解---uml图
  4. SAP RETAIL 特征参数文件(Characteristic Profile) II
  5. 使用beanUtils操纵bean的属性
  6. 关于错误的那点事——惨不忍睹的错误
  7. 2016c语言模拟试卷一,2016年9月计算机二级C语言考试预测试题及答案(4)
  8. js vue中得延时器_Vue.js实现时分秒倒计时
  9. 生产上oracle扩展表空间,oracle基于裸设备(raw device)扩充表空间
  10. Linux网络编程常见面试题
  11. 80后小学计算机课上的游戏,80后最值得回味的15个经典课间游戏(组图)
  12. 种业创新深圳品种 国稻种芯·中国水稻节:广东海水稻获成果
  13. 《Data Algorithm》读书笔记七 — 购物篮分析
  14. wordpress插件_2020年5个最佳WordPress电子商务插件比较
  15. 均匀球体模型的重力异常正演
  16. 【图像配准】多图配准/不同特征提取算法/匹配器比较测试
  17. 两数之和(LeetCode)
  18. dvi dp hdmi_HDMI vs DisplayPort vs DVI:您要在新计算机上使用哪个端口?
  19. 公司担心 DDoS 攻击对客户的挫败感和品牌损害
  20. 2022年茶艺师(中级)报名考试及茶艺师(中级)作业考试题库

热门文章

  1. create-react-app项目使用假数据
  2. 551. Student Attendance Record I 从字符串判断学生考勤
  3. SQL Server需要监控哪些计数器 ---指尖流淌
  4. 砝码称重 洛谷 1441
  5. 线段树(区间更改,区间查最值)模板
  6. 关于meta便签详解
  7. MVC 页面传参到另一个页面
  8. 详解linux下安装python3环境
  9. redis本地及远程登录
  10. 关于img 403 forbidden的一些思考