Dataset之RentListingInquries:RentListingInquries(Kaggle竞赛)数据集的简介、下载、案例应用之详细攻略

目录

RentListingInquries比赛简介

RentListingInquries数据集下载

RentListingInquries案例应用


RentListingInquries比赛简介

竞赛官网: https://www.kaggle.com/c/two-sigma-connect-rental-listing-inquiries/overview

RentListingInquries比赛的描述。找到一个完美的地方打电话给你的新家应该比浏览无穷无尽的清单。RentHop通过使用数据对租赁清单的质量进行排序,使公寓搜索更加智能。但是,尽管寻找完美的公寓已经够困难的了,但通过编程来组织和理解所有可用的房地产数据就更难了。二西格玛和二西格玛风投的投资组合公司RentHop,邀请Kagglers在这场独特的招聘竞争中,释放他们的创意引擎,发掘商业价值。
      Two Sigma邀请您在本次招聘竞赛中发挥您的才能。Kagglers将根据列表的创建日期和其他特性预测新列表收到的查询数量。这样做将有助于RentHop更好地处理欺诈控制,识别潜在的上市质量问题,并让业主和代理商更好地了解租户的需求和偏好。
       Two Sigma一直处于将技术和数据科学应用于财务预测的前沿。尽管他们在金融领域的大数据、人工智能和机器学习方面取得的开创性进展,一直在推动该行业向前发展,就像所有其他科学进步一样,他们也受到不断进步的驱动。这一挑战为竞争对手提供了一个先睹为奇的机会,使他们得以在金融领域之外抢先了解二西格玛的数据科学工作。

这是Kaggle2017年举办的Two Sigma Connect: Rental Listing Inquiries竞赛。在这个竞赛中,你将根据列表内容,如文字描述、照片、卧室数量、价格等,来预测一个公寓租赁清单的受欢迎程度。数据来自renthop.com,一个公寓上市网站。这些公寓位于纽约市。目标变量interest_level由清单在网站上运行期间的查询次数定义。

1、数据集介绍

(1)、File descriptions
train.json - the training set
test.json - the test set
sample_submission.csv - a sample submission file in the correct format
images_sample.zip - listing images organized by listing_id (a sample of 100 listings)
Kaggle-renthop.7z - (optional) listing images organized by listing_id. Total size: 78.5GB compressed. Distributed by BitTorrent (Kaggle-renthop.torrent).

(2)、Data fields

  • bathrooms: number of bathrooms
  • bedrooms: number of bathrooms
  • building_id
  • created
  • description
  • display_address
  • features: a list of features about this apartment
  • latitude
  • listing_id
  • longitude
  • manager_id
  • photos: a list of photo links. You are welcome to download the pictures yourselves from renthop's site, but they are the same as imgs.zip.
  • price: in USD
  • street_address
  • interest_level: this is the target variable. It has 3 categories: 'high', 'medium', 'low'

根据公寓的listing 内容,预测纽约市某公寓租赁listing的受欢迎程度。
标签: interest_level,该listing被咨询的次数。

  • (1)、有三个取值:: 'high', 'medium', 'low'。
  • (2)、是一个多类分类任务。

Listing内容

  • bathrooms、bedrooms:浴室数目、卧室的数目
  • longitude、latitude:地理位置有关
  • display_address、street_address:地址有关
  • building_id、listing_id、manager_id
  • Created:创建日期
  • Description:更多描述信息
  • features: 公寓的一些特征描述
  • photos: a list of photo links
  • price:价格

2、比赛排行榜

RentListingInquries数据集下载

如有需要,可留言索取

RentListingInquries案例应用

ML之FE:利用FE特征工程对RentListingInquries(Kaggle竞赛)数据集实现房屋感兴趣程度的多分类预测
ML之FE:基于FE特征工程对RentListingInquries数据集进行预处理并导出为三种格式文件(csv格式/txt格式/libsvm稀疏txt格式)

Dataset之RentListingInquries:RentListingInquries(Kaggle竞赛)数据集的简介、下载、案例应用之详细攻略相关推荐

  1. Dataset之HiggsBoson:Higgs Boson(Kaggle竞赛)数据集的简介、下载、案例应用之详细攻略

    Dataset之HiggsBoson:Higgs Boson(Kaggle竞赛)数据集的简介.下载.案例应用之详细攻略 目录 Higgs Boson比赛简介 Higgs Boson数据集的下载 Hig ...

  2. Dataset之AllstateClaimsSeverity:AllstateClaimsSeverity数据集(Kaggle2016竞赛)的简介、下载、案例应用之详细攻略

    Dataset之AllstateClaimsSeverity:AllstateClaimsSeverity数据集(Kaggle2016竞赛)的简介.下载.案例应用之详细攻略 目录 AllstateCl ...

  3. Dataset之Pascal:Pascal竞赛及其Pascal VOC(VOC 2012、VOC 2007) 数据集的简介、下载、使用方法详细攻略

    Dataset之Pascal VOC:Pascal VOC(VOC 2012.VOC 2007) 数据集的简介.下载.使用方法详细攻略 目录 Pascal 竞赛 1.PASCAL VOC竞赛任务 2. ...

  4. Dataset:Big Mart Sales数据集的简介、下载、案例应用之详细攻略

    Dataset:Big Mart Sales数据集的简介.下载.案例应用之详细攻略 目录 Big Mart Sales数据集的简介 1.特征解释 Big Mart Sales数据集的下载 Big Ma ...

  5. Dataset之OttoGroup:OttoGroup数据集的简介、下载、案例应用之详细攻略

    Dataset之OttoGroup:OttoGroup数据集的简介.下载.案例应用之详细攻略 目录 OttoGroup数据集的简介 OttoGroup数据集的下载 OttoGroup数据集的案例应用 ...

  6. Dataset:titanic泰坦尼克号数据集/泰坦尼克数据集(是否获救二分类预测)的简介、下载、案例应用之详细攻略

    Dataset:titanic泰坦尼克号数据集/泰坦尼克数据集(是否获救二分类预测)的简介.下载.案例应用之详细攻略 目录 titanic(泰坦尼克号)数据集的简介 1.titanic数据集各字段描述 ...

  7. Dataset之JFT:JFT/FastEval14k数据集的简介、下载、案例应用之详细攻略

    Dataset之JFT:JFT数据集的简介.下载.案例应用之详细攻略 目录 JFT/FastEval14k数据集的简介 JFT数据集的下载 JFT数据集的案例应用 JFT/FastEval14k数据集 ...

  8. Dataset:机器学习中常用数据集下载链接集合之详细攻略

    Dataset:机器学习中常用数据集下载链接集合之详细攻略 目录 机器学习中常用数据集下载链接集合之详细攻略 sklearn.datasets数据集所有csv文件集合 seaborn-data数据集所 ...

  9. Dataset之DA:数据增强(Data Augmentation)的简介、方法、案例应用之详细攻略

    Dataset之DA:数据增强(Data Augmentation)的简介.方法.案例应用之详细攻略 目录 DA的简介 DA的方法 DA的案例应用 DA的简介 数据集增强主要是为了减少网络的过拟合现象 ...

最新文章

  1. 关于 OpenIdConnect 认证启用 HTTPS 回调 RedirectUri 不生效问题
  2. 新版CCNP中文版教材--ISCW
  3. 深入浅出统计学(十一)总体和样本的估计
  4. 线性代数可以速成吗_广播/学习吉他速成靠谱吗?真的可以速成吗?
  5. C++ STL 初步介绍01
  6. Bitfinex将向纽约总检察长办公室移交“被指控 8.5 亿美元资金挪用案”相关文件
  7. MySQL判断中文字符的方法(转)
  8. TensorFlow Serving安装笔记(仅限64位x86)
  9. Linux常用命令、权限管理和开发工具详细介绍
  10. 微信分享wx.config配置时遇到invalid signature错误的解决办法
  11. Java机器学习库(Java ML)(一、分类)
  12. linux设置自动获取ip命令,详解如何设置CentOS 7开机自动获取IP地址
  13. JWT结果功能用处简单介绍
  14. POP3,全名为“Post Office Protocol - Version 3”,即“邮局协议版本3”
  15. 个人经历:谈一谈的程序员求职途径
  16. luogu 1757 分组背包
  17. python——Matplotlib饼图、直方图的绘制
  18. BZOJ5473: 仙人掌
  19. Paper:可解释性之VI/PFI《All Models are Wrong, but Many are Useful: Learning a Variable’s Importance》翻译与解读
  20. (23)Linux基础-系统磁盘阵列raid

热门文章

  1. mysql和hive的sql语句,hive中使用sql语句需要注意的事项
  2. 大学生有必要学python吗_大学生学python到底有没有用?
  3. redis代码 发布订阅
  4. 更改结构体的内存字节对齐方式--经典
  5. Zynq器件的时钟系统
  6. Spring Cloud 微服务入门(二)--Spring Cloud 架构
  7. 分享这两年从事Linux系统运维行业的感受
  8. awk,sed,grep运用正则与扩展正则
  9. GitHub上读北大:覆盖AI高数等130多门课,讲义考题答案全都有,标星已3k+
  10. 为什么不应该重写 service 方法?