Dataset之RentListingInquries:RentListingInquries(Kaggle竞赛)数据集的简介、下载、案例应用之详细攻略
Dataset之RentListingInquries:RentListingInquries(Kaggle竞赛)数据集的简介、下载、案例应用之详细攻略
目录
RentListingInquries比赛简介
RentListingInquries数据集下载
RentListingInquries案例应用
RentListingInquries比赛简介
竞赛官网: https://www.kaggle.com/c/two-sigma-connect-rental-listing-inquiries/overview
RentListingInquries比赛的描述。找到一个完美的地方打电话给你的新家应该比浏览无穷无尽的清单。RentHop通过使用数据对租赁清单的质量进行排序,使公寓搜索更加智能。但是,尽管寻找完美的公寓已经够困难的了,但通过编程来组织和理解所有可用的房地产数据就更难了。二西格玛和二西格玛风投的投资组合公司RentHop,邀请Kagglers在这场独特的招聘竞争中,释放他们的创意引擎,发掘商业价值。
Two Sigma邀请您在本次招聘竞赛中发挥您的才能。Kagglers将根据列表的创建日期和其他特性预测新列表收到的查询数量。这样做将有助于RentHop更好地处理欺诈控制,识别潜在的上市质量问题,并让业主和代理商更好地了解租户的需求和偏好。
Two Sigma一直处于将技术和数据科学应用于财务预测的前沿。尽管他们在金融领域的大数据、人工智能和机器学习方面取得的开创性进展,一直在推动该行业向前发展,就像所有其他科学进步一样,他们也受到不断进步的驱动。这一挑战为竞争对手提供了一个先睹为奇的机会,使他们得以在金融领域之外抢先了解二西格玛的数据科学工作。
这是Kaggle2017年举办的Two Sigma Connect: Rental Listing Inquiries竞赛。在这个竞赛中,你将根据列表内容,如文字描述、照片、卧室数量、价格等,来预测一个公寓租赁清单的受欢迎程度。数据来自renthop.com,一个公寓上市网站。这些公寓位于纽约市。目标变量interest_level由清单在网站上运行期间的查询次数定义。
1、数据集介绍
(1)、File descriptions
train.json - the training set
test.json - the test set
sample_submission.csv - a sample submission file in the correct format
images_sample.zip - listing images organized by listing_id (a sample of 100 listings)
Kaggle-renthop.7z - (optional) listing images organized by listing_id. Total size: 78.5GB compressed. Distributed by BitTorrent (Kaggle-renthop.torrent).
(2)、Data fields
- bathrooms: number of bathrooms
- bedrooms: number of bathrooms
- building_id
- created
- description
- display_address
- features: a list of features about this apartment
- latitude
- listing_id
- longitude
- manager_id
- photos: a list of photo links. You are welcome to download the pictures yourselves from renthop's site, but they are the same as imgs.zip.
- price: in USD
- street_address
- interest_level: this is the target variable. It has 3 categories: 'high', 'medium', 'low'
根据公寓的listing 内容,预测纽约市某公寓租赁listing的受欢迎程度。
标签: interest_level,该listing被咨询的次数。
- (1)、有三个取值:: 'high', 'medium', 'low'。
- (2)、是一个多类分类任务。
Listing内容:
- bathrooms、bedrooms:浴室数目、卧室的数目
- longitude、latitude:地理位置有关
- display_address、street_address:地址有关
- building_id、listing_id、manager_id
- Created:创建日期
- Description:更多描述信息
- features: 公寓的一些特征描述
- photos: a list of photo links
- price:价格
2、比赛排行榜
RentListingInquries数据集下载
如有需要,可留言索取
RentListingInquries案例应用
ML之FE:利用FE特征工程对RentListingInquries(Kaggle竞赛)数据集实现房屋感兴趣程度的多分类预测
ML之FE:基于FE特征工程对RentListingInquries数据集进行预处理并导出为三种格式文件(csv格式/txt格式/libsvm稀疏txt格式)
Dataset之RentListingInquries:RentListingInquries(Kaggle竞赛)数据集的简介、下载、案例应用之详细攻略相关推荐
- Dataset之HiggsBoson:Higgs Boson(Kaggle竞赛)数据集的简介、下载、案例应用之详细攻略
Dataset之HiggsBoson:Higgs Boson(Kaggle竞赛)数据集的简介.下载.案例应用之详细攻略 目录 Higgs Boson比赛简介 Higgs Boson数据集的下载 Hig ...
- Dataset之AllstateClaimsSeverity:AllstateClaimsSeverity数据集(Kaggle2016竞赛)的简介、下载、案例应用之详细攻略
Dataset之AllstateClaimsSeverity:AllstateClaimsSeverity数据集(Kaggle2016竞赛)的简介.下载.案例应用之详细攻略 目录 AllstateCl ...
- Dataset之Pascal:Pascal竞赛及其Pascal VOC(VOC 2012、VOC 2007) 数据集的简介、下载、使用方法详细攻略
Dataset之Pascal VOC:Pascal VOC(VOC 2012.VOC 2007) 数据集的简介.下载.使用方法详细攻略 目录 Pascal 竞赛 1.PASCAL VOC竞赛任务 2. ...
- Dataset:Big Mart Sales数据集的简介、下载、案例应用之详细攻略
Dataset:Big Mart Sales数据集的简介.下载.案例应用之详细攻略 目录 Big Mart Sales数据集的简介 1.特征解释 Big Mart Sales数据集的下载 Big Ma ...
- Dataset之OttoGroup:OttoGroup数据集的简介、下载、案例应用之详细攻略
Dataset之OttoGroup:OttoGroup数据集的简介.下载.案例应用之详细攻略 目录 OttoGroup数据集的简介 OttoGroup数据集的下载 OttoGroup数据集的案例应用 ...
- Dataset:titanic泰坦尼克号数据集/泰坦尼克数据集(是否获救二分类预测)的简介、下载、案例应用之详细攻略
Dataset:titanic泰坦尼克号数据集/泰坦尼克数据集(是否获救二分类预测)的简介.下载.案例应用之详细攻略 目录 titanic(泰坦尼克号)数据集的简介 1.titanic数据集各字段描述 ...
- Dataset之JFT:JFT/FastEval14k数据集的简介、下载、案例应用之详细攻略
Dataset之JFT:JFT数据集的简介.下载.案例应用之详细攻略 目录 JFT/FastEval14k数据集的简介 JFT数据集的下载 JFT数据集的案例应用 JFT/FastEval14k数据集 ...
- Dataset:机器学习中常用数据集下载链接集合之详细攻略
Dataset:机器学习中常用数据集下载链接集合之详细攻略 目录 机器学习中常用数据集下载链接集合之详细攻略 sklearn.datasets数据集所有csv文件集合 seaborn-data数据集所 ...
- Dataset之DA:数据增强(Data Augmentation)的简介、方法、案例应用之详细攻略
Dataset之DA:数据增强(Data Augmentation)的简介.方法.案例应用之详细攻略 目录 DA的简介 DA的方法 DA的案例应用 DA的简介 数据集增强主要是为了减少网络的过拟合现象 ...
最新文章
- 关于 OpenIdConnect 认证启用 HTTPS 回调 RedirectUri 不生效问题
- 新版CCNP中文版教材--ISCW
- 深入浅出统计学(十一)总体和样本的估计
- 线性代数可以速成吗_广播/学习吉他速成靠谱吗?真的可以速成吗?
- C++ STL 初步介绍01
- Bitfinex将向纽约总检察长办公室移交“被指控 8.5 亿美元资金挪用案”相关文件
- MySQL判断中文字符的方法(转)
- TensorFlow Serving安装笔记(仅限64位x86)
- Linux常用命令、权限管理和开发工具详细介绍
- 微信分享wx.config配置时遇到invalid signature错误的解决办法
- Java机器学习库(Java ML)(一、分类)
- linux设置自动获取ip命令,详解如何设置CentOS 7开机自动获取IP地址
- JWT结果功能用处简单介绍
- POP3,全名为“Post Office Protocol - Version 3”,即“邮局协议版本3”
- 个人经历:谈一谈的程序员求职途径
- luogu 1757 分组背包
- python——Matplotlib饼图、直方图的绘制
- BZOJ5473: 仙人掌
- Paper:可解释性之VI/PFI《All Models are Wrong, but Many are Useful: Learning a Variable’s Importance》翻译与解读
- (23)Linux基础-系统磁盘阵列raid