上周最后阶段比较忙,主要是忙jd的数据测试的事情还有就是各种新产品的事情,下面回顾一下这段时间的工作。
1、上周四快下班的时候开了一个新产品的会,初步确定了风控策略,但是接近下班的时候又告诉我另外一个新产品需要紧急上线,同时jd的数据到了,草草看了下就下班了
2、pandas中loc/iloc/ix区别,loc按行名列名索引,iloc按下标索引(可以切片),ix可以混合前面两种索引方式,df不能通过df[:,3:5]类似于这种直接hash,必须用loc/iloc/ix,numpy可以直接hash
3、df.append是添加dataframe或者行,return是添加好的dataframe,其实行就是一个只包含一行的dataframe
4、两个series组成dataframe,a、b是两个Series,pd.DataFrame({a.name:a,b.name:b})
5、dataframe增加列也比较简单,df[:,'column_name'] = a,a可以是一个series/list
6、还遇到一个oracle无自增键去重的问题
row_number() over (partition by column1 order by column2)
这个语法的意思是按照column1进行分组,分组内部按照column的顺序进行编号,从1开始。
我发现oracle没有distinct on(column)的语法,在这种条件去重方面,最方便的还是pgsql,oracle有distinct,mysql有distinct。
在我的问题中有一点特殊,因为整行重复的,所以找不到一个column2来排序,但是依然可以正常编号,不影响去重
7、excel按身份证计算年龄,百度一搜很多例子,不用去记忆
8、excel也可以计算pearson相关系数,用到的是correl

9、周五一天主要都是搞京东数据的事情,一来上班的时候搞了一下r3c的审批逻辑,还未完成

10、一天之内写好了京东的逻辑,输出了结果,除了income给同事做,其他的框架全部搭好,用python写的规则引擎,并没什么新东西,注意的就是df.append需要赋值一道

11、mysql的power,对应到python是pow

12、pandas.read_csv()有个缺点就是,csv不能存储字符串,比如身份证,这个时候可以用read_excel函数

周末在家,运动没能坚持,只需要1个小时啊,执行力!还是没有请爽哥吃饭,该死,执行力啊(从台湾回来那个周一定要请了,第一优先级的事情)!

2017.06.15-2016.06.18回顾 loc/iloc/ix dataframe相关 oracle无自增去重 correl相关推荐

  1. pandas loc iloc ix用法详解

    1.什么是label pandas处理数据时,我们会经常看到dataframe结构使用loc, iloc, ix等方法.那么这些方法到底有啥区别,下面我们来进行详细分析. 首先我们先明确一点,这几个方 ...

  2. pandas之loc iloc ix

    首先,介绍这三种方法的概述: loc: loc gets rows (or columns) with particular labels from the index. loc从索引中获取具有特定标 ...

  3. Python的数据科学函数包(二)——pandas(series dataframe)(loc iloc ix)(csv文件)

    pandas 1.pandas数据的存储相对来说比较简单,它就只有两种非常重要的数据类型,一种叫series,一种叫dataframe series是指那些一维的数据,dataframe是指那些二维的 ...

  4. pandas的loc, iloc, ix的操作

    参考: https://blog.csdn.net/xw_classmate/article/details/51333646 1. loc--通过行标签索引行数据 2. iloc--通过行号获取行数 ...

  5. Pandas的 loc iloc ix 区别

    import pandas as pd data = [[1,2,3],[4,5,6]] index = [0,1] columns=['a','b','c'] df = pd.DataFrame(d ...

  6. 【跃迁之路】【495天】程序员高效学习方法论探索系列(实验阶段252-2018.06.15)...

    @(跃迁之路)专栏 实验说明 从2017.10.6起,开启这个系列,目标只有一个:探索新的学习方法,实现跃迁式成长 实验期2年(2017.10.06 - 2019.10.06) 我将以自己为实验对象. ...

  7. 华为发布企业服务云化转型战略 未来5年投资5亿美金建设服务能力(2017年09月06日)

    华为发布企业服务云化转型战略 未来5年投资5亿美金建设服务能力 2017年09月06日 [中国,上海,2017年9月6日] 今日,在HUAWEI CONNECT 2017上,华为面向全球发布企业服务云 ...

  8. 2016/06/22 中色启动筹码分析作业

    2016/06/22 中色启动筹码分析作业--待核实 201 转载于:https://www.cnblogs.com/carl2380/p/5608596.html

  9. ALLyeSNO 优化版浩方 第二版 Ver 2007 06 15 清除广告 自动挤房间

    分享一下我老师大神的人工智能教程.零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到我们人工智能的队伍中来!https://blog.csdn.net/jiangjunshow allyesno ...

最新文章

  1. redis 控制调用频率
  2. 有关cvUpdateMotionHishtory,cvCalcMotionGradient等函数的使用
  3. Java MySql 连接数据库
  4. Mocha BSM产品亮点——以Portal为展现中心的监控管理平台
  5. 学习vue3系列reactive
  6. python文件内容写入的方法有哪些、对应的方法和含义_Python的文件读写及目录操作...
  7. 机器学习项目实战----泰坦尼克号获救预测(二)
  8. poj-1190 生日蛋糕 **
  9. java常见抛出异常
  10. php 富文本编辑器,曾经用过的十大富文本编辑器
  11. matlab 表示希腊字母yita,数学罗马符号_常用数学的罗马符号和拉丁符号有什么哪些_淘题吧...
  12. 汉语拼音分音节的程序
  13. pdf打不开无法启动计算机丢失,电脑打开PDF文档时发生错误文件已损坏怎么修复...
  14. 抽奖助手自动参与抽奖
  15. 线段树维护区间最大子段和 枚举 HDU6638
  16. SDNU-1014 页码问题
  17. Python基础——魔法方法(二)
  18. element+后台管理系统数据导出为excel+进度条导出
  19. navicat显示中文为问号
  20. WPS文字怎么插入背景音乐

热门文章

  1. 一个小型 BI 项目的总结
  2. 利用PR将视频保存成一系列图片
  3. Matlab坐标轴正负指数显示
  4. 【工作】论文格式详细要求
  5. Knald - 1.2.1 烘培贴图,利用贴图转换成其他贴图   笔记
  6. 迭代次数和熵之间关系的一点联想
  7. 通过反编译分析骑砍2俘虏招募机制
  8. vue js 复制div区域内容
  9. mysql 批量数据插入很慢(kettle 输入输出组件) 性能优化办法
  10. 9.ffplayer 原理、架构及代码分析——变速播放的实现