对于机器学习算法工程师而言,Python是不可或缺的语言,它的优美与简洁令人无法自拔。那么你了解过Python编程面试题吗?从Python基础到网页爬虫你是否能全方位Hold住?今天,机器之心为读者们推荐一个Github项目。

在这个项目中,作者 kenwoodjw 准备了近 300 道 Python 面试题,同时还包含解决方案与代码。作者主要从 Python 基础、高级语句、网页应用、数据库和测试等角度提问,读者可只关注自己需要的领域。目前该项目已经完成了很多基础和高级面试题,本文主要摘取一些 Python 面试题供大家参考。

项目地址:https://github.com/kenwoodjw/python_interview_question

总体而言,项目有近300道面试题。虽然该项目刚开始创建,但很多Python面试题都已经提供了解决方案。如下所示为面试题示例:

本文截取了一些面试题及解决方案:

  • Python 基础

  • 文件操作

  • 模块与包

  • 数据类型

  • 企业面试题

  • Python 高级

  • 设计模式

  • 系统编程

如果希望了解机器学习面试题,可阅读:春招已近,这份GitHub万星的ML算法面试大全请收下

Python 基础

什么是 Python?根据Python 创建者 Guido van Rossum 所言,Python是一种高级编程语言,其设计的核心理念是代码的易读性,以及允许编程者通过若干行代码轻松表达想法创意。实际上,很多开发者选择学习 Python 的首要原因是其编程的优美性,用它编码和表达想法非常自然。

文件操作

1.若有一个jsonline格式的文件file.txt,大小约为10K,我们的处理方式为:

def get_lines():        l = []        with open('file.txt', 'rb') as f:            for eachline in f:                l.append(eachline)            return l

if __name__ == '__main__':    for e in get_lines():        process(e) #处理每一行数据

现在要处理一个大小为10G的file.txt文件,但是内存只有4G。如果在只修改get_lines 函数而其他代码保持不变的情况下,应该如何实现?需要考虑的问题都有那些?

def get_lines():        l = []        with open('file.txt','rb') as f:            data = f.readlines(60000)        l.append(data)        yield l

要考虑的问题有:内存只有4G,无法一次性读入10G文件。而分批读入数据要记录每次读入数据的位置,且分批每次读取得太小会在读取操作上花费过多时间。

模块与包

2.如何输入日期, 判断这一天是这一年的第几天?

import datetime

def dayofyear():    year = input("请输入年份: ")    month = input("请输入月份: ")    day = input("请输入天: ")    date1 = datetime.date(year=int(year),month=int(month),day=int(day))    date2 = datetime.date(year=int(year),month=1,day=1)    return (date1-date2).days+1

数据类型

3.如何反转字符串"aStr"?

print("aStr"[::-1])

4.下面代码的输出结果将是什么?会报错吗?

list = ['a','b','c','d','e']print(list[10:])

代码将输出[],并不会产生IndexError 错误。如果尝试用超出成员的个数的index来获取某个列表的成员,那就会报错。例如,尝试获取 list[10] 和之后的成员,会导致IndexError。然而当我们尝试获取列表的切片时,开始的index超过成员个数并不会产生IndexError,而是仅仅返回一个空列表。因为并不会报错,所以这种Bug很难追踪到。

5.请写出一段Python代码,实现删除list里面的重复元素?

l1 = ['b','c','d','c','a','a']l2 = list(set(l1))print(l2)

用list类的sort方法可以保证顺序不变:

l1 = ['b', 'c', 'd', 'c', 'a', 'a']l2 = list(set(l1))l2.sort(key=l1.index)print(l2)

也可以这样写:

l1 = ['b', 'c', 'd', 'c', 'a', 'a']l2 = sorted(set(l1), key=l1.index)print(l2)

也可以用遍历:

l1 = ['b', 'c', 'd', 'c', 'a', 'a']l2 = []for i in l1:    if not i in l2:        l2.append(i)print(l2)

企业面试题

6.设计实现遍历目录与子目录,抓取.pyc文件

第一种方法:

import os

def getFiles(dir, suffix):    res = []    for root, dirs, files in os.walk(dir):        for filename in files:            name, suf = os.path.splitext(filename)            if suf == suffix:                res.append(os.path.join(root, filename))

    print(res)

getFiles("./", '.pyc')

第二种方法:

import os

def pick(obj):    try:        if obj.[-4:] == ".pyc":            print(obj)        except:        return None

def scan_path(ph):    file_list = os.listdir(ph)    for obj in file_list:        if os.path.isfile(obj):    pick(obj)    elif os.path.isdir(obj):    scan_path(obj)

if __name__ == '__main__':    path = input('输入目录')    scan_path(path)

7.如何反转一个整数,例如-123--> -321?

class Solution(object):    def reverse(self, x):        if -10 < x < 10:            return x        str_x = str(x)        if str_x[0] != "-":            str_x = str_x[::-1]            x = int(str_x)        else:            str_x = str_x[1:][::-1]            x = int(str_x)            x = -x        return x if -2147483648 < x < 2147483647 else 0

if __name__ == '__main__':    s = Solution()    reverse_int = s.reverse(-120)    print(reverse_int)

Python高级

Python高级包含很多重要的模块,例如函数、类和实例、系统编程、正则表达式、网络编程等等。根据这些高级属性,Python可用于数据科学、网页开发、机器学习等等。

设计模式

8.对设计模式的理解,简述你了解的设计模式?

设计模式是为我们经常会碰到的一些编程问题构建的可重用解决方案,它是总结性和经优化的。一个设计模式并不像一个类或一个库那样能够直接作用于我们的代码,反之,设计模式更为高级,它是一种在特定情形下实现的方法模板。常见的是工厂模式和单例模式。

单例模式应用的场景一般发现在以下条件下: 资源共享的情况下,避免由于资源操作时导致的性能或损耗等,如日志文件,应用配置。控制资源的情况下,方便资源之间的互相通信。

9.生成器和迭代器的区别?

迭代器是一个更抽象的概念,任何对象,如果它的类有 next 方法和 iter 方法返回自己本身,它就是可迭代的。对于 string、list、dict、tuple 等这类容器对象,使用for循环遍历是很方便的,for 语句实际上会对容器对象调用 iter() 函数。iter() 会返回一个定义了 next() 方法的迭代器对象,它在容器中逐个访问容器内元素,在没有后续元素时,next()会抛出一个StopIteration异常。

生成器(Generator)是创建迭代器的简单而强大的工具。它们写起来就像是正规的函数,只是在需要返回数据的时候使用yield语句。生成器能做到迭代器能做的所有事,而且因为自动创建iter()和next()方法,生成器显得特别简洁,而且生成器也是高效的,使用生成器表达式取代列表解析可以同时节省内存。除了创建和保存程序状态的自动方法,当发生器终结时,还会自动抛出StopIteration异常。

10.对装饰器的理解,你能写出一个计时器装饰器,它能记录函数的执行时间吗?

装饰器本质上是一个Python函数,它可以让其他函数在不需要做任何代码变动的前提下增加额外功能,装饰器的返回值也是一个函数对象。

import time    def timeit(func):        def wrapper():            start = time.clock()            func()            end = time.clock()            print('used:',end-start)            return wrapper    @timeit    def foo():        print('in foo()'foo())

系统编程

11.介绍一下你了解的进程。

程序运行在操作系统上的一个实例,就称之为进程。进程需要相应的系统资源:内存、时间片、pid。创建进程: 首先要导入multiprocessing中的Process;创建一个Process对象;创建Process对象时,可以传递参数。

p = Process(target=XXX, args=(tuple,), kwargs={key: value})target = XXX # 指定的任务函数,不用加()args = (tuple,)kwargs = {key: value} # 给任务函数传递的参数

使用start()启动进程 结束进程 给子进程指定函数传递参数Demo

import osfrom mulitprocessing import Processimport time

def pro_func(name, age, **kwargs):    for i in range(5):        print("子进程正在运行中,name=%s,age=%d,pid=%d" % (name, age, os.getpid()))        print(kwargs)        time.sleep(0.2)

if __name__ == "__main__":    # 创建Process对象    p = Process(target=pro_func, args=('小明', 18), kwargs={'m': 20})    # 启动进程    p.start()    time.sleep(1)    # 1秒钟之后,立刻结束子进程    p.terminate()    p.join()

12.谈谈你对多进程、多线程、以及协程的理解,项目是否用?

进程:一个运行的程序(代码)就是一个进程,没有运行的代码叫程序,进程是系统资源分配的最小单位,进程拥有自己独立的内存空间,所有进程间数据不共享,开销大。线程: cpu调度执行的最小单位,也叫执行路径,不能独立存在,依赖进程存在,一个进程至少有一个线程,叫主线程,而多个线程共享内存可以极大地提高了程序的运行效率。协程: 是一种用户态的轻量级线程,协程的调度完全由用户控制,协程拥有自己的寄存器上下文和栈。协程调度时,将寄存器上下文和栈保存到其他地方,在切回来的时候,恢复先前保存的寄存器上下文和栈,直接操中栈则基本没有内核切换的开销,可以不加锁的访问全局变量,所以上下文的切换非常快。

关于系统编程还有很多问题,例如:

本文为机器之心编辑,转载请联系本公众号获得授权

转载于:https://www.cnblogs.com/fengff/p/10485078.html

python的一些基本概念知识和面试题相关推荐

  1. python基础知识面试题-python的一些基本概念知识和面试题

    对于机器学习算法工程师而言,Python是不可或缺的语言,它的优美与简洁令人无法自拔.那么你了解过Python编程面试题吗?从Python基础到网页爬虫你是否能全方位Hold住?今天,机器之心为读者们 ...

  2. python简述题_python的一些基本概念知识和面试题

    对于机器学习算法工程师而言,Python是不可或缺的语言,它的优美与简洁令人无法自拔.那么你了解过Python编程面试题吗?从Python基础到网页爬虫你是否能全方位Hold住?今天,机器之心为读者们 ...

  3. 软件测试知识点和面试题--接口测试篇

    软件测试知识点和面试题--性能测试篇 软件测试知识点和面试题--手工测试篇(功能测试) 软件测试知识点和面试题--app测试篇 接口规范 接口测试流程 测试用例的思路和方法 pymysql操作数据库 ...

  4. python基础语法及知识总结-Python 学习完基础语法知识后,如何进一步提高?

    ---4.30更新---感谢大家支持,点赞都破两千了.给大家整理出来新的资料,需要的小伙伴来自取: Python练手项目视频如下: Python自学基础知识如下: 以下为原文内容: Python 学习 ...

  5. python类装饰器详解-Python装饰器基础概念与用法详解

    本文实例讲述了Python装饰器基础概念与用法.分享给大家供大家参考,具体如下: 装饰器基础 前面快速介绍了装饰器的语法,在这里,我们将深入装饰器内部工作机制,更详细更系统地介绍装饰器的内容,并学习自 ...

  6. 数字图像处理与Python实现笔记之基础知识

    数字图像处理与Python实现笔记之基础知识 摘要 绪论 1 数字图像处理基础知识 1.1 数字图像简介 1.1.1 数字图像处理的目的 1.1.2 数字图像处理的应用 1.1.3 数字图像处理的特点 ...

  7. 高级/专家工程师职位和面试题

    今天分享一些高级别的开发职位和面试题(平均年薪100w+),大家检查一下,自己是否满足要求,面试问题是否可以回答? 高级工程师职位 高级/专家C++开发面试问题是什么? 如果你可以问一个C++ 程序员 ...

  8. python+[:]+切片_我从C ++到Python的方式:概念上的改变

    python+[:]+切片 by asya f 由asya f 我从C ++到Python的方式:概念上的改变 (How I went from C++ to Python: a conceptual ...

  9. python装饰器详解-Python装饰器基础概念与用法详解

    本文实例讲述了Python装饰器基础概念与用法.分享给大家供大家参考,具体如下: 装饰器基础 前面快速介绍了装饰器的语法,在这里,我们将深入装饰器内部工作机制,更详细更系统地介绍装饰器的内容,并学习自 ...

最新文章

  1. 【分块】#6278. 数列分块入门 2 (区间修改、查询权值c在区间中的排名)
  2. textrank4zh来提取关键词和摘要
  3. .NET设计模式(15):结构型模式专题总结
  4. js学习笔记(执行上下文、闭包、this部分)
  5. NIO详解(二): BIO 浅谈 同步 异步与阻塞 非阻塞
  6. 【数据平台】Eclipse+Scala开发环境(本机和集群两个运行模式)
  7. QT的QSetIterator类的使用
  8. STL常用容器大致对比
  9. tyvj1068 STR
  10. wxpython富文本_去除富文本编辑器中的标签
  11. 爬取了BOSS直聘、拉勾等近1000+招聘需求,总结出3年+Java开发的高频技术需求
  12. (30)SPI接口调试丢数据解决(FPGA不积跬步101)
  13. 【registry】javax ValidationException: HV000183: Unable to load ‘javax.el.ExpressionFactory‘
  14. ESXi 中重新启动管理代理
  15. 什么是servlet?---总结一
  16. plotyy函数_Matlab plotyy函数的使用及问题总结
  17. BigDecimal的ROUND_DOWN()中的坑
  18. 力扣刷题day32|738单调递增的数字、714买卖股票的最佳时机含手续费、968监控二叉树
  19. 国际版抖音加群 振兴中华
  20. 第五节、AHK对话框详解

热门文章

  1. MongoDB ( 五 )高级_索引
  2. 大数据为何让传统银行焦虑?
  3. struts2 标签的使用之二 s:iterator
  4. Zabbix安装(十):监控windows进程
  5. 电子书推荐--《Python灰帽子》,python黑客编程
  6. mysql学习总结一:mysql的安装,介绍,基本命令操作
  7. [转载]VC6下安装STLport-5.2.1
  8. Android应用程序键盘(Keyboard)消息处理机制分析(3)
  9. 老板评价下属的普遍性原则
  10. [XA]转:一个关于结对编程(Pair Programming)的讲义