练习 29:diffpatch

原文:Exercise 29: diff and patch

译者:飞龙

协议:CC BY-NC-SA 4.0

自豪地采用谷歌翻译

为了完成第四部分,你将简单把你所学习的完整的 TDD 流程,应用于你可能不熟悉的、更相关的项目。请参阅练习 28 来确认你了解该流程,并确保你严格遵循它。如果必须的话,创建一个检查列表。

警告

当你实际工作时,这个严格的流程完全没有用。目前,你正在研究该流程,并将其内在化,以便你可以在现实世界中使用它。这就是为什么我让你严格遵循它。这只是练习,所以当你做真正的工作时,不要成为一个狂热者。这本书的目的是,教你一套完成工作的策略,而不是教你一个可以传播给大众的宗教仪式。

挑战练习

diff命令接受两个文件并产生第三个文件(或输出),它包含第一个文件与第二个文件相比,修改的东西。它是git和其它版本控制工具的基础。在 Python 中实现diff是相当简单,因为有一个库可以为你做这件事,所以你不需要处理算法(这可能非常复杂)。

patch工具是diff工具的伙伴,因为它需要一个差异文件,并将其应用到另一个文件,来产生第三个文件。这可以让你选取在两个文件中的更改,运行diff来仅仅生成差异,然后将该.diff文件发送给某人。那个人可以使用他们的原始文件副本和.diff,使用patch来重建你的更改。

以下是一个工作流程示例,来演示diffpatch的工作原理。我有两个文件A.txtB.txtA.txt文件包含一些简单的文字,然后我复制它,并创建B.txt`,带有一些修改:

$ diff A.txt B.txt > AB.diff
$ cat AB.diff
2,4c2,4
< her fleece was white a mud
< and every where that marry
< her lamb would chew cud
---
> her fleece was white a snow
> and every where that marry went
> her lamb was sure to go

这产生了文件AB.diff,它拥有A.txtB.txt相比的变化,你可以看到这是在修复我打破的押韵。一旦你有了AB.diff,你可以使用补丁应用更改:

$ patch A.txt AB.diff
$ diff A.txt B.txt

最后的命令应该不显示认识输出,因为之前的patch命令使A.txtB.txt具有相同的内容。

这两个东西的实现,应该从diff命令开始,因为使用 Python 来作弊,你有完全实现的diff。你可以在difflib文档的末尾找到它,但尝试实现你的版本,并看看与之相比怎么样。

这个练习的真正要点就是patch工具,Python 没有为你实现它。你将要阅读difflib中的SequenceMatcher类,并特别查看SequenceMatch.get_opcodes函数。这是你patch工作的唯一线索,但这是一个非常好的线索。

研究性学习

你能把这种diffpatch的组合做到什么程度?你可以将它们组合成一个工具吗?你可以让他们像微型的git那样工作吗?

深入学习

找到尽可能多的差异比较算法。另一件需要研究的事情是git的工作方式。

笨办法学 Python · 续 练习 29:`diff`和`patch`相关推荐

  1. 笨办法学 Python · 续 中文版

    笨办法学 Python · 续 中文版 原书:Learn More Python 3 The Hard Way 译者:飞龙 自豪地采用谷歌翻译 在线阅读 PDF格式 EPUB格式 MOBI格式 代码仓 ...

  2. 笨办法学 Python · 续 练习 33:解析器

    练习 33:解析器 原文:Exercise 33: Parsers 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 想象一下,你将获得一个巨大的数字列表,你必须将其输入到电子表格 ...

  3. 笨办法学 Python · 续 练习 0:起步

    练习 0:起步 原文:Exercise 0: The Setup 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 你需要设置和配置一些工具来学习此书.有可能你已经有了很多这些东西 ...

  4. 笨办法学 Python · 续 第二部分:简单的黑魔法

    第二部分:简单的黑魔法 原文:Part II: Quick Hacks 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 你有最好的想法,你会打动世界!你会成为一个亿万富豪!你的大 ...

  5. 笨办法学 Python · 续 练习 52:`moreweb`

    练习 52:moreweb 原文:Exercise 52: moreweb 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 现在,你已经使用 Python http.server ...

  6. 笨办法学 Python · 续 练习 24:URL 快速路由

    练习 24:URL 快速路由 原文:Exercise 24: Fast URL Search 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 我们将结束数据结构和算法的部分,并将 ...

  7. 笨办法学 Python · 续 练习 32:扫描器

    练习 32:扫描器 原文:Exercise 32: Scanners 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 我的第一本书在练习 48 中非常偶然涉及到了扫描器,但现在我 ...

  8. 笨办法学 Python · 续 练习 22:后缀数组

    练习 22:后缀数组 原文:Exercise 22: Suffix Arrays 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 我想告诉你一个关于后缀数组的故事.在一段时间里, ...

  9. python描述器 有限状态机_笨办法学 Python · 续 练习 30:有限状态机

    练习 30:有限状态机 每当你阅读一本关于解析的书,都有一个可怕的章节,关于有限状态机(FSM).他们对"边"和"节点"进行了详细的分析,每个可能的" ...

最新文章

  1. 极限脱出 量子计算机,《极限脱出3:零时困境》50条指向zero身份线索
  2. 阿里钉钉,马云旗下的又一个千亿美金产品?
  3. Redis-学习笔记06【Redis案例】
  4. 这7个问题,软件测试面试必问!!!
  5. 通过kafka提供的命令来查看offset消费情况
  6. SSL Library Compare
  7. Java-集合练习题
  8. linux使用入门教程
  9. java爬虫入门第二弹——通过URL下载图片(以下载百度logo为例)
  10. 佩服的一个阿里 P9 大佬,离职了...
  11. 【图像融合】基于多尺度引导实现图像融合附matlab代码
  12. 程序员必备:Git入门,超详细
  13. 3D MAX界面操作教程及渲染技巧
  14. Oracle 层次查询、递归
  15. 运动会分数统计系统(数据结构)C++
  16. Linux内核中的位操作:ffs.h,fls.h
  17. 酉变换 matlab,量子计算原理 Theory of Quantum Computing
  18. getFieldDecorator will override value
  19. js中slice()与splice()的使用与比较,直接看例子记得牢
  20. 基于H.264的远程视频监控

热门文章

  1. FPGA时钟资源PLL与DLL区别
  2. html5多颜色灯笼旋转,HTML5 Canvas 漂亮的斑马条纹灯笼
  3. python 直线过滤掉不在边缘上的点_不存在所谓的机器学习平台
  4. 2.GD32F103C8T6 gpio的使用
  5. vector容器动态申请内存的过程_记录一次自定义Allocator profile的过程
  6. 服务端设置忽略更新_react服务端渲染: cookie如何透传给后端,后端如何设置cookie...
  7. 【重难点】【Java集合 02】Set、List、Map 的区别、常见的线程安全的集合类、Collection 为什么只能在 Iterator 中删除元素
  8. mybatis如何防止sql注入
  9. 解决 IDEA 中src下xml等资源文件无法读取的问题
  10. ERROR 2003 (HY000): Can't connect to MySQL server on 'localhost' (10061)解决办法