第3关:Python对文件的操作
- 编写一个能将不同文件中的所有数字,按从小到大的顺序写入新的文件中的小程序
相关知识
- 为了完成本关任务,你需要掌握:
- Python 如何进行读写文件操作;
- Python 内置函数sorted的使用
- Python对文件的读写操作
- 通常,Python 对文件的操作大致可分为下列三步:
通过
open函数
打开指定文件,并且获得文件的句柄;
通过上一步的文件句柄,对文件进行读(read)
、
写(write)
操作;
通过文件句柄的close函数关闭文件句柄。
其中,对于open函数
,我们至少得知道其前2个参数以及encoding参数的含义(其他参数在生活中使用得并不多,有兴趣的可以查阅相关文档)。
第一个参数是文件路径,这个地方需要注意下使用的是绝对路径还是相对路径;
第二个参数是指明本次操作的模式,常用的可分为“读”、“写”和“读写”3种
,分别对应字母
r、w和r+(w+)
。
如果要对文件进行读操作,即指明模式值为r,那么必须保证该文件路径正确(即文件存在),并且禁止程序对该文件进行写操作;
如果对文件进行写操作,即指明模式值为w,那么 Python会打开这样一个文件,并且清空里面的内容,如果不存在,则会自动创建,同时,不允许程序对该文件进行读操作。r+和w+模式
虽说既可以进行读操作,又可以进行写操作,但是前者打开后文件内容还在,后者打开文件的同时清空了里面的数据,所以有关w的操作请慎用!
如果我们想在文件内容末位添加数据,可以指明模式值为a,其他更多参数可以参考下图。
- 在Python 3中,程序执行环境采用的是Unicode编码,而网络上还有诸如UTF-8、ASCII和UTF-16等等编码格式,对于一种编码写入的数据,必须要用同样的编码方式进行解码并读取数据,否则就会出现乱码的情况。一般来说这个参数是可选参数,我们不必刻意去设置,但是当我们有某种需求,特别是爬虫工作者,这个编码可真的是一个要特别注意的问题。
打开文件后,我们即可通过
read和write函数
对文件进行读写,
read函数
是一次性将文件中的所有内容都读取出来。但如果文件内容一大,这对计算机可是一个不小的负荷,更何况我们往往一次不需要这么多数据。
为解决上述问题,我们可以用readline函数
去一行一行地读取文件。读操作还有一个
函数readlines
,他是将文件所有数据,按行读取出来形成一个
list
,效果和
read
一样,不过这里将其按行顺序处理了。
示例程序:
'''
假设文件ceshi.txt,内容如下:
python
读写文件
原来可以这样玩
'''#获取文件句柄
f =open("ceshi.txt")#一次性读取文件内容print(f.read())#使用完一定要记得关闭句柄
f.close()
示例输出:
python
读写文件
原来可以这样玩
- 写操作的话,主要通过
write函数
完成,使用与上述read函数
的调用类似,这里不再演示。不过这里可以把需要写的内容,直接作为write函数
的参数,传递过去即可。但要注意的是,用写模式打开文件,会清空文件原有的数据!
Python内置函数sorted的使用
- 给定一个数组,对其按照某种顺序排序,比如将数字从小到大排序,我们很容易写出一个冒泡排序的代码:
ls1 =[1,5,4,3,2]defbubble_sort(ls):for i inrange(len(ls)-1):for j inrange(len(ls)-i-1):if ls[j]> ls[j+1]:
ls[j], ls[j+1]= ls[j+1], ls[j]return ls
- 我们知道还有诸如快速排序、堆排序更加快的排序方法,而且书写这么一个排序算法代码量又比较大。这时候我们可以考虑用 Python中内置的排序函数——
sorted函数
,我们只需要提供排序关键字的转换函数即可,如我们想对Alice、Bob和qwer
这四个字符串按长度大小,从小到大排序,可以这么写:
ls =['Alice','Bob','qwer']deffunc(key):returnlen(key)print(sorted(ls, key=func))
示例输出:
['Bob','qwer','Alice']
如果熟悉
lambda表达式
的话,简单的排序规则将会表现得更加简洁,如上述代码可以表示为
sorted(ls, key=lambda x:len(x))
。有关
lambda表达式
的更多使用,请有兴趣的同学自行学习。
编程要求
- 实现将file_1和file_2文件中的数字,按从小到大的顺序排序,并将结果写入file_3文件中
提示步骤:
- 可以新建空列表
- 将读取的文件内容通过extend方法,添加到空列表
- 通过sort排序
- 然后将列表写入file_3文件。
测试说明
- 每次测试输入3行,分别表示file_1文件的路径、file_2文件的路径和file_3文件的路径
这里是引用
测试输入:
second_task/step4/test_a_1.txt
second_task/step4/test_b_1.txt
second_task/step4/output/out.txt
预期输出(学员只需完成将结果写入文件中的操作即可):
012
上代码:
如果注释理解有误,请大佬们多多评论指教!!
版权归原作者 学不会is dog 所有, 如有侵权,请联系我们删除。