1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19.
学习在使⽤CSV⽂件。CSV(逗号分隔值)格式是电⼦表格和数据库中⾮常流⾏的导⼊和导出格式。Python语⾔包含该模块,该模块具有⽤于读取和写⼊CSV格式的数据的类。csv⽬录
Reading CSV file with csv.reader()
该⽅法返回⼀个reader对象,该对象将遍历给定CSV⽂件中的⾏。假设我们有以下numbers.csv包含数字的⽂件:6,5,3,9,8,6,7
以下python脚本从此CSV⽂件读取数据。
#!/usr/bin/python3import csv
f = open('numbers.csv', 'r')with f:
reader = csv.reader(f) for row in reader: print(row)
在上⾯的代码⽰例中,我们打开了numbers.csv以读取并使⽤csv.reader()⽅法加载数据。
现在,假设CSV⽂件将使⽤其他定界符。(严格来说,这不是CSV⽂件,但是这种做法很常见。)例如,我们有以下items.csv⽂件,其中的元素由竖线字符(|)分隔:
pen|table|keyboard
以下脚本从items.csv⽂件读取数据。
#!/usr/bin/python3
import csv
f = open('items.csv', 'r')with f:
reader = csv.reader(f, delimiter=\"|\") for row in reader: for e in row: print(e)
我们delimiter在csv.reader()⽅法中使⽤参数指定新的分隔字符。
Reading CSV file with csv.DictReader
该班的运作就像⼀个普通的读者,但读⼊字典中的信息映射。
字典的键可以与fieldnames参数⼀起传递,也可以从CSV⽂件的第⼀⾏推断出来。我们有以下values.csv⽂件:
min, avg, max1, 5.5, 10
第⼀⾏代表字典的键,第⼆⾏代表值。
#!/usr/bin/python3
import csv
f = open('values.csv', 'r')with f:
reader = csv.DictReader(f) for row in reader: print(row)
上⾯的python脚本使⽤读取values.csv⽂件中的值csv.DictReader。这是⽰例的输出。
$ ./read_csv3.py
{' max': ' 10', 'min': '1', ' avg': ' 5.5'}
Writing CSV file using csv.writer()
该⽅法返回⼀个writer对象,该对象负责将⽤户数据转换为给定⽂件状对象上的定界字符串。
#!/usr/bin/python3
import csv
nms = [[1, 2, 3, 4, 5, 6], [7, 8, 9, 10, 11, 12]]f = open('numbers2.csv', 'w')with f:
writer = csv.writer(f) for row in nms:
writer.writerow(row)
该脚本将数字写⼊numbers2.csv⽂件。该writerow()⽅法将⼀⾏数据写⼊指定的⽂件。该脚本将产⽣以下⽂件(numbers2.csv):1,2,3,4,5,6 7,8,9,10,11,12
可以⼀次写⼊所有数据。该writerows()⽅法将所有给定的⾏写⼊CSV⽂件。
下⼀个代码⽰例将Python列表写⼊numbers3.csv⽂件。该脚本将三⾏数字写⼊⽂件。
#!/usr/bin/python3
import csv
nms = [[1, 2, 3], [7, 8, 9], [10, 11, 12]]f = open('numbers3.csv', 'w')with f:
writer = csv.writer(f) writer.writerows(nms)
运⾏上述程序时,以下输出将写⼊numbers3.csv⽂件:1,2,3 7,8,9 10,11,12
Quoting
可以在CSV⽂件中引⽤单词。Python CSV模块中有四种不同的引⽤模式:
QUOTE_ALL —引⽤所有字段
QUOTE_MINIMAL-仅引⽤那些包含特殊字符的字段QUOTE_NONNUMERIC —引⽤所有⾮数字字段QUOTE_NONE —不引⽤字段
在下⼀个⽰例中,我们向items2.csv⽂件写⼊三⾏。所有⾮数字字段都⽤引号引起来。
#!/usr/bin/python3
import csv
f = open('items2.csv', 'w')with f:
writer = csv.writer(f, quoting=csv.QUOTE_NONNUMERIC) writer.writerows(([\"coins\
该程序将创建以下items2.csv⽂件。引⽤项⽬名称,不引⽤数字表⽰的数量。
\"coins\\"pens\\"bottles\
CSV Dialects
尽管CSV格式是⼀种⾮常简单的格式,但还是有许多差异,例如不同的定界符,换⾏或引号字符。因此,有不同的CSV⽅⾔可⽤。下⼀个代码⽰例将打印可⽤的⽅⾔及其特征。
#!/usr/bin/python3
import csv
names = csv.list_dialects()for name in names: print(name)
dialect = csv.get_dialect(name) print(repr(dialect.delimiter), end=\" \") print(dialect.doublequote, end=\" \") print(dialect.escapechar, end=\" \")
print(repr(dialect.lineterminator), end=\" \") print(dialect.quotechar, end=\" \") print(dialect.quoting, end=\" \")
print(dialect.skipinitialspace, end=\" \") print(dialect.strict)
在csv.list_dialects()返回⽅⾔名称的列表和csv.get_dialect()⽅法返回与⽅⾔名称相关联的⽅⾔。
$ ./dialects.py excel
',' 1 None '\\r\\n' \" 0 0 0excel-tab
'\' 1 None '\\r\\n' \" 0 0 0unix
',' 1 None '\\n' \" 1 0 0
程序将打印此输出。有三个内置的⽅⾔excel,excel-tab和unix。
Custom CSV Dialect
在本教程的最后⼀个⽰例中,我们将创建⼀个⾃定义⽅⾔。使⽤该csv.register_dialect()⽅法创建⾃定义⽅⾔。
#!/usr/bin/python3
import csv
csv.register_dialect(\"hashes\f = open('items3.csv', 'w')with f:
writer = csv.writer(f, dialect=\"hashes\") writer.writerow((\"pencils\ writer.writerow((\"plates\ writer.writerow((\"books\
该程序使⽤(#)字符作为分隔符。使⽤⽅法中的dialect选项指定⽅⾔csv.writer()。该程序将产⽣以下⽂件(items3.csv):
pencils#2plates#1books#4
在本教程中,我们探索了Python csv模块,并介绍了⼀些在python中读写CSV⽂件的⽰例。学习愉快!
因篇幅问题不能全部显示,请点此查看更多更全内容