您的位置:首页 > 新闻资讯 >文章内容
代理IP教你爬虫如何进行Excel的储存与读取
来源:互联网 作者:admin 时间:2019-09-21 10:46:04

  基础爬虫在代理IP的帮助之下,一些小型的项目是可以没有压力轻松开展的,但是python编程语言还是需要进行学习才能帮助我们在遇到不同的情况,去做正确的调试操作。所以一些爬虫的技巧学习还是少不了了,机灵代理为大家带来Python爬虫如何在Excel进行储存于读取的教程,下面来看看具体的步骤。


代理IP教你爬虫如何进行Excel的储存与读取


  首先判断是否有目录,有就打开,没有就新建。


  import os


  if os.path.exists('D:\Python\代码\数据爬取'):

  os.chdir('D:\Python\代码\数据爬取')


  else:

  os.mkdir('D:\Python\代码\数据爬取')

  os.chdir('D:\Python\代码\数据爬取')


  1、用xlwt写入excel


  import xlwt

  #1新建一个工作簿

  workbook=xlwt.Workbook()

  #2新建一个工作表

  sheet1=workbook.add_sheet('sheet1')

  #写入内容,sheet.write(i,j,value)

  sheet1.write(0,0,0)

  sheet1.write(0,2,'hello')

  #写入九九乘法表

  for i in range(1,10):

  for j in range(1,i+1):

  a="%dx%d=%d"%(j,i,i*j)

  sheet1.write(i,j-1,a)

  #3保存工作簿

  workbook.save('newExcel.xls')


  2、用xlrd读取excel


  import xlrd

  # 打开工作簿

  workbook = xlrd.open_workbook('newExcel.xlsx')

  # 获取第一张表(三种方法)

  sheet_one = sheets[0]

  #sheet_one1 = workbook.sheet_by_name('产品类别')

  #sheet_one2 = workbook.sheet_by_index(0)

  # 获取总行数和总列数

  nrows = sheet_one.nrows # 行

  ncols = sheet_one.ncols # 列

  print(nrows, ncols)

  # 按行读取数据

  for i in range(nrows):

  myRowValues = sheet_one.row_values(i)

  print(myRowValues)

  # 按列读取数据

  for j in range(ncols):

  myColValue = sheet_one.col_values(j)

  print(myColValue)

  print('-------------------')

  # 获取单元格数据

  # 语法:sheet_one.cell(i,j).value

  # sheet_one.cell_value(i,j)

  for p in range(nrows):

  for q in range(ncols):

  print(sheet_one.cell(p, q).value)

  # 输出某一个单元格数据:

  print(sheet_one.cell(6, 1).value)


  3、更新excel的数据


  import xlrd

  from xlutils.copy import copy

  wb = xlrd.open_workbook('newExcel.xls')

  #复制一个文件

  newwb = copy(wb)

  #获取复制的工作表

  sheet = newwb.get_sheet(0)

  #使用write写入

  sheet.write(0,2,'你好!')

  #保存文件,,如果文件名已经存在,替换掉,如果不存在,则新建

  newwb.save('newExcel.xls')


  4、使用openpyxl简单存储数据


  简单方便实用,推荐使用这个方法。


  from openpyxl import Workbook

  wb = Workbook() #实例化一个对象,生成一个工作簿

  #使用第一张表

  sheet = wb.active

  sheet.title='我的表格'

  sheet2 = wb.create_sheet('你的表格')

  #语法:按行写入

  sheet.append([1,2,3,4])

  sheet.append([4,5,6])

  sheet2.append(['这是第二张表格'])

  wb.save('new.xlsx')


  以上教程大家都理解操作流程了吗?如果还有疑惑的话,可以联系机灵代理,我们会尽可能为你进行专业解答。


相关文章内容简介
推荐阅读
  • 03 2020-02
    不同的代理ip有什么区别

    代理IP的种类划分有很多,可以按照成本、匿名程度、用途来进行区分。不同的区分又有什么不同呢?

  • 29 2019-10
    https代理怎么用于爬虫?

    除了http代理,现在很多网站都开启了https认证,这么一来,https代理的使用也变得多了。在爬虫的时候,我们要怎么使用https代理?且看机灵代理带来的攻略。

  • 13 2020-05
    代理IP作用有哪些

    代理IP用到的领域越来越广,如爬虫、投票、抢购等等,那么具体代理IP有什么用?能做些什么呢?

  • 26 2020-03
    代理ip如何助力自媒体推广

    现在人们可能比起电脑,更加习惯用手机或者是平板设备来上网了,因为一来这两者比起电脑要更加方便携带。

  • 21 2019-03
    爬取大规模数据必备高效代理IP和分布式爬虫

    学习Python爬虫,必然是想要爬取大规模数据,如果还想单个单个来爬取数据,那还不如人工采集呢?何必花时间花成本去做网络爬虫进行采集,是吧。但是想要爬取大规模数据,我们需要准备一

  • 30 2020-11
    动态ip代理的代理模式

    ip代理的选择对许多用户来说是一个难题,不仅因为代理ip的类型太多,还因为用户对更换ip软件不够了解,这使得人们无法选择服务。

在线咨询
大客户经理
大客户经理
1829380381
13316264505

大客户经理微信

微信公众号

微信公众号

回到顶部