您的位置:首页 > 新闻资讯 >文章内容
代理IP教你爬虫如何进行Excel的储存与读取
来源:互联网 作者:admin 时间:2019-09-21 10:46:04

  基础爬虫在代理IP的帮助之下,一些小型的项目是可以没有压力轻松开展的,但是python编程语言还是需要进行学习才能帮助我们在遇到不同的情况,去做正确的调试操作。所以一些爬虫的技巧学习还是少不了了,机灵代理为大家带来Python爬虫如何在Excel进行储存于读取的教程,下面来看看具体的步骤。


代理IP教你爬虫如何进行Excel的储存与读取


  首先判断是否有目录,有就打开,没有就新建。


  import os


  if os.path.exists('D:\Python\代码\数据爬取'):

  os.chdir('D:\Python\代码\数据爬取')


  else:

  os.mkdir('D:\Python\代码\数据爬取')

  os.chdir('D:\Python\代码\数据爬取')


  1、用xlwt写入excel


  import xlwt

  #1新建一个工作簿

  workbook=xlwt.Workbook()

  #2新建一个工作表

  sheet1=workbook.add_sheet('sheet1')

  #写入内容,sheet.write(i,j,value)

  sheet1.write(0,0,0)

  sheet1.write(0,2,'hello')

  #写入九九乘法表

  for i in range(1,10):

  for j in range(1,i+1):

  a="%dx%d=%d"%(j,i,i*j)

  sheet1.write(i,j-1,a)

  #3保存工作簿

  workbook.save('newExcel.xls')


  2、用xlrd读取excel


  import xlrd

  # 打开工作簿

  workbook = xlrd.open_workbook('newExcel.xlsx')

  # 获取第一张表(三种方法)

  sheet_one = sheets[0]

  #sheet_one1 = workbook.sheet_by_name('产品类别')

  #sheet_one2 = workbook.sheet_by_index(0)

  # 获取总行数和总列数

  nrows = sheet_one.nrows # 行

  ncols = sheet_one.ncols # 列

  print(nrows, ncols)

  # 按行读取数据

  for i in range(nrows):

  myRowValues = sheet_one.row_values(i)

  print(myRowValues)

  # 按列读取数据

  for j in range(ncols):

  myColValue = sheet_one.col_values(j)

  print(myColValue)

  print('-------------------')

  # 获取单元格数据

  # 语法:sheet_one.cell(i,j).value

  # sheet_one.cell_value(i,j)

  for p in range(nrows):

  for q in range(ncols):

  print(sheet_one.cell(p, q).value)

  # 输出某一个单元格数据:

  print(sheet_one.cell(6, 1).value)


  3、更新excel的数据


  import xlrd

  from xlutils.copy import copy

  wb = xlrd.open_workbook('newExcel.xls')

  #复制一个文件

  newwb = copy(wb)

  #获取复制的工作表

  sheet = newwb.get_sheet(0)

  #使用write写入

  sheet.write(0,2,'你好!')

  #保存文件,,如果文件名已经存在,替换掉,如果不存在,则新建

  newwb.save('newExcel.xls')


  4、使用openpyxl简单存储数据


  简单方便实用,推荐使用这个方法。


  from openpyxl import Workbook

  wb = Workbook() #实例化一个对象,生成一个工作簿

  #使用第一张表

  sheet = wb.active

  sheet.title='我的表格'

  sheet2 = wb.create_sheet('你的表格')

  #语法:按行写入

  sheet.append([1,2,3,4])

  sheet.append([4,5,6])

  sheet2.append(['这是第二张表格'])

  wb.save('new.xlsx')


  以上教程大家都理解操作流程了吗?如果还有疑惑的话,可以联系机灵代理,我们会尽可能为你进行专业解答。


相关文章内容简介
推荐阅读
  • 29 2019-04
    网页IP被封找代理IP能行吗?

    网页IP被封找代理IP能行吗?遇到被封,大家第一时间是怎么想的?如何解决呢?现在很多站长都会有抓取数据的需求,因此网络爬虫在一定程度上越来越火爆,其实爬虫的基本功能很简单,就

  • 06 2020-05
    动态ip与静态ip代理的区别

    现在的代理ip资源很多,无论是哪一种代理ip资源,都会有人使用,但是为了广大用户的使用安全以及使用效率,付费代理还是具有很大的优势。

  • 02 2020-07
    智能手机是否可以换IP

    现在几乎都人手一台手机了,有些人还不止一台,在生活中很多事情都可以通过手机来操作,娱乐,学习,工作都是可以的,如果想手机换IP是否可以呢?

  • 24 2019-08
    动态IP代理在爬虫中怎么实现?

    通常在写爬虫时,网站都会针对有对应的防爬措施,就像是会限制你的单个IP访问次数,但是爬虫反复抓取,IP多次访问无法避免,那么这种问题我们通过代理IP,还能如何解决呢?

  • 28 2019-06
    爬虫利用代理ip突破频率限制

    爬虫利用代理ip突破频率限制,这样可以让爬虫程序高效抓取信息。基本上大量的爬虫都是由任务的,为了加快完成这些任务,使用代理ip这是很有必要的。

  • 01 2019-03
    做爬虫在哪里可以选购高效的代理IP

    ​大数据时代来临,大数据从何而来?大数据来自爬虫辛勤的爬取网站信息,帮助搜索引擎成为一个辅助人们检索信息的工具。

在线咨询
大客户经理
大客户经理
1829380381
13316264505

大客户经理微信

微信公众号

微信公众号

回到顶部