加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

批量提取word格式的调查表信息

发布时间:2020-12-17 17:31:12 所属栏目:Python 来源:网络整理
导读:今天PHP站长网 52php.cn把收集自互联网的代码分享给大家,仅供参考。 #coding:utf-8import osimport win32comfrom win32com.client import Dispatch,constantsfrom docx import Documentdef parse_doc(f): """读取doc,返

以下代码由PHP站长网 52php.cn收集自互联网

现在PHP站长网小编把它分享给大家,仅供参考

#coding:utf-8

import os
import win32com
from win32com.client import Dispatch,constants
from docx import Document

def parse_doc(f):
    """读取doc,返回姓名和行业
    """
    doc = w.Documents.Open( FileName = f )
    t = doc.Tables[0]  # 根据文件中的图表选择信息
    name = t.Rows[0].Cells[1].Range.Text    
    situation = t.Rows[0].Cells[5].Range.Text
    people = t.Rows[1].Cells[1].Range.Text
    title = t.Rows[1].Cells[3].Range.Text    
    print name,situation,people,title
    doc.Close()

def parse_docx(f):
    """读取docx,返回姓名和行业
    """
    d = Document(f)
    t = d.tables[0]
    name = t.cell(0,1).text
    situation = t.cell(0,8).text
    people = t.cell(1,2).text
    title = t.cell(1,8).text
    print name,title


if __name__ == "__main__":
    
    w = win32com.client.Dispatch('Word.Application')
    
    # 遍历文件
    PATH = "H:workaaa"  # windows文件路径
    doc_files = os.listdir(PATH)
    for doc in doc_files:
        if os.path.splitext(doc)[1] == '.docx':
            try:
                parse_docx(PATH+''+doc)
            except Exception as e:
                print e
        elif os.path.splitext(doc)[1] == '.doc':
            try:
                parse_doc(PATH+''+doc)
            except Exception as e:
                print e
                

以上内容由PHP站长网【52php.cn】收集整理供大家参考研究

如果以上内容对您有帮助,欢迎收藏、点赞、推荐、分享。

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读