查看: 3627|回复: 12
收起左侧

[软件] 如何从有规律的文本中提取联系人,电话等至Excel表中?

[复制链接]
addtool
发表于 2014-2-21 18:07:38 | 显示全部楼层 |阅读模式
本帖最后由 addtool 于 2014-2-22 21:23 编辑

如下图,有8行规则数据,能不能把这些数据通过函数,或者软件,正则表达式等导出至excel?

第一行至第八行依次“公司名称” “公司地址” “邮编” “电话” “传真” “email” “网址” “经营范围”。

下图只有四五个公司的,起码有10000家这样的信息我想,恐怕不能手动了吧?






http://pan.baidu.com/s/1eQklxdw   (这里有广东省的)

原数据34个省市的,光是广东省就有70多页,每页有20多家公司。



求助, 感激!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?快速注册

x
衣饭卡
发表于 2014-2-21 20:16:33 | 显示全部楼层
正则表达式
thelord
发表于 2014-2-21 21:38:35 | 显示全部楼层
本帖最后由 thelord 于 2014-2-21 21:44 编辑

用正则替换功能,把 \n.*[:|//|:] 替换为空格,然后导入 excel
用 vi 试了下,可以,只是有些地址换行了,需要手动调整
随便注册
发表于 2014-2-21 21:59:35 | 显示全部楼层
不齐,电邮、网址有的有有的没有,没法全自动。补充整齐后,段首前添加制表符--删除所有换行符--将非(地址:、邮编:、电话:、传真:、E-mail:、http:、经营范围:)之前的制表符替换为换行符,然后导入就行了。
  1.         (?!地址:|邮编:|电话:|传真:|E-mail:|http:|经营范围:)
复制代码

替换为换行符
要不是有非“广”开头的名称,直接替换就好了。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?快速注册

x
zwlk
头像被屏蔽
发表于 2014-2-21 22:16:59 | 显示全部楼层
本帖最后由 zwlk 于 2014-2-21 22:23 编辑

把文本用excel打开,所有数据放在j列,每项是一个单元格,然后a1输入=j1,b1输入=j2,往后拖拉填充到h1,a2输入=j9,b2=j10,再横着拖拉填充到h2,所有选中,往下拖拉就ok了。

---------------------------------------------------
不好意思阿,刚才没有注意看,发现你电邮、网址有的有有的没有,这个要么补齐,要么手动调整位置了。
addtool
 楼主| 发表于 2014-2-22 11:56:10 | 显示全部楼层
thelord 发表于 2014-2-21 21:38
用正则替换功能,把 \n.*[:|//|:] 替换为空格,然后导入 excel
用 vi 试了下,可以,只是有些地址换行了 ...

那我要是把所有的都弄成8行呢?
thelord
发表于 2014-2-22 16:03:55 | 显示全部楼层
addtool 发表于 2014-2-22 11:56
那我要是把所有的都弄成8行呢?

行数不多,手动调整吧
行  列数
2    7
3    7
4    7
6    9
7    7
10  7
11  7
12  7
13  7
16  9
18  7
addtool
 楼主| 发表于 2014-2-22 17:00:00 | 显示全部楼层
zwlk 发表于 2014-2-21 22:16
把文本用excel打开,所有数据放在j列,每项是一个单元格,然后a1输入=j1,b1输入=j2,往后拖拉填充到h1,a2 ...

我发现往右边一拖拉,全部变了0、

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?快速注册

x
xiaoluo
发表于 2014-2-22 18:16:14 | 显示全部楼层
先问下,这些公司信息是保存在 TXT 里面的吗?
addtool
 楼主| 发表于 2014-2-22 21:22:39 | 显示全部楼层
xiaoluo 发表于 2014-2-22 18:16
先问下,这些公司信息是保存在 TXT 里面的吗?

不是,是放在“pdf文档里” 。光是广东就有72页。
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

手机版|杀毒软件|软件论坛| 卡饭论坛

Copyright © KaFan  KaFan.cn All Rights Reserved.

Powered by Discuz! X3.4( 沪ICP备2020031077号-2 ) GMT+8, 2025-1-11 09:07 , Processed in 0.134402 second(s), 17 queries .

卡饭网所发布的一切软件、样本、工具、文章等仅限用于学习和研究,不得将上述内容用于商业或者其他非法用途,否则产生的一切后果自负,本站信息来自网络,版权争议问题与本站无关,您必须在下载后的24小时之内从您的电脑中彻底删除上述信息,如有问题请通过邮件与我们联系。

快速回复 客服 返回顶部 返回列表