12
返回列表 发新帖
楼主: 一脸无奈
收起左侧

[已解决] 谁能帮忙把这个PDF的文字提取了

 关闭 [复制链接]
lqandy
发表于 2008-2-22 18:40:14 | 显示全部楼层
七楼的是高手啊
酿了你噢
发表于 2008-2-22 23:40:46 | 显示全部楼层
菜鸟一个,大侠,爱莫能助哦
一脸无奈
 楼主| 发表于 2008-2-23 08:41:36 | 显示全部楼层
真不好意思 昨天发完贴就出去玩了  晚上很晚才回来 来卡饭下了个离线包就睡了 待会儿要重做系统

感谢所有回帖的朋友  尤其要感谢帮我用软件试验的热心卡饭们 谢谢
7楼的[file]我简直耐死你了(我有权限加分吗 有的话我给你加 )我只要求能复制单词就行了 因为毕设之前有个翻译5000字论文的英文论文的作业 而且我的毕设也和声音信号采集处理相关  就瞎找了这篇文章 准备ctrl+c 和ctrl+v的干活

同9楼的同问 :能顺便指教一下OCR的方法吗?你用的哪种软件?不会是在公司用的那种很贵的的专业OCR吧?呵呵
feng1982
发表于 2008-2-23 20:17:50 | 显示全部楼层
这个貌似是图片扫描的,文档属性里根本看不到使用的字体
北方星空
发表于 2008-2-23 21:17:23 | 显示全部楼层
我也试的很多工具不行,太难的,

图片格式的不好弄啊。
tlz0214
发表于 2008-2-24 08:37:43 | 显示全部楼层
找到个ocr,我用了一下,效果不好,可能是我不回用的原因,有兴趣的自己试一下吧
下载连接:thunder://QUFodHRwOi8vZG93bjcuYXNwMS5jb20uY24vQm9vay8wODAxMjYvcmowODAxMjYwMi5yYXJaWg==/ }<\65 B$1  
复制粘贴到迅雷里!
软件简介: 价值3000元的图片提取文字工具 h 0QYoDvbC  
TH-OCR XP 能够适应超过一百种Windows字体。

TH-OCR XP 能够识别全部简体国标一二级6763个字符,繁体13000多字符。  
TH-OCR XP 能够识别彩色图象,并转换成带有彩色图片的RTF格式(WORD可编辑)。  
TH-OCR XP 支持多任务,可以在识别一篇文章的同时扫描或编辑其它文档。  
TH-OCR XP 中对于每个区域可以设定不同的字体,例如一篇文档中的大段英文可以设为英文识别,以提高识别率。 按住Ctrl键用鼠标拖动,可以移动区域。   
按住Shift键用鼠标点取,可以选择多个区域,一起设置字符集和类型。  
按住Shift键用鼠标右键拉直线可以进行手动倾斜校正。 版面分析前根据实际情况选择“报纸版面”或“杂志版面”可以提高版面分析正确性。   
对一般文本识别扫描分辨率用300DPI比较合适,识别小于5号的字可选400DPI。
选择“简体全字集”或“繁体全字集”,能够识别更多的字体和全部字符集,但识别速度较慢。


[ 本帖最后由 tlz0214 于 2008-2-24 08:39 编辑 ]

评分

参与人数 1经验 +1 收起 理由
etly + 1 版区有你更精彩: )

查看全部评分

xffsfy
发表于 2008-2-24 11:46:19 | 显示全部楼层
[:27:] Office 2003时代就可以实现OCR识别了
首先将需要识别的图片用Microsoft Office Document Image Writer打印出来
接着运行开始菜单里的Office文件夹-Microsoft Office工具-Microsoft Office Document Imaging程序,选择打开,将刚刚打印的tif导入进来。然后点菜单栏的工具-使用OCR识别文本,然后在点工具-将文本发送到Word。
over~~~
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

手机版|杀毒软件|软件论坛| 卡饭论坛

Copyright © KaFan  KaFan.cn All Rights Reserved.

Powered by Discuz! X3.4( 沪ICP备2020031077号-2 ) GMT+8, 2025-7-14 06:45 , Processed in 0.083460 second(s), 17 queries .

卡饭网所发布的一切软件、样本、工具、文章等仅限用于学习和研究,不得将上述内容用于商业或者其他非法用途,否则产生的一切后果自负,本站信息来自网络,版权争议问题与本站无关,您必须在下载后的24小时之内从您的电脑中彻底删除上述信息,如有问题请通过邮件与我们联系。

快速回复 客服 返回顶部 返回列表