博客日历
2024年05月 | ||||||
一 | 二 | 三 | 四 | 五 | 六 | 七 |
29 | 30 | 1 | 2 | 3 | 4 | 5 |
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 | 1 | 2 |
存档
2024年03月 04月 2021年
01月 02月 11月 12月 2020年
02月 03月 04月 05月 06月 07月
09月 2018年
09月 2017年
01月 02月 07月 2016年
01月 04月 07月 08月 11月 12月
2015年
01月 02月 03月 05月 09月 10月
11月 2014年
01月 02月 03月 04月 05月 06月
07月 08月 09月 10月 11月 12月
2013年
01月 02月 03月 04月 05月 06月
07月 08月 09月 10月 11月 12月
2012年
01月 02月 03月 04月 05月 06月
07月 08月 09月 10月 11月 12月
2011年
01月 02月 03月 04月 05月 06月
07月 08月 09月 10月 11月 12月
2010年
01月 02月 03月 04月 05月 06月
07月 08月 09月 10月 11月 12月
2009年
03月 04月 05月 06月 07月 08月
09月 10月 11月 12月
开源OCR引擎Tesseract的基本应用
项目地址:http://code.google.com/p/tesseract-ocr/
最简单的应用示例代码:
最简单的应用示例代码:
#include <allheaders.h>
#include <baseapi.h>
#include <strngs.h>
#include <publictypes.h>
#pragma comment(lib,"liblept168.lib")
#pragma comment(lib,"libtesseract302.lib")
int test_ocr(char* img_path)
{
tesseract::TessBaseAPI tessApi;
int ret = tessApi.Init(
"<tessdata所在的目录>",
"eng", // 中文:"chi_sim"
tesseract::OEM_DEFAULT,
NULL,
0,
NULL,
NULL,
false);
if(ret != 0)
{
return ret;
}
tessApi.SetPageSegMode( static_cast<tesseract::PageSegMode>( tesseract::PageSegMode::PSM_SINGLE_BLOCK));
STRING text_out;
if (!tessApi.ProcessPages(img_path, NULL, 0, &text_out))
{
return -1;
}
// 返回的字符是UTF-8编码
// text_out.string();
return 0;
}
// 这里的test.jpg是经过处理得到的二值化单行文本。
test_ocr("C:\test.jpg");
程序的目录结构:
test.exe
tessdata
liblept168.dll
libtesseract302.dll
参考:
http://blog.csdn.net/yasi_xi/article/details/8763385
http://www.cnblogs.com/baizx/archive/2010/08/23/1806136.html
http://club.excelhome.net/thread-897117-1-1.html
分类:Win32/C++ 查看次数:11091 发布时间:2014/8/29 21:39:31
WinMerge 的文件/目录过滤器
WinMerge是一款开源的文件对比合并工具。
http://winmerge.org/
WinMerge提供了“过滤器”功能,可以在对比目录时排除特定的目录或文件,下面是一个过滤器的示例,用来排除ClearCase的.copyarea.db文件。
ClearCase.flt
## "##"是行内注释
## WinMerge 文件/目录过滤器标题和说明
name: ClearCase 过滤器
desc: ClearCase 辅助文件过滤器
## 设置过滤器的类型
## "include" 过滤器对比所有不匹配规则的的项
## "exclude" 过滤器仅对比所有匹配规则的的项
def: include
## 过滤规则
## 文件过滤器的格式 "f: <正则表达式>"
## 目录过滤器的格式 "d: <正则表达式>"
f: \.copyarea\.db$
过滤器使用方法:
工具 -> 过滤器 -> 文件过滤器 -> 安装(选择此.flt文件)
分类:杂谈随感 查看次数:9840 发布时间:2014/7/29 19:35:19