帮酷LOGO
0 0 评论
  • 显示原文与译文双语对照的内容
文章标签:OCR  Tesseract  
Tesseract OCR for iOS

  • 源代码名称:tesseract-ios
  • 源代码网址:http://www.github.com/ldiqual/tesseract-ios
  • tesseract-ios源代码文档
  • tesseract-ios源代码下载
  • Git URL:
    git://www.github.com/ldiqual/tesseract-ios.git
  • Git Clone代码到本地:
    git clone http://www.github.com/ldiqual/tesseract-ios
  • Subversion代码到本地:
    $ svn co --depth empty http://www.github.com/ldiqual/tesseract-ios
    Checked out revision 1.
    $ cd repo
    $ svn up trunk
    
  • 用于iOS的超正方体

    超立方体ios不再主动维护。 我建议你使用 gali8 Tesseract-OCR-iOS的

    Tesseract-ios是一个 objective-c 封装,用于超正方体的OCR。

    他的文章里有很多代码。

    要求

    • iOS 6.0,iOS 5.0 + ( 不支持 armv6 )
    • 来自 tesseract-ios-lib repo的超正方体和Leptonica库。

    安装

    • 以组的形式添加 tesseract-ios,并通过引用将 tessdata 添加到项目中:
    • 转到项目设置,并确保 C++ Standard Library => libstdc++ :

    用法

    下面是从图像中提取文本的默认工作流:

    • 用数据路径和语言实例化超正方体
    • 设置变量( 字符集。)
    • 将图像设置为分析
    • 开始识别
    • 获取识别的文本
    • 清除

    代码示例

    
    #import"Tesseract.h"
    
    
    
    Tesseract* tesseract = [[Tesseract alloc] initWithDataPath:@"tessdata" language:@"eng"];
    
    
    [tesseract setVariableValue:@"0123456789" forKey:@"tessedit_char_whitelist"];
    
    
    [tesseract setImage:[UIImage imageNamed:@"image_sample.jpg"]];
    
    
    [tesseract recognize];
    
    
    
    NSLog(@"%@", [tesseract recognizedText]);
    
    
    [tesseract clear];
    
    
    
    

    方法参考

    -initWithDataPath:language:

    - (id)initWithDataPath:(NSString *)dataPath language:(NSString *)language

    初始化新的Tesseract 实例。

    • dataPath: 从应用程序包到 .traineddata 文件的相对路径。 你可以从超立方体下载小节中找到这些文件。
    • language: 用于识别的语言。 Ex: eng 将在 dataPath 目录中搜索 eng.traineddata 文件。

    如果instanciation失败,则返回 nil

    -setVariableValue:forKey:

    - (void)setVariableValue:(NSString *)value forKey:(NSString *)key

    将多维正方体变量 key 设置为 value。 有关完整的( 但不是 up-to-date ) 列表,请参阅 http://www.sk-spell.sk.cx/tesseract-ocr-en-variables

    例如使用 tessedit_char_whitelist 将字符限制到特定的集合。

    -setImage:

    - (void)setImage:(UIImage *)image

    将图像设置为识别。

    -setLanguage:

    - (BOOL)setLanguage:(NSString *)language

    重写用 -initWithDataPath:language: 定义的语言。

    -recognize

    - (BOOL)recognize

    开始文本识别。你可以能希望在背景下启动这里过程 NSObject-performSelectorInBackground:withObject:

    -recognizedText

    - (NSString *)recognizedText

    获取从图像提取的文本。

    -clear

    - (void) clear

    从图像识别文本后清除超正方体对象。 防止内存泄漏。



    文章标签:OCR  Tesseract  

    Copyright © 2011 HelpLib All rights reserved.    知识分享协议 京ICP备05059198号-3  |  如果智培  |  酷兔英语