最近,新疆赛卡信息科技有限公司推出了维、哈、柯印刷字符识别软件,简称UKKOCR。该软件是由新疆大学信息科学与工程学院和清华大学电子工程系联合研制的。
UKKOCR的工作原理为通过扫描仪或数码相机等光学输入设备获取纸张上的文字图片信息,利用各种模式识别算法分析文字形态特征,判断出文字的标准编码,并按通用格式存储在文本文件中。
该软件能在Windows2000以上操作系统中正常运行,并具有以下核心功能:支持TIFF,PCAX,JPG,BMP格式图像中的文字识别;能够对图像倾斜进行自动校正;能够对图像进行自动版面分析;实现了单文种(维吾尔文、哈萨克文、柯尔克孜文)和与汉文、英文的双向混排文种的自动识别,识别率高达96%;支持Unicode国际字符编码标准等。
该软件能够快速地将不可编辑的书刊、报纸、公文、宣传页等印刷文档转化为可供阅读和编辑的高质量电子文档,在党政机关、报社、出版社、教育机构等领域将得到广泛应用。