文通表格表單識別系統(tǒng)軟件一、產(chǎn)品簡介:
表格、票據(jù)自動識別SDK是一種通用的數(shù)據(jù)批量采集技術(shù),適用于采集具有表格特征的表單、問卷、票據(jù)的數(shù)據(jù),通過掃描、圖像處理、自動分類、OCR(光學(xué)字符識別)技術(shù),將表格圖像中的數(shù)據(jù)信息準(zhǔn)確、快速、真實(shí)地提取并保存,數(shù)據(jù)結(jié)果可導(dǎo)出為標(biāo)準(zhǔn)的數(shù)據(jù)格式,如Excel表、XML文件,與企事業(yè)單位的ERP、CRM等系統(tǒng)實(shí)現(xiàn)無縫結(jié)合。系統(tǒng)支持中英文、數(shù)字、符號等多類型字符的手寫體、印刷體識別。
二、應(yīng)用背景:
表格是一種高度精煉,集中的信息表達(dá)手段,紙質(zhì)表格被廣泛的應(yīng)用于數(shù)據(jù)采集,將紙質(zhì)表格數(shù)據(jù)轉(zhuǎn)換成電子數(shù)據(jù)是信息化必然趨勢。傳統(tǒng)的人工數(shù)據(jù)錄入方式效率低下、差錯率高、成本昂貴,北京文通科技結(jié)合其在OCR(光學(xué)字符識別)領(lǐng)域的尖端技術(shù),為客戶提供企業(yè)級的數(shù)據(jù)采集方案,在數(shù)據(jù)采集和數(shù)據(jù)應(yīng)用之間架起高速通道。
三、SDK概述:
3.1工作流程概述
3.2 SDK識別性能參數(shù):
識別字符類型
印刷體:中文(簡繁體)、英文、數(shù)字
手寫體:中文(簡繁體)、英文、數(shù)字
符號類:標(biāo)識碼、條碼、 CheckBox、√、▇、○、●等,可定制符號
識別速度
單張表格的平均識別速度在1.0秒鐘左右;
識別率
對于版面整潔的印刷字符的識別,正確率達(dá)99.96%
對于規(guī)范手寫數(shù)字、英文的識別,正確率達(dá)98.5%
對于規(guī)范手寫漢字的識別,正確率在 85%左右;
3.3 SDK主要模塊及功能特點(diǎn):
表格模板編輯器:輕松快速定義識別模板;
圖像預(yù)處理模塊:自動去黑邊、自動糾偏、去噪聲、圖像自動旋轉(zhuǎn)、多種二值化方法處理;
表格自動分類:系統(tǒng)能自動區(qū)分當(dāng)前表格、票據(jù)的業(yè)務(wù)類別,實(shí)現(xiàn)全自動歸檔;
字符識別引擎:支持識別豐富的文字、符號類型;
快速校對工具:集字校對器、橫向校對器
3.4 SDK開發(fā)環(huán)境
計(jì)算機(jī)性能:CPU-2.0GHz,內(nèi)存-512MB,硬盤-2G;
操作系統(tǒng):Win98/Win 2000/Win XP/2003 Server/vista/2008 Server/Win 7;
API接口:以標(biāo)準(zhǔn)的DLL(動態(tài)鏈接庫)、OCX控件方式提供,支持VB、C#、Delphi、PB、 C/C++/VC++、Java等常用程序語言的調(diào)用;
四、我們的技術(shù)服務(wù):
我們的宗旨是為客戶提供企業(yè)級的數(shù)據(jù)采集技術(shù),我們的技術(shù)服務(wù)內(nèi)容包括識別需求評估、表格規(guī)范設(shè)計(jì)、模板定制、二次開發(fā)技術(shù)支持,在企事業(yè)客戶開發(fā)應(yīng)用系統(tǒng)的過程中,我們將全程跟蹤,為客戶方提供專業(yè)團(tuán)隊(duì)的技術(shù)服務(wù)。