CIMS論文的天地

 

 

基于單義域鄰接圖的工程圖紙掃描圖象的字符提取

注意:本論文已在《工程圖學學報》(2000.21(2):90~95)雜志發表,
使用者請注明論文出處

張習文 歐宗瑛
(大連理工大學機械工程學院,CAD&CG研究所 大連 116024)

摘要 工程圖紙掃描圖象的圖文分割是一個重要問題。本文在構建單義域鄰接圖基礎上來提取字符及其特征。圖文分離先從單義域中篩選字符筆劃域,進行初步分離。然后,以字符筆劃域為起點,遍歷鄰接圖來搜索鄰接字符筆劃域,提取字符域,分析特性作進一步篩選。以字符域鄰近與共線為判據來組合字符串域,字符域鄰近是用其外接膨脹矩形相交來判定。利用共串字符域外接矩形中心及所附圖形對字符域進行定向。對非水平字符域旋轉至水平,并構建其單義域鄰接圖,以表達幾何與拓撲特征,為后續識別作準備。實例表明,本算法可以較好地處理字符與圖形的粘連問題,提取效果很好,且能夠描述字符整體特征。

1  引言

工程圖紙掃描圖象的識別與理解是目前學術界和工程界研究的熱點,在機械、電子、建筑及地理信息系統等應用領域中具有重要的實際意義。圖樣中有兩部分信息,一是圖形,由幾何圖素組成,用來表達產品形體;二是文字,用來定義產品尺寸及描述其它信息,有的附于圖形,如尺寸數字等,也有獨立存在的,如技術要求等。文字是圖樣中非常重要的信息。因此,工程圖紙掃描圖象的字符提取與識別是一個重要問題,對進一步的尺寸理解、圖像理解等高層次理解都有較大作用。工程圖樣中的文字包括多種字符,如漢字、數字、字母及符號等。字符情況較為復雜,有自己的一些特點:字符多為手寫,具有一定的隨意性,不同于印刷體;具有多種方向,不僅有水平書寫,而且有的垂直放置,還有其它各種角度的斜向;有直體與斜體;有時字符與字符及圖形粘連,增加了圖文分割及字符提取的難度;位置分散,大小不一。上述情況在字符的分割及識別時都必須考慮。所以,工程圖樣字符提取及識別是一個十分困難的問題。

鑒于工程圖樣字符的特點,其處理方法與光柵文檔具有很大差別,一般的處理過程是:先標識連通體,從中選出字符域,再根據字符域鄰近和共線來生成字符串域,并判斷方向,然后分割字符域,最后進行字符識別及校正。經過多年研究,工程圖樣字符的分割及識別算法已有多種:一是基于連通體[1];二是基于輪廓跟蹤[2],利用同步邊緣特性檢測進行輪廓跟蹤,分離字符輪廓,采用鄰域搜索來生成字符串,最后通過分類樹進行字符識別,并根據專業知識作校正;三是行程編碼匹配法[3],采用圖分割集方法來分割與字符及圖形粘連的字符。

本文提出一種基于單義域鄰接圖的圖文分割方法,在二值圖象水平黑游程編碼基礎上,以相關游程線寬和拓撲的一致為約束生成條形域,對其中多義域作分裂獲得單義域:線段域和圓弧域,并建立其鄰接圖。字符筆劃可以表示為一個或多個單義域。字符筆劃的長度較小,線寬一致。根據這些特點,從單義域中篩選字符筆劃域,進行初步圖文分離。字符筆劃多是鄰接的,以字符筆劃域為起點,通過遍歷鄰接圖搜索鄰接的字符筆劃域,來提取字符域。字符結構與圖元差別較大,根據字符域特性實現字符進一步篩選。采用字符域外接矩形來標識字符的大小和位置。根據字符域外接矩形相交來判定字符鄰近,再加上字符共線為判據來生成字符串域。圖樣中字符串多是附于圖形的,單義域可以很容易獲取方向,即可得圖形方向。利用共串字符外接矩形中心及所附圖形對字符進行定向。然后將非水平字符域旋轉至水平,并重新進行水平黑游程編碼,以單義域鄰接圖來表達字符的結構特征,為后續識別作準備。下面進行詳細介紹。

2   圖象的單義域鄰接圖描述

在工程圖形中,既有圖元又有字符。圖元有多種,如線段、圓弧、圓、箭頭等,而且圖元多為相交。不同圖元需要用一種結構來統一描述,然后通過分析其幾何與拓撲特征確定類型來進行矢量化。交點信息對提取同一圖元及不同圖元之間拓撲關系具有重要指導意義。字符是由筆劃組成的,在提取筆劃的基礎上進行識別是一種很好的方法。但筆劃的提取難度較大。現有對圖樣字符的識別多是處理數字和字母,較少涉及漢字,而我國圖紙均有大量漢字信息,還有數字及字母等。因此,需要建立一種模型,既能表達幾何數據,還可以描述拓撲關系,便于各種特征提取。

現有圖文分離算法多是以象素為單元,進行連通體生成。而連通體對后續識別貢獻較小,尤其是對圖元的識別。這就要求采用一種模型能夠統一描述圖形和文字的幾何與拓撲信息。基于單義域鄰接圖的描述模型,可以統一描述圖元和文字,不但能提取圖元,還為字符識別的筆劃特征提取提供啟發。下面給出單義域鄰接圖的建立方法。

對圖象作水平黑游程編碼,這時對圖象的分析單元由象素變為游程,游程連通性反映了圖形拓撲關系。如圖1.b所示。通過分析游程的拓撲關系,可以獲取具有轉折意義的游程[4]。這些關鍵游程為圖元分割提供線索。相關游程基于寬度和拓撲一致性可以聚合為一個集合,來表達某一幾何與拓撲意義,稱之為條形域。條形域具有較強的整體性和宏觀性[5]。但是,有的條形域具有多義性,即由線段域和圓弧域組成,對多義域需作分裂得單義域。這時,圖象的表達單元變為單義域,如圖1.c所示。而單義域首末游程的拓撲則表達了單義域的拓撲關系。單義域鄰接圖可以完整地表達圖象中圖元與字符的幾何與拓撲信息。如圖2所示。

wpeD.jpg (29597 字節)

3  字符提取

圖文分離算法已有多種,主要是基于連通域。多數字符是一個連通域,數字、字母及漢字多是連通的,或是由幾個連通域構成的,而且字符域具有許多與幾何圖元域不同的特征。在實際中多以象素八鄰域來進行字符提取,且輔以多種字符屬性判斷,確認是字符域而不是圖形域,并生成其最小外接矩形,用以標識字符域的大小與位置。上述算法主要是分析連通域的特征來確定字符,在生成連通體時,對于圖文粘連情況,勢必形成一體,需要后續分割或造成圖文誤分。這主要是因為在形成連通體時只是基于象素。如果能夠在確定筆劃域的基礎上進行圖文分割及字符提取,則毫無疑問會提高分割及提取效果。

根據制圖規則,圖樣中的漢字、數字、字母的字體均有規定,在一定掃描率下,可以確定字符的范圍閾值,從而確定字符筆劃的長度,而字符筆劃線寬又是基本一致的,根據這兩個條件從單義域中選取字符筆劃域。鄰接的字符筆劃域為一個字符,或是一個字符的部分筆劃。字符提取是以字符筆劃域為基礎的,遍歷鄰接圖搜索鄰接的字符筆劃域來完成。下面給出具體算法:

1)取出未訪問字符筆劃域,設為當前域,新建字符域及其外接矩形,將當前域插入字符域。

2)如果當前域無鄰接的可訪問域,則轉到(4),否則,取當前域鄰接的未訪問字符筆劃域,設為當前域,插入字符域,字符域外接矩形生長。

3)返回(2)。

4)得一字符。

字符結構與圖元差別較大,根據字符域特性[1]實現字符進一步篩選。圖3.a給出圖1.a的字符提取結果,采用外接矩形標識。

wpeE.jpg (25909 字節)

4 字符串生成

工程圖紙中字符多以串的形式存在,組成字符串來表達語義。分析字符的字符串歸屬能夠為字符識別提供方向及上下文等信息。由于圖樣字符的多向性,字符的方向確定也需從字符串中獲取。對于小象素群究竟是小數點還是噪聲,只有置身于字符串的上下文中才能作出正確判斷。因此,字符串的組合是繼字符提取之后的必然要求。

字符串成組通常采用的方法有兩種,一種是利用Hough變換進行共線檢測[6];另一種是相鄰檢測,即字符串的生成就是將鄰近字符組合在一起。第二種方法有多種作法:一種是以字符外接矩形的中心距為判據的,與某一閾值作比較,若小于閾值則將其歸為同一字符串。一般先進行水平、垂直兩個方向字符串搜索,再進行斜方向,以字符外接矩形的中心距為判定值,對不同方向采用不同閾值[2]。另一種是以字符外接矩形的角點距為判據的,與某一閾值作比較,若小于閾值則將其歸為同一字符串[7]。閾值與方向的關系較大,有時需要同時處理多種情況。

上述方法即使對同一字體由于方向不同(水平、垂直、斜向)需采取不同閾值,對方向較為敏感。本文采用一種矩形求交方法來進行字符鄰近判斷,可以較好地解決字符鄰近判斷問題,無需預先設定方向。

4.1字符組合

在圖樣中,不同大小文字之間的行列間距是不同的,文字列間距與其大小具有一定對應關系。本文根據字符域外接矩形自適應求得字間距,通過膨脹字符外接矩形,即字符外接矩形按字列間距擴大生成膨脹矩形,對膨脹矩形進行求交運算來判定兩個字符是否鄰近。同一字符串的字符不但是鄰近的,而且還應共線(第三個字符起)。下面給出字符組合步驟:

1)取出未訪問字符域i, 設為當前域,新建字符串域,將當前域插入字符串域。

2)如果當前域無鄰近且共線的可訪問域,則轉到(4),否則,取當前域鄰近且共線的未訪問字符域,設為當前域,并插入字符串域。

3)返回(2)。

4)得一字符串。

3.b可以看出,矩形求交方法可以較好解決字符組合問題,在字符串的生長中無需預設方向。

4.2字符串定向及旋轉

工程圖樣中字符是多向的,其定向問題直接影響識別精度。字符串的方向為其書寫的基線方向。多數方法以字符中心連線來確定方向,但,如果字符較少,則誤差較大。在工程圖紙中,多數字符串附于圖形,尤其是線段,而其基線方向與其所附線段的方向一致,如機械圖樣中的尺寸數字。由于采用單義域鄰接圖來描述圖象中圖形和文字,從單義域中可以很容易獲得圖形的方向信息。對于附于圖形的字符串定向,可以采用比較字符串中心線與所附線段來確定字符串的基線方向。如果字符串鄰近的某一單義域(線段域)的方向與字符串中字符域中心連線方向一致,則采用線段域方向作為字符串方向。而獨立字符串的定向問題可采用文獻[1]方法。

對于水平字符串,可以直接取出每個字符進行識別。而對其它方向的字符串,需先對每個字符根據其方向旋轉至水平然后進行識別。圖3.b給出字符串標識。圖3.c給出旋轉后結果。

5  字符單義域表示

wpeF.jpg (17667 字節)

我國圖紙多是中西文混合,字符識別的特征提取必須考慮漢字特點,筆劃特征明顯。字符識別的特征提取方法很多,如果能夠提取筆劃,則必定會大大提高識別效果[8]。采用單義域鄰接圖可以較好地提取、表達字符的幾何與拓撲信息。圖4給出字符單義域表示實例。

6  結束語

本文采用單義域鄰接圖來表達圖象信息,在確定筆劃域的基礎上進行圖文分割及字符提取,整體性很強。本研究算法已被應用于我們開發的工程圖紙掃描圖象識別與理解系統之中,字符提取效果較好。但仍需進一步完善,研究各種復雜情況,以提高字符及其筆劃特征提取精度,尤其是研究各種結構漢字,進行以筆劃為基礎的中西文識別。

參考文獻

 

[1] 鄒榮金,蔡士杰,張福炎等. 字符粘連及字線相交的分割與識別方法. 軟件學報,199910(3)241-247
[2] 胡友蘭,黃樹槐,常明. 工程圖中字符分離和標注字符串生成技術. 華中理工大學學報,1997253):30-33
[3] 陳勇,朱林,常明. 工程圖中粘連字符的提取與分割. 華中理工大學學報,1996244):23-26
[4] S. Di Zenzo, L. Cinque, and S. Levialdi. Run-Based Algorithms for Binary Image Analysis and Processing. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1996
18(1)83-89
[5] 王金鶴. 基于條形域結構的掃描圖樣識別理論與方法研究(博士學位論文). 大連,大連理工大學,1999.6
[6] 江早,劉積仁,劉晉軍. 工程圖紙圖象圖文自動分割工具SegChar. 軟件學報,1999,10(6):589-594
[7] 李偉青,彭群生. 一種新的字符提取和組合算法. 工程圖學學報,1997,No.2-3:38-45
[8] L. Y. Tseng and C. T. Chuang. An efficient Knowledge-Based Stroke Extraction Method for Multi-Font Chinese Characters. Pattern Recognition, 1992, 25(12): 1445-1458

 

An Algorithm of Extracting Characters from Scanned Image of Engineering Drawings Using Primitive Region Adjacency Graph

Zhang Xiwen, Ou Zongying
(Institute of CAD&CG, School of Mechanical Engineering, Dalian University of Technology, Dalian 116024)

 

Abstract It is a important issue how to separate text from scanned image of engineering drawings. The paper presents an algorithm to extract characters and their features from images using Primitive Region Adjacency Graph. We can easily get character stroke regions from primitive regions. At start of a character stroke region, a character region grows by traversing the graph for adjacent character stroke regions. After analyzing features of character regions, we can get real character regions. A string can be got through combining those near and collinear character regions. If rectangles inflated of two character regions are intersected, they are near. The direction of a string region is attained by the center points of enclosed rectangles of characters shared by the string and figures attached. Then characters not horizontal are rotated to horizontal. A Primitive Region Adjacency Graph can represent geometrical and topological features of a character region, which is helpful to extract features of a character region. Some applications show that the algorithm can deal with adherence of characters to graphics, and is effective and robust.
Key words Primitive Region Adjacency Graph, text-graphics separation, character stroke regions, character extraction, feature extraction

作者簡介:

張習文,1971年9月生,博士生,研究方向為模式識別和圖象理解。

歐宗瑛,教授,博士生導師,主要從事智能CAD、圖象理解、人工智能、分形和小波等研究。

 

 


作者點評:

歡迎您參加討論,發表您對此論文及其研究領域的看法!
(請在發言時在標題中使用所點評的論文的題目或研究方向,這樣方便大家瀏覽!)

返回首頁 | CIMS論文 | 并行工程 | 虛擬制造 | 敏捷制造 | 其他論文 | 項目開發 | 學術資源 | 站內全文搜索 | 免費論文網站大全 |

line.gif (4535 字節)

為了更好的為大家服務,歡迎您參加本站的投票調查

>>>>參加更多投票調查請點擊!

本站永久域名:http://www.sqvswk.live歡迎訪問

注意:本站內容未經書面允許不得轉載

All rights reserved, all contents copyright 2000-2019
本站自2000年3月總網頁訪問量為
pk10开奖记录直播