工程设计图是设计院和工厂的宝贵财富,可以在新的设计项目中部分重复使用和参考。当CAD技术在一个企业内应用到相当规模后,就有迫切的愿望将过去存档的几万张乃至几十万张手工绘制的图纸与用CAD系统新生成的绘图文件汇总在一起,形成计算机管理的统一数字化图库。从80年代中期起,很多工业发达国家开始从事这一工作。最简单的方法是请人用某一种CAD系统重画一遍过去的蓝图。这样可以使图面美观统一,尺寸比例准确。但这笔费用相当可观。人们自然要努力研制高效的图纸自动扫描输入系统。最简单的扫描输入处理是用CCD摄像头将图纸上的线条和字符变换成二值的位图记录,空区用0表示,线条和字符的笔划部分用1表示。图像数据经过压缩后仍以点阵的形式存储和显示到屏幕上。用户可以交互修改图画,例如擦去多余的象素,将线条修光或者增删某些线条和标注等,然后用点阵式静电绘图机绘出新的图纸。这类系统的主要缺点是仍旧不能与用CAD系统新画的图纸做到完全兼容。 处理功能上升一级是将图像变成矢量,用笔式绘图机输出绘图。某些功能强的扫描输入装置还能进一步识别字母、数字、汉字以及标准符号,如电路图中的元件等。处理功能再上升一级,就是引入人工智能技术,使系统带有一定的智能,能在某种程度上理解图纸的内容。这方面的最终目标是能自动找出图面上的尺寸标注与被标注的几何元素间的一一对应关系,并且建立几何图形的拓扑结构,让软件根据尺寸标注值重建整幅画面,以此达到人工输图中重画一遍图纸的同样效果。现阶段将图像转变成矢量,进而将矢量变成结构化的几何图素的技术还不成熟,因此,不可能有商品化及工程图纸全自动扫描输入与识别系统。 工程图纸目前扫描输入与识别的一般步骤如下所述。 1). 用光电元件逐行扫描线输入工程图纸,扫描的点阵密度可以从每英寸200~300点(简称dpi:dot per inch)到500甚至1000点。扫描的灰度等级最简单的只有两级,低于设定的分界值取为0,否则取1。这样一张图纸经过扫描输入后便变成由0和1组成的图像文件。为了节省磁盘存储空间,图像数据需要压缩,目前一般采用国际电报电讯咨询委员会CCITT制订的TIFF(Tag Image File Format)标志图像文件格式,与传真和电子印刷和系统的图像传输格式相统一,可以将存储数据量压缩到1/15~1/30。 2). 去除噪声,即去除图纸上的污点、线条上的毛刺和断裂等,对线条经细化,将多点宽度的线条通过侵蚀算法缩减到一个点宽,获得图形的骨架。这样可以在几何特征基本保持不变的前提下大量地减少处理数据,使得几何关系更加明朗化;但缺点是会引起变形,并且失去了线宽信息,线条粗细对工程图是有意义的,因此有的系统不做细化处理,或在细化过程中同时提取线宽信息。 3). 矢量化,即从图像中找出所有线段,然后根据各线段之间的连接关系生成直线、圆弧、虚线和曲线等。矢量化可以将原始扫描图像的数据量压缩到1/100以下。 4). 识别箭头、字符和图形符号等。 5). 最后进一步校正图形,修补线条,生成某一CAD系统格式的绘图文件。 在上述每一步中,都要有许多用户的交互操作,以弥补全自动处理的不完备。 |