正则表达式(Regular Express)

  正则表达式是一种可以用于模式匹配和替换的强有力的工具,在几乎所有的基于UNIX系统的工具中找到正则表达式的身影,例如,vi编辑器,Perl或PHP脚本语言,以及awk或sed shell程序等。此外,象Javascript、VBScript等客户端的脚本语言也提供了对正则表达式的支持。由此可见,正则表达式已经超出了某种语言或某个系统的局限,成为人们广为接受的概念和功能。

  正则表达式可以让用户通过使用一系列的特殊字符构建匹配模式,然后把匹配模式与数据文件、程序输入以及WEB页面的表单输入等目标对象进行比较,根据比较对象中是否包含匹配模式,执行相应的程序。

  举例来说,正则表达式的一个最为普遍的应用就是用于验证用户在线输入的邮件地址的格式是否正确。如果通过正则表达式验证用户邮件地址的格式正确,用户所填写的表单信息将会被正常处理;反之,如果用户输入的邮件地址与正则表达的模式不匹配,将会弹出提示信息,要求用户重新输入正确的邮件地址。由此可见正则表达式在WEB应用的逻辑判断中具有举足轻重的作用。

    基本语法

  在对正则表达式的功能和作用有了初步的了解之后,接下来具体看一下正则表达式的语法格式。

  正则表达式的形式一般如下:

  /love/

  其中位于“/”定界符之间的部分就是将要在目标对象中进行匹配的模式。用户只要把希望查找匹配对象的模式内容放入“/”定界符之间即可。为了能够使用户更加灵活的定制模式内容,正则表达式提供了专门的“元字符”。所谓元字符就是指那些在正则表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符)在目标对象中的出现模式。

  较为常用的元字符包括: “+”, “*”,以及 “?”。其中,“+”元字符规定其前导字符必须在目标对象中连续出现一次或多次,“*”元字符规定其前导字符必须在目标对象中出现零次或连续多次,而“?”元字符规定其前导对象必须在目标对象中连续出现零次或一次。

  下面介绍正则表达式元字符的具体应用。

  /fo+/

  因为上述正则表达式中包含“+”元字符,表示可以与目标对象中的 “fool”, “fo”, 或者 “football”等在字母f后面连续出现一个或多个字母o的字符串相匹配。

  /eg*/

  因为上述正则表达式中包含“*”元字符,表示可以与目标对象中的 “easy”, “ego”, 或者 “egg”等在字母e后面连续出现零个或多个字母g的字符串相匹配。

  /Wil?/

  因为上述正则表达式中包含“?”元字符,表示可以与目标对象中的 “Win”, 或者 “Wilson”,等在字母i后面连续出现零个或一个字母l的字符串相匹配。

  除了元字符之外,用户还可以精确指定模式在匹配对象中出现的频率。例如,

  /jim{2,6}/

  上述正则表达式规定字符m可以在匹配对象中连续出现2-6次,因此,上述正则表达式可以同jimmy或jimmmmmy等字符串相匹配。

  在对如何使用正则表达式有了初步了解之后,我们来看一下其它几个重要的元字符的使用方式。

  \s:用于匹配单个空格符,包括tab键和换行符;

  \S:用于匹配除单个空格符之外的所有字符;

  \d:用于匹配从0到9的数字;

  \w:用于匹配字母,数字或下划线字符;

  \W:用于匹配所有与\w不匹配的字符;

  . :用于匹配除换行符之外的所有字符。

  (说明:我们可以把\s和\S以及\w和\W看作互为逆运算)

  下面,我们就通过实例看一下如何在正则表达式中使用上述元字符。

  /\s+/

  上述正则表达式可以用于匹配目标对象中的一个或多个空格字符。

  /\d000/

  如果手中有一份复杂的财务报表,那么就可以通过上述正则表达式轻而易举的查找到所有总额达千元的款项。

  除了以上所介绍的元字符之外,正则表达式中还具有另外一种较为独特的专用字符,即定位符。定位符用于规定匹配模式在目标对象中的出现位置。

  较为常用的定位符包括: “^”, “$”, “\b” 以及 “\B”。其中,“^”定位符规定匹配模式必须出现在目标字符串的开头,“$”定位符规定匹配模式必须出现在目标对象的结尾,\b定位符规定匹配模式必须出现在目标字符串的开头或结尾的两个边界之一,而“\B”定位符则规定匹配对象必须位于目标字符串的开头和结尾两个边界之内,即匹配对象既不能作为目标字符串的开头,也不能作为目标字符串的结尾。同样,我们也可以把“^”和“$”以及“\b”和“\B”看作是互为逆运算的两组定位符。举例来说:

  /^hell/

  因为上述正则表达式中包含“^”定位符,所以可以与目标对象中以 “hell”, “hello”或 “hellhound”开头的字符串相匹配。

  /ar$/

  因为上述正则表达式中包含“$”定位符,所以可以与目标对象中以 “car”, “bar”或 “ar” 结尾的字符串相匹配。

  /\bbom/

  因为上述正则表达式模式以“\b”定位符开头,所以可以与目标对象中以 “bomb”, 或 “bom”开头的字符串相匹配。

  /man\b/

  因为上述正则表达式模式以“\b”定位符结尾,所以可以与目标对象中以 “human”, “woman”或 “man”结尾的字符串相匹配。

  为了能够方便用户更加灵活的设定匹配模式,正则表达式允许使用者在匹配模式中指定某一个范围而不局限于具体的字符。例如:

  /[A-Z]/

  上述正则表达式将会与从A到Z范围内任何一个大写字母相匹配。

  /[a-z]/

  上述正则表达式将会与从a到z范围内任何一个小写字母相匹配。

  /[0-9]/

  上述正则表达式将会与从0到9范围内任何一个数字相匹配。

  /([a-z][A-Z][0-9])+/

  上述正则表达式将会与任何由字母和数字组成的字符串,如 “aB0” 等相匹配。这里需要提醒用户注意的一点就是可以在正则表达式中使用 “()” 把字符串组合在一起。“()”符号包含的内容必须同时出现在目标对象中。因此,上述正则表达式将无法与诸如 “abc”等的字符串匹配,因为“abc”中的最后一个字符为字母而非数字。

  如果我们希望在正则表达式中实现类似编程逻辑中的“或”运算,在多个不同的模式中任选一个进行匹配的话,可以使用管道符 “|”。例如:

  /to|too|2/

  上述正则表达式将会与目标对象中的 “to”, “too”, 或 “2” 相匹配。

  正则表达式中还有一个较为常用的运算符,即否定符 “[^]”。与我们前文所介绍的定位符 “^” 不同,否定符 “[^]”规定目标对象中不能存在模式中所规定的字符串。例如:

  /[^A-C]/

  上述字符串将会与目标对象中除A,B,和C之外的任何字符相匹配。一般来说,当“^”出现在 “[]”内时就被视做否定运算符;而当“^”位于“[]”之外,或没有“[]”时,则应当被视做定位符。

  最后,当用户需要在正则表达式的模式中加入元字符,并查找其匹配对象时,可以使用转义符“\”。例如:

  /Th\*/

  上述正则表达式将会与目标对象中的“Th*”而非“The”等相匹配。

在系统托盘中显示

‘建立项目(Project),创制如图级联菜单,分别命名为mnuMain、mnuWork、mnuExit。

Option Explicit
Private Type NOTIFYICONDATA
cbSize As Long
hWnd As Long
uID As Long
uFlags As Long
uCallbackMessage As Long
hIcon As Long
szTip As String * 64
End Type
Dim tnid As NOTIFYICONDATA
Private Const NIM_ADD = &H0
Private Const NIM_MODIFY = &H1
Private Const NIM_DELETE = &H2
Private Const NIM_MOUSEMOVE = &H200
Private Const NIF_MESSAGE = &H1
Private Const NIF_ICON = &H2
Private Const NIF_TIP = &H4
Private Const DOUBLE_CLICK_LEFT = &H203
Private Const BUTTON_LEFT_DOWN = &H201
Private Const BUTTON_LEFT_UP = &H202
Private Const DOUBLE_CLICK_RIGHT = &H206
Private Const BUTTON_RIGHT_DOWN = &H204
Private Const BUTTON_RIGHT_UP = &H205
Private Declare Function Shell_NotifyIcon Lib “shell32” Alias “Shell_NotifyIconA” (ByVal dwMessage As Long, pnid As NOTIFYICONDATA) As Boolean

Private Sub Form_Load()
tnid.cbSize = Len(tnid)
tnid.hWnd = Me.hWnd
tnid.uID = 1&
tnid.uFlags = NIF_ICON Or NIF_TIP Or NIF_MESSAGE
tnid.uCallbackMessage = NIM_MOUSEMOVE
tnid.hIcon = Me.Icon
tnid.szTip = “系统托盘样例” & Chr$(0)
Shell_NotifyIcon NIM_ADD, tnid
Me.Hide
App.TaskVisible = False
End Sub

Private Sub Form_MouseMove(Button As Integer, Shift As Integer, X As Single, Y As Single)
‘为相应事件添加对应代码
Dim MSG As Long
MSG = X / Screen.TwipsPerPixelX ‘512
Select Case MSG
Case DOUBLE_CLICK_LEFT ‘515

Case BUTTON_LEFT_DOWN ‘513
OpenForm Me
Case BUTTON_LEFT_UP ‘514

Case DOUBLE_CLICK_RIGHT ‘518

Case BUTTON_RIGHT_DOWN ‘516

Case BUTTON_RIGHT_UP ‘517
PopupMenu mnuMain, , , , mnuWork
End Select
End Sub

Private Sub Form_QueryUnload(Cancel As Integer, UnloadMode As Integer)
EndApp
End Sub

Private Sub Form_Resize()
If Me.WindowState = 1 Then
Me.Hide
App.TaskVisible = False
End If
End Sub

Private Sub mnuExit_Click()
EndApp
End Sub

Private Sub EndApp()
Unload Me
tnid.cbSize = Len(tnid)
tnid.hWnd = Me.hWnd
tnid.uID = 1&
Shell_NotifyIcon NIM_DELETE, tnid
End
End Sub

Private Sub OpenForm(ByVal frmShow As Form)
frmShow.Show
App.TaskVisible = True
End Sub

AutoCAD 的文件 DXF 组码

DXF的基本惯例

DXF格式是特定版本AutoCAD图形文件中所包含的全部信息的标记数据的一种表示方法。

标记数据的意思是指在每个数据元素前都带一个称为组码的整数。组码的值表明了其后数据元素的类型,也指出了数据元素对于给定对象(或记录)类型的含意。实际上,图形文件中所有用户指定的信息都能够以DXF文件格式表示。在AutoLISP和ARX应用程序中使用的DXF格式与上述格式基本相同,只是在某些数据组上存在着细微的差别。

如不作特殊说明,本节中所出现的组码都可以应用于DXF文件、AutoLISP应用程序和ARX应用程序。当组码说明对于应用程序和DXF文件有所不同时(或只适用于其中之一),在组码的说明前有如下提示符:

APP只用于应用程序的说明

DXF只用于DXF文件的说明

如果组码说明对DXF文件和应用程序都适用,那么没有提示符;否则将显示适当的提示符。

组码范围

组码将与组码关联的值(组值)定义为整型、浮点数型或字符串型。具体说明如下表:

组码范围   组码范围组值类型

0-9                                    字符串(最多255个字符,对于UNICODE字符串则更少)

10-59                     双精度三维点

60-79                     16位整数值

90-99                     32位整数值

100                                    字符串(最多255个字符,对于UNICODE字符串则更少)

102                                    字符串(最多255个字符,对于UNICODE字符串则更少)

105                                    表示十六进制句柄值的字符串

140-147                 双精度标量浮点值

170-175                 16位整数值

280-289                 8位整数值

300-309                 任意文字字符串

310-319                 表示二进制数据组的十六进制值的字符串

320-329                 表示十六进制句柄值的字符串

330-369                 表示十六进制对象标识符的字符串

999                                    注释(字符串)

1000-1009  字符串(最多255个字符;对于UNICODE字符串则更少)

1010-1059  浮点值

1060-1070  16位整数值

1071                      32位整数值

按数字次序排列的组码

下表给出了组码(或组码范围)及其说明。在表中,“固定”表示该组码的用途固定不变,非固定组码的用途将随上下文变化。

按数字次序排列的图元组码

组码说明

-5APP:persistentreactor链表

-4APP:条件运算符(仅用于ssget)

-3APP:扩展数据(XDATA)标记(固定)

-2APP:图元名引用(固定)

-1APP:图元名。每次打开图形时它都改变,且不被保存。(固定)

0   表示图元类型的文字字符串(固定)

1   图元的主要文字值

2   名称(属性标记、块名称等)

3-4            其他的文字值或名称值

5   图元句柄。最多16位十六进制数字的文字字符串(固定)

6               线型名(固定)

7               文字样式名(固定)

8               图层名(固定)

9               DXF:变量名标识符(仅用于DXF文件的HEADER区域)。

10              主要点。此点为直线或文字图元的起点,圆的圆心等等。

DXF:主要点的X值(其后为Y和Z值的组码20和30)

APP:三维点(三个实数构成的表)

11-18         其他点。

DXF:其他点的X值(其后为Y和Z值的组码21-28和31-38)

APP:三维点(三个实数构成的表)

20,30         DXF:主要点的Y和Z值

21-28,

31-37         DXF:其他点的Y和Z值

38              DXF:如果非零,则为图元的标高。只在R11以前的AutoCAD输出的DXF文件中存在

39              如果非零,则为图元的厚度(固定)

40-48         浮点值(文字高度、比例因子等)

48              线型比例。浮点标量值。缺省值适用于所有图元类型。

49              可重复的浮点值。一个图元中的可变长度表(例如LTYPE表中的虚线长度)中可出现多个组码49。组码7x总是在第一个组码49前出现,用于指定表的长度。

50-58         角度(在DXF文件中单位为度,在AutoLISP和ARX应用程序中单位为弧度)。

60              表示图元可见性的整数值。不赋值或值为0时表示可见;为1时表示不可见。

62              颜色代码(固定)

66              “图元跟随”标志(固定)

67              空间,即模型空间或图纸空间(固定)

68              APP:表示视口打开但不可见、未激活或者关闭。

69              APP:视口标识数字。

70-78         整数值,如重复部分的计数器、标志位或模式等。

90-99         32位整数值

100                        子类数据标记(把继承下来的类名当作字符串)。由具体类继承下来的所有对象和图元类都必须有此项。此标记用于分离某个对象中由不同的类定义的数据。它也满足从ARX继承下来的每个独立的具体类的DXF命名需要(请参见子类标记!AL(`XREF_11832_al_u05_c’,1))。

102                        控制字符串,其后为“{<任意名称>”或”}”。除了字符串必须以”{“开始外,它与外部数据组码1002类似。其后可跟任意字符串,且此字符串的解释取决于应用程序。另一个可用的控制字符串为”}”,它标识组的结束。如上所述,除了在执行图形核查操作期间外AutoCAD一般不解释这些字符串;它们仅用于应用程序。

105                        DIMVAR符号表条目对象句柄。

210                        拉伸方向(固定)。

DXF:拉伸方向的X值

APP:三维拉伸方向矢量

220,230      DXF:拉伸方向的Y和Z值

280-289     8位整数值

300-309     任意的文字字符串

310-319     任意二进制数据组,与组码1004具有相同表示法和限制:最长为254个字符的十六进制字符串表示最长为127个字节的数据数据组。

320-329     任意对象句柄。句柄值保留原样,在执行INSERT和XREF操作时它们不被转化。

330-339     软键指针句柄。任意指向同一DXF文件或图形中的其他对象的软键指针,在执行INSERT和XREF操作时被转化。

340-349     硬键指针句柄。任意指向同一DXF文件或图形中的其他对象的硬键指针,在执行INSERT和XREF操作时被转化。

350-359     软键从属句柄。链接到同一DXF文件或图形中其他对象的任意软键从属链接,在执行INSERT和XREF操作时被转化。

360-369     硬键从属句柄。链接到同一DXF文件或图形中其他对象的任意硬键从属链接,在执行INSERT和XREF操作时被转化。

999                        DXF:999组码表示其后为注释字符串行。DXFOUT不在DXF输出文件中包括此组;DXFIN能识别词组码,但忽略其后的注释。通过999组码,用户可以在所编辑的DXF文件中包括注释。

1000          扩展数据中的ASCII字符串(最长255个字节)。

1001          扩展数据的已注册应用程序名(ASCII字符串,最长31个字节)。

1002          扩展数据控制字符串(”{“或”}”)。

1003          扩展数据图层名。

1004          扩展数据中的字节数据组(最长127字节)。

1005          扩展数据中的图元句柄。文字字符串,最多16位十六进制数字。

1010          扩展数据中的点

DXF:X值(其后跟组码1020和1030)

APP:三维点

1020,1030  DXF:点的Y和Z值

1011                      扩展数据中的三维世界空间位置:X值(其后跟组码1021和1031):三维点

1021,1031  DXF:世界空间位置的Y和Z值。

1012          扩展数据中的三维世界空间位移:X值(其后跟组码1022和1032):三维矢量

1022,1032  DXF:世界空间位移的Y和Z值

1013          扩展数据中的三维世界空间方向

DXF:X值(其后跟组码1022和1032)

APP:三维矢量

1023,1033  DXF:世界空间方向的Y和Z值

1040          扩展数据浮点值。

1041          扩展数据距离值。

1042          扩展数据比例因子。

1070          扩展数据16位符号整数。

1071          扩展数据32位符号整数。

对象和图元的组码

在DXF格式中,对象的定义与图元的定义不同:图元有图形表示,而对象则没有图形表示。例如,词典是对象而不是图元。对象通常作为非图形对象来使用,图元则作为图形对象来使用。

在DXF文件中,图元可以出现在BLOCK和ENTITIESE区域中。两个区域中图元的用法一样。某些定义图元的组码始终会出现,而其他的组码仅在它们的值与缺省值不同时才出现。

读取DXF文件的程序不应该假定说明图元的组码是按照给定次序出现的。与说明图元的组码相连的0组码表示此图元已结束。0组码将开始新图元或表示此区域已结束。 注意如果用户以表驱动方式(即忽略未定义的组码,且对图元中的组码次序不做任何假定)编写DXF处理程序,那么该程序将比较容易针对AutoCAD的后续版本做调整。因为AutoCAD的性能将不断得到增强,所以图元中将添加一些新的组码以提供更多的功能。

Microsoft Word 对象模型

理解Word的对象模型是对其编程的基础,Word以层次结构组织对象。

Word提供了数百个可与之交互的对象。这些对象排列在一个与用户界面密切相关的层次结构中。层次结构如图所示,顶部的对象是Application对象。此对象表示Word的当前实例。Application对象包含Document、Selection、Bookmark和Range对象。这些对象各自都有很多方法和属性,可以访问这些方法和属性来操作对象或与对象交互。图中存在许多重叠,是因为可以通过多种方式来访问相同类型的对象。

Application对象表示Word应用程序,是其他所有对象的父级。它的所有成员通常作为一个整体应用于 Word。可以使用该对象的属性和方法来控制Word环境。在应用程序级外接程序项目中,您可以使用ThisAddIn类的Application字段访问Application对象。在文档级项目中,可以使用ThisDocument类的Application属性访问Application对象。

Document对象是Word编程的中枢。它表示文档及其所有内容。当打开文档或创建新文档时,就创建了新的Document对象,该对象被添加到Application对象的Documents集合中。具有焦点的文档称为活动文档。它由Application对象的ActiveDocument属性表示。

Selection对象表示当前选择的区域。在Word用户界面中执行某项操作(例如,对文本进行加粗)时,应首先选择或突出显示文本,然后应用格式设置。Selection对象始终存在于文档中。如果未选中任何对象,它表示插入点。此外,所选内容可以包含多个不连续的文本块。

Range对象表示文档中的一个连续的区域,由一个起始字符位置和一个结束字符位置定义。Range对象的数量并不局限于一个。可以在同一文档中定义多个Range对象。

更多信息参见 Office VBA Reference

Microsoft Excel 对象模型

理解Excel的对象模型是对其编程的基础,Excel以层次结构组织对象。

一个Excel应用程序就是一个Application,全局的对象比如菜单,工具条都属于Application对象。
一个Application可以包含很多个Workbook(Workbooks),具体而言就是,可以同时打开很多个工作薄(Workbooks),但是某一时刻只有一个工作薄(Workbook)处于可编辑状态,这个工作薄就叫活动工作薄(ActiveWorkbook)。
一个Workbook可以包含很多个Worksheet(Worksheets),具体而言就是,一个工作薄(Workbooks)可以包含很多工作表(Worksheets),但是某一时刻只有一个工作表(Worksheet)处于可编辑状态,这个工作表就叫活动工作表(ActiveWorksheet)。
一个Workbook可以包含很多个Shapes对象,工作表中还可以包含一些图表、标记、注释、控件等,这些都是浮在Sheet页上的,统称为Shapes,其中使用最多的是图表(Charts)。
一个Worksheet可以包含很多个Range对象,具体而言,一个工作表里面有很多个单元格,单元格范围用Range表示,Range可以是一个单元格也可以是多个单元格,单元格都是嵌入到Sheets中的。

更多信息参见 Office VBA Reference