นิพจน์ปกติ ภาษาปกติ ทฤษฎีบทตั้งการปั๊มขึ้นมาของสายอักขระของออโตมาตาจำกัด

นิพจน์ปกติ (Regular expression)
จากบทที่แล้วเราสามารถใช้ออโตมาตาจำกัดในการแก้ปัญหาการจดจำรูปแบบของสายอักขระในเซตได้ แต่เราอาจสงสัยว่า ออโตมาตาจำกัดแต่ละแบบ มีความสามารถต่างกันหรือไม่ อย่างไร ก่อนเราจะกล่าวถึงความสามารถของออโตมาตาจำกัดแบบต่างๆ เราจะนิยามภาษาประเภทหนึ่งที่เรียกว่า ภาษาปกติ ดังนี้
นิยาม กำหนดให้

เป็นชุดตัวอักษร นิพจน์ปกติ (regular expression) เป็นสัญลักษณ์ที่ใช้แทนสับเซตของ

^* ซึ่งนิยามโดยวิธีเรียกซ้ำ (recursive) ดังนี้

เป็นนิพจน์ปกติ แทนเซตว่าง ()
เป็นนิพจน์ปกติ แทน {}
สำหรับแต่ละ a , a เป็นนิพจน์ปกติ แทน {a}
ถ้า r และ s เป็นนิพจน์ปกติ แทนเซต R และ S ตามลำดับแล้ว (r+s), (rs), (r^*) เป็นนิพจน์ปกติแทน R S, RS, R^* ตามลำดับ

และนิพจน์ปกติเขียนได้จากกฎ 4 ข้อนี้เท่านั้น
ข้อตกลง

rⁱ หมายถึง rr...r ต่อกัน i ครั้ง
เราสามารถลดรูปการเขียนเช่น ((0(1^*))+0) เขียนแทนด้วย 01^*+0 โดยที่ความสำคัญของลำดับการใช้ตัวกระทำการ (operator) เป็นดังนี้ * มีความสำคัญสูงสุด ตามด้วยการต่อกันของภาษา และ + มีความสำคัญต่ำสุด
L(r) คือเซตที่มี r เป็นนิพจน์ปกติที่แทนเซตนั้น
a⁺ หมายถึง aa^* เมื่อ a
ถ้า r, s เป็นนิพจน์ปกติ แล้ว r = s หมายถึง L(r) = L(s)

ตัวอย่างของนิพจน์ปกติ เช่น 0, 1^*, 01^*, 00+1,

, 1 +

นิยาม ภาษาปกติ
L เป็น ภาษาปกติ (regular language) หรือ เซตปกติ (regular set) ก็ต่อเมื่อ มีนิพจน์ปกติ r ที่ L = L(r)
ตัวอย่าง 1 กำหนด = {0, 1}

00 เป็นนิพจน์ปกติแทน {00} เพราะ L(00) = {00}
(0+1)^* เป็นนิพจน์ปกติแทน {0, 1}^* ดังนั้น L((0+1)^*) = { , 0, 1, 00, 01, 10, 11, 000, ... } = ^*
(0+1)^*00(0+1)^* เป็นนิพจน์ปกติแทน {x {0, 1}^* | x ต้องมี 00 ปรากฎอย่างน้อย 1 ครั้ง } = {00, 000, 100, 000, 001, ...}
(0+10)^* เป็นนิพจน์ปกติแทน {0, 10}^* = {, 0, 10, 00, 010, 100, 000, ...}
(1+10)² = (1+10)(1+10) เป็นนิพจน์ปกติแทน {x {0, 1}^* | x = w₁w₂ เมื่อ w₁, w₂ {1, 10} } = {11, 110, 101, 1010} ดังนั้น (1+10)(1+10) = 11+110+101+1010

ทฤษฎีบท ถ้า r เป็นนิพจน์ปกติแล้วเราสามารถสร้างออโตมาตาจำกัดเชิงไม่กำหนดที่มีการย้ายโดย-

ที่ยอมรับ L(r) ได้
พิสูจน์ ให้ r เป็นนิพจน์ปกติ
วิธีการพิสูจน์คือ เราจะสร้าง M ตามนิยามเวียนเกิดของนิพจน์ปกติ พร้อมรับประกันว่า L(M) = L(r) โดยใช้อุปนัยเข้มทางคณิตศาสตร์ การสร้าง M เราจะบังคับให้มีสถานะยอมรับเพียงสถานะเดียวเพื่อความง่ายต่อการพิสูจน์ (การทำเช่นนี้เป็นไปได้เสมอ เพราะถ้าเรามีสถานะยอมรับมากกว่าหนึ่งสถานะ เราเพียงสร้างสถานะใหม่แล้ว เชื่อมฟังก์ชันการผ่านโดยใช้

จากสถานะยอมรับเดิมทั้งหมดไปสถานะนี้ แล้วกำหนดสถานะยอมรับใหม่ให้เป็นสถานะนี้เท่านั้น)

เราใช้อุปนัยเข้มบน จำนวนการดำเนินการในนิพจน์ปกติ r
มูลฐานของการอุปนัย จำนวนการดำเนินการใน r เป็น 0
เราได้ว่า r =

, r =

หรือ r = a เมื่อ a

รูปที่ 1, 2, 3 เป็นรูปของออโตมาตาจำกัดที่ยอมรับ L(M₁) = L(

), L(M₂) = L(

) และ L(M₃) = L(a) ตามลำดับ

ขั้นตอนของการอุปนัย เราตั้งสมมติฐานของการอุปนัยว่า สำหรับนิพจน์ปกติใด ๆ ที่มีจำนวนดำเนินการ k โดยที่ k น้อยกว่า n และ n > 0 เราสามารถสร้างออโตมาตาจำกัดเชิงไม่กำหนดที่ยอมรับภาษาของนิพจน์ปกตินั้นได้ โดยมีสถานะยอมรับเพียงสถานะเดียว
เราต้องการแสดงว่า สำหรับนิพจน์ปกติที่มีจำนวนดำเนินการเท่ากับ n เราจะสร้าง ออโตมาตาจำกัดเชิงไม่กำหนด แบ่งตามกรณีดังนี้

กรณีที่ r = r₁ + r₂, จากสมมติฐานการอุปนัย เราจะมีเครื่องออโตมาตาจำกัดเชิงไม่กำหนด สองเครื่อง M₁, M₂ ที่ยอมรับ L(r₁), L(r₂) ตามลำดับ และมีสถานะยอมรับเพียงสถานะเดียว
เราสร้างออโตมาตาเครื่องใหม่ M โดยมีสถานะเริ่มต้นและสถานะยอมรับใหม่ ดังรูป

เราจะได้ว่า L(M) = L(M₁) L(M₂) = L(r₁) L(r₂) = L(r₁ + r₂) ตามที่ต้องการ
ในเชิงคณิตศาสตร์ เราเขียนอธิบายเครื่องออโตมาตา M ได้ดังนี้
M₁ = (Q₁, , ₁, q₀⁽¹⁾, {q_F1}) และ M₂ = (Q₂, , ₂, q₀⁽²⁾, {q_F2}) โดยที่สถานะทั้งหมดในสองเครื่องต่างกันหมด

ให้ M = (Q₁ Q₂ {q₀, q_F}, , , q₀, {q_F}) เมื่อ q₀ และ q_F เป็นสถานะใหม่ที่ไม่ปรากฎใน Q₁ และ Q₂
และนิยาม ดังนี้
1. (q₀, ) = {q₀⁽¹⁾, q₀⁽²⁾}
2. สำหรับแต่ละ q Q₁ Q₂, a {}
  ให้ (q, a) = ₁(q, a) ถ้า q Q₁ และ a {}
  และ (q, a) = ₂(q, a) ถ้า q Q₂ และ a {}
3. (q_F1, ) = {q_F} และ (q_F2, ) = {q_F}
กรณีที่ r = r₁r₂, จากสมมติฐานการอุปนัยเราจะมี เครื่องออโตมาตาจำกัดเชิงไม่กำหนดสองเครื่อง M₁, M₂ ที่ยอมรับ L(r₁), L(r₂) ตามลำดับและมีสถานะยอมรับเพียงสถานะเดียว
เราสร้างออโตมาตาเครื่องใหม่ M โดยมีสถานะเริ่มต้นและสถานะยอมรับใหม่ ดังรูป

เราจะได้ว่า L(M) = L(M₁)L(M₂) = L(r₁)L(r₂) = L(r₁ r₂) ตามที่ต้องการ
ในเชิงคณิตศาสตร์ เราเขียนอธิบายเครื่องออโตมาตา M ได้ดังนี้
M₁ = (Q₁, , ₁, q₀⁽¹⁾, {q_F1}) และ M₂ = (Q₂, , ₂, q₀⁽²⁾, {q_F2}) โดยที่สถานะทั้งสองเครื่องต่างกันทั้งหมด

ให้ M = (Q₁ Q₂, , , q₀⁽¹⁾, {q_F2})
และนิยาม ดังนี้
1. สำหรับแต่ละ q Q₁ Q₂, a {},
  ให้ (q, a) = ₁(q, a) ถ้า q Q₁ และ a {}
  และ (q, a) = ₂(q, a) ถ้า q Q₂ และ a {}
2. (q_F1, ) = {q₀⁽²⁾}
กรณีที่ r = r₁^*, จากสมมติฐานการอุปนัยเราจะมี เครื่องออโตมาตาจำกัดเชิงไม่กำหนด M₁ ที่ยอมรับ L(r₁) ซึ่งมีสถานะยอมรับเพียงสถานะเดียว
เราสร้างออโตมาตาเครื่องใหม่ M โดยมีสถานะเริ่มต้นและสถานะยอมรับใหม่ ดังรูป

เราจะได้ว่า L(M) = L(M₁)^* = L(r₁)^* = L(r₁^*) ตามที่ต้องการ
ในเชิงคณิตศาสตร์ เราเขียนอธิบายเครื่องออโตมาตา M ได้ดังนี้
M₁ = (Q₁, , ₁, q₀⁽¹⁾, {q_F1})

ให้ M = (Q₁ {q₀, q_F}, , , q₀, {q_F}) โดยที่ q₀ และ q_F เป็นสถานะใหม่ที่ไม่ปรากฎใน Q₁
และนิยาม ดังนี้
1. (q₀, ) = {q₀⁽¹⁾, q_F} และ (q_F1, ) = {q₀⁽¹⁾, q_F}
2. สำหรับแต่ละ q Q₁, a {}, ให้ (q, a) = ₁(q, a)

โดยอุปนัยเชิงคณิตศาสตร์ทำให้เราสรุปได้ว่า ไม่ว่านิพจน์ปกติที่มีจำนวนดำเนินการเท่าใด เราสามารถสร้างออโตมาตาจำกัดเชิงไม่กำหนด ซึ่งยอมรับภาษาปกติของนิพจน์นั้นได้เสมอ

จบการพิสูจน์

ตัวอย่าง 2 จงเขียนแผนภาพของออโตมาตาจำกัดที่ยอมรับ L(r) ตามการพิสูจน์ข้างต้นเมื่อ

r = 00
r = 1+00
r = (1+00)^*
r = 01^*+1

ทฤษฎีบท ถ้า L เป็นภาษาที่ยอมรับโดยออโตมาตาจำกัดเชิงกำหนดแล้วเราสามารถเขียนแทน L ด้วยนิพจน์ปกติได้
พิสูจน์ ให้ L เป็นภาษาที่ยอมรับโดยออโตมาตาจำกัดเชิงกำหนด M = ({q₀, q₁, ..., q_n},

, q₀, F)
วิธีการพิสูจน์คือ เราขยายนิพจน์ปกติจากโครงแบบที่ไม่มีการวิ่งผ่านสถานะที่มีดรรชนีต่ำกว่าดรรชนีของสถานะที่กำลังพิจารณาอยู่
สำหรับแต่ละ i, j

{0, 1, 2, ..., n}, k

{0, 1, 2, ..., n}

ให้ R_{i j}^k เป็นเซตของสายอักขระ x

^* ที่ (q_i, x)

(q_j,

) โดยไม่ผ่านสถานะที่มีดรรชนีล่างใหญ่กว่าหรือเท่ากับ k
ถ้าเราสามารถแสดงได้ว่า k ที่ได้เราสามารถเขียนนิพจน์ปกติขยายได้จนถึง n + 1 คำตอบของภาษาที่ต้องการจะได้จากยูเนียนของเซตที่แทนด้วย นิพจน์ปกติจากเซตของ R_{0 j}ⁿ⁺¹ เมื่อ q_j อยู่ใน F
เราใช้อุปนัยเข้มบน ดรรชนี k
มูลฐานของการอุปนัย จะแสดงว่าที่ k = 0 เราสามารถเขียนนิพจน์ปกติได้เสมอ

ถ้า i

j แล้ว R_{i j}⁰ = { a

(q_i, a) = q_j }

ถ้า i = j แล้ว R_{i j}⁰ = { a

(q_i, a) = q_j }

{

}

จะเห็นได้ว่า R_{i j}⁰ เป็นเซตจำกัด ซึ่งเป็นสับเซตของ

{

} ดังนั้น

R_{i j}⁰ =

หรือ R_{i j}⁰ = {

} หรือ R_{i j}⁰ = {a₁, a₂, ..., a_m }

เมื่อ a₁, a₂, ..., a_m

{

}
ถ้าเราให้ r_{i j}⁰ แทนนิพจน์ปกติที่เขียนแทน R_{i j}⁰ จะได้ว่า

r_{i j}⁰ =

หรือ r_{i j}⁰ =

หรือ r_{i j}⁰ = a₁ + a₂ + ... + a_m

นั่นคือ R_ij⁰ = L(r_{i j}⁰)
ขั้นตอนของการอุปนัย เราตั้งสมมติฐานของการอุปนัยว่า เราสามารถเขียนนิพจน์ปกติสำหรับ R_{i j}^k-1
x

R_{i j}^k ก็ต่อเมื่อ

(q_i, x) (q_j, ) โดยไม่ผ่านสถานะที่มีดรรชนีล่างใหญ่กว่าหรือเท่ากับ k-1 (นั่นคือ x R_{i j}^k-1)
หรือ x = w₁w₂w₃ โดยที่ (q_i, w₁) (q_k, ) โดยไม่ผ่านสถานะที่มีดรรชนีล่างใหญ่กว่าหรือเท่ากับ k-1 และ (q_k, w₂) (q_k, ) โดยไม่ผ่านสถานะที่มีดรรชนีล่างใหญ่กว่าหรือเท่ากับ k-1 และ (q_k, w₃) (q_j, ) โดยไม่ผ่านสถานะที่มีดรรชนีล่างใหญ่กว่าหรือเท่ากับ k-1 ซึ่งมีความหมายตรงกับ
x R_{i k-1}^k-1 (R_{k-1 k-1}^k-1)^* R_{k-1 j}^k-1
นั่นคือทุก k {0, 1, 2, ..., n, n+1}
R_{i j}^k = R_{i k-1}^k-1 (R_{k-1 k-1}^k-1)^* R_{k-1 j}^k-1 R_{i j}^k-1
หรือ x = w₁w₂⁽¹⁾w₂⁽²⁾...w₂⁽ⁿ⁾w₃ โดยที่ (q_i, w₁) (q_k⁽¹⁾, ) โดยไม่ผ่านสถานะที่มีดรรชนีล่างใหญ่กว่าหรือเท่ากับ k-1 และ (q_k⁽¹⁾, w₂⁽¹⁾) (q_k⁽²⁾, ) จนกระทั่ง (q_k^(n-1), w₂^(n-1)) (q_k⁽ⁿ⁾, ) โดยไม่ผ่านสถานะที่มีดรรชนีล่างใหญ่กว่าหรือเท่ากับ k-1 และ (q_k⁽ⁿ⁾, w₃⁽ⁿ⁾) (q_j, ) โดยไม่ผ่านสถานะที่มีดรรชนีล่างใหญ่กว่าหรือเท่ากับ k-1 ซึ่งมีความหมายเดียวกับกรณีข้างต้น

จากสมมติฐานของการอุปนัย R_{s t}^k-1 สามารถเขียนแทนด้วยนิพจน์ปกติ r_{s t}^k-1 ดังนั้นเราเขียนนิพจน์ปกติได้ดังนี้

r_{i j}^k = (r_{i k-1}^k-1) (r_{k-1 k-1}^k-1)^* r_{k-1 j}^k-1 + r_{i j}^k-1 แทน R_{i j}^k

โดยอุปนัยเชิงคณิตศาสตร์ เราสามารถเขียนแทน R_{i j}⁰, R_{i j}¹, ..., R_{i j}ⁿ, R_{i j}ⁿ⁺¹ ด้วยนิพจน์ปกติได้เสมอ
ขั้นต่อไป เราจะแสดงว่า

R_{0 j}ⁿ⁺¹ = L โดยเราทราบว่า

R_{0 j}ⁿ⁺¹ = {x

^* | (q₀, x)

(q_j,

) โดยไม่ผ่านสถานะที่มีดรรชนีล่างใหญ่กว่าหรือเท่ากับ n+1 } = {x

^* | (q₀, x)

(q_j,

)} เพราะไม่มีสถานะใด ๆ ที่มีดรรชนีล่างใหญ่กว่าหรือเท่ากับ n+1 ได้

สมมติ x R_{1 j}ⁿ⁺¹ โดยที่ q_j F จะได้ว่า (q₁, x) (q_j, ) และ q_j F นั่นคือ x L(M) = L
สมมติว่า x L = L(M) จะมี q_m F ซึ่ง (q₀, x) (q_m, ) นั่นคือ x R_0mⁿ และ q_m F ได้ว่า x R_{0 j}ⁿ⁺¹

L = L(M) =

R_{0 j}ⁿ⁺¹

เราสามารถเขียน L(M) ด้วยนิพจน์ปกติได้

จบการพิสูจน์

ตัวอย่าง 3 จงหานิพจน์ปกติที่เป็นสัญลักษณ์แทน L(M) เมื่อให้ M เป็นออโตมาตาจำกัดเชิงกำหนด ที่มีแผนภาพข้างล่าง

ทฤษฎีบทตั้งการปั๊มขึ้นมาของออโตมาตาจำกัด (Pumping lemma for FAs)
ถ้า L เป็นภาษาปกติแล้วจะได้ว่ามี k ที่
(*) สำหรับทุก x ^* ถ้า x L และ |x| k แล้ว x = ywz โดยที่ 1 |w|, |yw| k และ ywⁱz L ทุก i ₀
ตัวอย่าง 4 จงพิสูจน์ว่า {0^n×n | n } ไม่เป็นภาษาปกติโดยใช้ทฤษฎีบทตั้งการปั๊มขึ้นมาของออโตมาตาจำกัด
พิสูจน์ กำหนดให้ = {0, 1} และ ให้ L = {0^n×n | n }
จะแสดงการพิสูจน์ว่า L ไม่เป็นภาษาปกติโดยวิธีการขัดแย้ง จึงสมมติว่า L เป็นภาษาปกติ
โดยทฤษฎีบทตั้งการปั๊มขึ้นมาของออโตมาตาจำกัดจะได้ว่า มีจำนวนเต็มบวก k ที่สอดคล้องกับสมบัติ (*)
พิจารณา x = 0^k×k จะได้ว่า x L และ |x| = k×k = k² ซึ่งมากกว่าหรือเท่ากับ k
เราเขียน 0^k×k = ywz โดยที่ 1 |w|, |yw| k และ ywⁱz L ทุกจำนวนเต็ม i 0
ถ้าพิจารณาที่ i = 2 จะได้ว่า ywwz L จาก (*) เมื่อเรานับจำนวนอักขระของ ywwz

|ywwz| > k² เพราะ |w| 1 และ |ywz| = k²
|ywwz| k² + k เพราะ |yw| k และ |ywwz| k + |wz| k + k² = k(k+1) < (k+1)²

กล่าวคือ

k² < | ywwz | < (k+1)²

ซึ่งได้ว่าขนาดของ ywwz ไม่ใช่กำลังสองสมบูรณ์ของเลขจำนวนเต็มใด ๆ นั่นคือ ywwz ไม่อยู่ใน L เกิดการขัดแย้ง
ที่สมมติไว้ไม่เป็นจริง ดังนั้น L ไม่เป็นภาษาปกติ

จบการพิสูจน์

ตัวอย่าง 5 จงพิสูจน์ว่า {0²ⁿ1ⁿ | n

} ไม่เป็นภาษาปกติ
พิสูจน์ กำหนดให้

= {0, 1} และ ให้ L = {0²ⁿ1ⁿ | n

}
จะแสดงการพิสูจน์ว่า L ไม่เป็นภาษาปกติโดยวิธีการขัดแย้ง จึงสมมติว่า L เป็นภาษาปกติ
โดยทฤษฎีบทตั้งการปั๊มขึ้นมาของออโตมาตาจำกัดจะได้ว่า มีจำนวนเต็มบวก k ที่สอดคล้องกับสมบัติ (*)
พิจารณา x = 0^2k1^k จะได้ว่า x

L และ |x| = 2 k + k = 3 k ซึ่งมากกว่าหรือเท่ากับ k
เราเขียน 0^2k1^k = ywz โดยที่ 1

|w|, |yw|

k และ ywⁱz

L ทุกจำนวนเต็ม i

0 กล่าวคือ ywwz

L
เนื่องจาก | yw |

k และ ywz = 0^2k1^k เราได้ว่า

y = 0^j และ w = 0ⁱ สำหรับบางค่าของ i

1 และ j

การที่เราทราบว่า ywwz อยู่ใน L และ ywwz = 0^2k+i1^k เราต้องได้ว่า 2k + i = 2k นั่นคือ i = 0 เกิดขัดแย้ง ที่สมมติไว้ไม่เป็นจริง ดังนั้น L ไม่เป็นภาษาปกติ

จบการพิสูจน์

ตัวอย่าง 6 จงตรวจสอบว่าภาษาใด ในข้อต่อไปนี้เป็นภาษาปกติพร้อมแสดงการพิสูจน์

L₁ = {0ⁿ1ⁿ | n }
L₂ = {0ⁿ1^m | m, n ₀}
L₃ = {1ⁿ20ⁿ | n ₀}
L₄ = {0²ⁿ | n }
L₅ = {0ⁿ1^m | n, m }
L₆ = {1^n×n×n | n }
L₇ = {ww^R | w {0,1}^*}
L₈ = {ww | w {0,1}^*}
L_{9 = {www | w {0,1}^*}}
L_{10 = {0ⁿ1^m | n m}}
L₁₁ = {1ⁿ0^m | n < m}
L_{12 = {1ⁿ0²ⁿ1^m | n < m}}

Home | Previous | Next