Bài tập giải tích lồi có lời giải năm 2024

Mục lục Mục lục . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2

Mở đầu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

7

Chương 1. Các khái niệm cơ bản . . . . . . . . . . . . . . . . . . . . . . . . .

11

1.1. Tổ hợp lồi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

11

1.2. Tập a-phin, tập lồi đa diện . . . . . . . . . . . . . . . . . . . . . . . . .

14

1.3. Nón lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

19

1.4. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

22

Chương 2. Điểm trong tương đối và phiếm hàm Minkowski . 25 2.1. Điểm trong tương đối . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

26

2.2. Phiếm hàm Minkowski . . . . . . . . . . . . . . . . . . . . . . . . . . . .

30

2.3. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

32

Chương 3. Bao lồi và định lý Carathéodory . . . . . . . . . . . . . .

35

3.1. Bao lồi, bao a-phin, bao nón lồi . . . . . . . . . . . . . . . . . . . .

35

3.2. Định lý Carathéodory . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

38

3.3. Một ứng dụng trong quy hoạch toán học . . . . . . . . . . .

44

3.4. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

47

4

Mục lục

Chương 4. Cấu trúc biên và biểu diễn tập lồi . . . . . . . . . . . . .

49

4.1. Diện, điểm và hướng cực biên, siêu phẳng tựa . . . . .

49

4.2. Trường hợp tập lồi đa diện . . . . . . . . . . . . . . . . . . . . . . . . .

53

4.3. Định lý biểu diễn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

61

4.4. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

63

Chương 5. Phép chiếu vuông góc và xấp xỉ tuyến tính của tập lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 5.1. Toán tử chiếu và bất đẳng thức biến phân . . . . . . . . . .

68

5.2. Xấp xỉ tập lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

76

5.3. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

78

Chương 6. Định lý tách các tập lồi. . . . . . . . . . . . . . . . . . . . . . . .

81

6.1. Các định lý tách và bổ đề Farkas . . . . . . . . . . . . . . . . . . .

82

6.2. Mở rộng và ứng dụng . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

88

6.3. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

91

Chương 7. Đối cực của tập lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . .

95

7.1. Định nghĩa và tính chất cơ bản . . . . . . . . . . . . . . . . . . . . .

96

7.2. Trường hợp tập lồi đa diện . . . . . . . . . . . . . . . . . . . . . . . . .

99

7.3. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

101

Chương 8. Định nghĩa và các tính chất cơ bản của hàm lồi . . . . 103 8.1. Định nghĩa và ví dụ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

103

8.2. Tính liên tục . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

109

8.3. Các phép toán bảo toàn tính lồi . . . . . . . . . . . . . . . . . . .

116

8.4. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

124

Mục lục

5

Chương 9. Tính chất cực trị, bất đẳng thức lồi và Định lý Helley . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 9.1. Cực đại và cực tiểu của hàm lồi . . . . . . . . . . . . . . . . . . .

128

9.2. Hạng của hàm lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

135

9.3. Bất đẳng thức lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

139

9.4. Định lý Helley . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

143

9.5. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

148

Chương 10. Hàm liên hợp và xấp xỉ tuyến tính . . . . . . . . . .

153

10.1. Định nghĩa và minh hoạ hàm liên hợp . . . . . . . . . . .

154

10.2. Các tính chất và phép tính cơ bản . . . . . . . . . . . . . . . .

156

10.3. Xấp xỉ tuyến tính của hàm lồi . . . . . . . . . . . . . . . . . . . .

159

10.4. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

163

Chương 11. Đạo hàm theo hướng và dưới vi phân . . . . . .

167

11.1. Đạo hàm theo hướng . . . . . . . . . . . . . . . . . . . . . . . . . . . .

168

11.2. Dưới vi phân . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

173

11.3. Tính khả vi của hàm lồi . . . . . . . . . . . . . . . . . . . . . . . . . .

180

11.4. Tính đơn điệu và liên tục của dưới vi phân. . . . . . .

184

11.5. Phép tính với dưới đạo hàm. . . . . . . . . . . . . . . . . . . . . .

190

11.6. Dưới vi phân xấp xỉ . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

198

11.7. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

202

Chương 12. Minimax và cân bằng . . . . . . . . . . . . . . . . . . . . . . .

205

12.1. Hàm yên ngựa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

206

12.2. Định lý minimax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

210

12.3. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

225

6

Mục lục

Tài liệu tham khảo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

227

Danh mục từ khóa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

229

Mở đầu Giải tích lồi là một bộ môn cơ bản của giải tích hiện đại, nghiên cứu về tập lồi và hàm lồi cùng với những vấn đề liên quan. Bộ môn này có vai trò quan trọng trong nhiều lĩnh vực khác nhau của toán học ứng dụng, đặc biệt là trong tối ưu hoá, bất đẳng thức biến phân, các bài toán cân bằng v.v... Có thể nói, giải tích lồi là một trong những bộ môn quan trọng nhất làm cơ sở toán học của tối ưu hoá và một số lĩnh vực khác. Do phạm vi ứng dụng rộng rãi của giải tích lồi, nên hiện nay nhu cầu học tập, giảng dạy, nghiên cứu và ứng dụng bộ môn này ngày càng nhiều ở Việt Nam. Hiện đã có một số sách về giải tích lồi bằng tiếng nước ngoài, trong đó cuốn "Giải tích lồi" (Convex Analysis) của R. T. Rockafellar là một sách chuyên khảo tiếng Anh khá hoàn chỉnh về giải tích lồi trong không gian hữu hạn chiều. Tuy nhiên sách đã được viết từ năm 1970 và là một tài liệu khó đọc đối với những người mới bắt đầu làm quen lĩnh vực này. Về sách tiếng Việt, hiện mới chỉ có một quyển giải tích lồi viết trong không gian vô hạn chiều và do đó không đi sâu được vào những đặc tính riêng, cũng như những khía cạnh về mặt tính toán và những ứng dụng vốn rất phong phú của tập lồi và hàm lồi trong các không gian hữu hạn chiều. Cuốn sách "Nhập môn giải tích lồi ứng dụng" này sẽ giới thiệu những vấn đề cơ bản nhất, nhưng khá đầy đủ về tập lồi và hàm

8

Nhập môn giải tích lồi ứng dụng

lồi trong không gian hữu hạn chiều. Trong cuốn sách, các kết quả của giải tích lồi được trình bày theo quan điểm nhấn mạnh vào các khía cạnh tính toán cũng như ứng dụng của tập lồi và hàm lồi trong tối ưu hoá, bất đẳng thức biến phân và bài toán cân bằng. Đối tượng của cuốn sách có thể là các sinh viên năm cuối, học viên cao học, nghiên cứu sinh các ngành toán ứng dụng. Sách cũng có thể làm tài liệu tham khảo cho các thầy cô giáo giảng dạy môn giải tích lồi. Những người làm trong các lĩnh vực khác như kinh tế, tài chính, quản lý và kỹ sư các ngành khoa học kỹ thuật muốn tìm hiểu về giải tích lồi để áp dụng vào ngành chuyên môn của mình cũng có thể dùng sách như một tài liệu tham khảo. Cuốn sách được biên soạn dựa theo bài giảng của các tác giả cho sinh viên các năm cuối bậc đại học, học viên cao học, nghiên cứu sinh tại Viện Toán học Hà Nội, các trường đại học tại Hà Nội, Huế, Quy Nhơn, thành phố Hồ Chí Minh và các đại học ở CHLB Đức, Cộng hoà Pháp, Vương quốc Bỉ, Canada, v.v... Chúng tôi xin chân thành cảm ơn Viện Toán học Hà Nội và Đại học Namur, FUNDP, Vương Quốc Bỉ đã tạo mọi điều kiện cho chúng tôi hoàn thành quyển sách này. Lời cảm ơn cũng xin gửi đến Giáo sư Jean-Jacques. Strodiot đã có những ý kiến quý báu cho nội dung và bố cục của cuốn sách. Xin cám ơn TS. Vũ Văn Đạt và anh Trần Văn Thành đã giúp đỡ rất nhiều trong quá trình soạn thảo cuốn sách này. Chúng tôi rất mong nhận được và chân thành cảm ơn mọi sự góp ý của độc giả. Namur, Vương Quốc Bỉ, tháng 8-2008 Các tác giả Lê Dũng Mưu và Nguyễn Văn Hiền

Bảng ký hiệu Rn IRn+ IR IR IN xi xT h x, yi = x T y = xy := ∑nj=1 x j y j || = qx || n 2 ∑ j =1 x j

|| x ||1 max{| x j | | j 1, ..., n} x≥y [ x, y] ( x, y) A coA coneA: aff(A)

không gian Euclide n-chiều trên trường số thực; góc không âm của IIRn (tập các véctơ không âm); trục số thực (IR = IR1 ); trục số thực mở rộng (IR = IR ∪ {−∞, +∞}); tập hợp số nguyên dương; toạ độ thứ i của x; véc-tơ hàng (chuyển vị của x) tích vô hướng cả hai véc-tơ x và y; chuẩn Euclide của x;

\= chuẩn max của x = có nghĩa là x j ≥ y j với mọi j; đoạn thẳng đóng nối x và y; đoạn thẳng mở nối x và y; bao đóng của A; bao lồi của A; bao nón lồi của A; bao afine của tập A;

10 ri( A) V(A) coA: coneA: reA: intA: riA: A∗ : dimA: linealityA: linA: f: L ( f ): lin f : rank f : dom f : dim f : f ∗: epi f : ∂ f ( x ): ∂ e f ( x ): O f (x) hoặc 0 f (x) : f 0 ( x, d): KKT: KT: QHTT: QHTP:

Nhập môn giải tích lồi ứng dụng tập điểm trong tương đối của tập A; tập các điểm cực biên (đỉnh) của A; bao lồi đóng của A; bao nón lồi đóng của A; nón lùi xa (nón các hướng vô hạn) của A; tập hợp các điểm trong của A; tập hợp các điểm trong tương đối của A; đối cực của A; thứ nguyên (số chiều) của tập A; độ phẳng của tập A; không gian thẳng của A; hàm bao đóng của f ; không gian thẳng của f ; thứ nguyên của L( f ); hạng của f ; tập hữu dụng của f ; thứ nguyên của dom f ; hàm liên hợp của f ; trên đồ thị của f ; dưới vi phân của f tại x; e-dưới vi phân của f tại x; đạo hàm của f tại x; đạo hàm theo hướng d của f tại x; Karush-Kuhn-Tucker; Kuhn-Tucker; quy hoach tuyến tính; quy hoach toàn phương.

Chương 1 CÁC KHÁI NIỆM CƠ BẢN

1.1. Tổ hợp lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2. Tập a-phin, tập lồi đa diện . . . . . . . . . . . . . . . . . . . . 1.3. Nón lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

11 14 19 22

Trong giáo trình này, chúng ta sẽ làm việc với không gian Euclidean n-chiều trên trường số thực IR. Không gian này sẽ được ký hiệu là IRn . Như vậy mỗi véc-tơ x ∈ IRn sẽ gồm n tọa độ là các số thực. Thông thường khi viết một véc-tơ x, nếu không có qui định gì thêm, ta luôn hiểu đó là véc-tơ cột. Phần này nhằm giới thiệu những khái niệm cơ bản nhất của tập lồi cùng với những tính chất đặc trưng của nó.

1.1. Tổ hợp lồi Một đường thẳng nối hai điểm (hai véc-tơ) a, b trong IRn là tập hợp tất cả các véc-tơ x ∈ IRn có dạng

{ x ∈ IRn | x = αa + βb, α, β ∈ IR, α + β = 1}.

12

Nhập môn giải tích lồi ứng dụng

Đoạn thẳng nối hai điểm a và b trong IRn là tập hợp các véc-tơ x có dạng

{ x ∈ IRn | x = αa + βb, α ≥ 0, β ≥ 0, α + β = 1}. Tập lồi là một khái niệm cơ bản nhất của giải tích lồi, nó được định nghĩa như sau: Định nghĩa 1.1. Một tập C ⊆ IRn được gọi là một tập lồi , nếu C chứa mọi đoạn thẳng đi qua hai điểm bất kỳ của nó. Tức là C lồi khi và chỉ khi

∀ x, y ∈ C, ∀λ ∈ [0, 1] ⇒ λx + (1 − λ)y ∈ C. Ta nói x là tổ hợp lồi của các điểm (véc-tơ) x1 , ..., x k nếu k

x=

k

∑ λ j x j , λ j > 0 ∀ j = 1, ..., k,

∑ λ j = 1.

j =1

j =1

Tương tự, x là tổ hợp a-phin của các điểm (véc-tơ) x1 , ..., x k nếu k

x=

k

∑ λj x j,

∑ λ j = 1.

j =1

j =1

Tập hợp của các tổ hợp a-phin của x1 , ..., x k thường được gọi là bao a-phin của các điểm này. Mệnh đề 1.1. Tập hợp C là lồi khi và chỉ khi nó chứa mọi tổ hợp lồi của các điểm của nó. Tức là: C lồi khi và chỉ khi k

∀k ∈ IN , ∀λ1 , ..., λk > 0 :

∑ λj = 1 , ∀x j =1

1

k

, ..., x ∈ C ⇒

k

∑ λ j x j ∈ C. j =1

Chứng minh. Điều kiện đủ là hiển nhiên từ định nghĩa. Ta chứng minh điều kiện cần bằng quy nạp theo số điểm. Với k = 2, điều

13

1.1 Tổ hợp lồi

cần chứng minh suy ra ngay từ định nghĩa của tập lồi và tổ hợp lồi. Giả sử mệnh đề đúng với k − 1 điểm. Ta cần chứng minh với k điểm. Giả sử x là tổ hợp lồi của k điểm x1 , ..., x k ∈ C. Tức là x=

k

∑ λ j x j , λ j > 0 ∀ j = 1, ..., k,

k

∑ λ j = 1.

j =1

j =1

Đặt k−1

∑ λj.

ξ=

j =1

Khi đó 0 < ξ < 1 và k−1

x=

∑ λ j x j + λk x k

j =1 k−1

\=ξ

j =1

Do

k−1

j =1

λj j x + λk x k . ξ

λj ξ

(1.1)

λj =1 ξ

\> 0 với mọi j = 1, ..., k − 1, nên theo giả thiết quy nạp, điểm k−1

y :=

j =1

λj j x ∈ C. ξ

Ta có x = ξy + λk x k . Do ξ > 0, λk > 0 và k

ξ + λk =

∑ λ j = 1, j =1

14

Nhập môn giải tích lồi ứng dụng

nên x là một tổ hợp lồi của hai điểm y và x k đều thuộc C. Vậy x ∈ C.  Lớp các tập lồi là đóng với các phép giao, phép cộng đại số và phép nhân tích Descartes. Cụ thể, ta có mệnh đề sau: Mệnh đề 1.2. Nếu A, B là các tập lồi trong IRn , C là lồi trong IRm , thì các tập sau là lồi : A ∩ B := { x | x ∈ A, x ∈ B}, λA + βB := { x | x = αa + βb, a ∈ A, b ∈ B, α, β ∈ IR}, A × C := { x ∈ IRn+m | x = (a, c) : a ∈ A, c ∈ C}. Chứng minh. Dễ dàng được suy ra trực tiếp từ định nghĩa.



1.2. Tập a-phin, tập lồi đa diện Trong giải tích cổ điển, ta đã làm quen với các không gian con, các siêu phẳng v.v... Đó là các trường hợp riêng của tập a-phin (đa tạp a-phin) được định nghĩa như sau: Định nghĩa 1.2. Một tập C được gọi là tập a-phin nếu nó chứa đường thẳng đi qua hai điểm bất kỳ của nó, tức là

∀ x, y ∈ C, ∀λ ∈ IR ⇒ λx + (1 − λ)y ∈ C. Vậy tập a-phin là một trường hợp riêng của tập lồi. Như đã nêu, một ví dụ điển hình của tập a-phin là các không gian con. Một ví dụ khác về tập a-phin là siêu phẳng được định nghĩa dưới đây. Định nghĩa 1.3. Siêu phẳng trong không gian IRn là một tập hợp các điểm có dạng { x ∈ IRn | aT x = α}, trong đó a ∈ IRn là một véc-tơ khác 0 và α ∈ IR.

1.2 Tập a-phin, tập lồi đa diện

15

Véc-tơ a thường được gọi là véc-tơ pháp tuyến của siêu phẳng. Một siêu phẳng sẽ chia không gian ra hai nửa không gian. Nửa không gian được định nghĩa như sau: Định nghĩa 1.4. Nửa không gian là một tập hợp có dạng

{ x | a T x ≥ α }, trong đó a 6= 0 và α ∈ IR. Đây là nửa không gian đóng. Tập

{ x | a T x > α }. là nửa không gian mở. Như vậy một siêu phẳng chia không gian ra làm hai nửa không gian, mỗi nửa không gian ở về một phía của siêu phẳng. Nếu hai nửa không gian này là đóng thì phần chung của chúng chính là siêu phẳng đó. Mệnh đề dưới đây cho thấy tập a-phin chính là ảnh tịnh tiến của một không gian con. Mệnh đề 1.3. M 6= ∅ là tập a-phin khi và chỉ khi nó có dạng M = L + a với L là một không gian con và a ∈ M, Không gian con L này được xác định duy nhất. Chứng minh. Giả sử M là tập a-phin và a ∈ M. Khi đó L = M − a là một không gian con. Vậy M = L + a. Ngược lại, nếu M = L + a với L là không gian con, thì với mọi x, y ∈ M, λ ∈ IR ta có

(1 − λ) x + λy = a + (1 − λ)( x − a) + λ(y − a). Do x − a và y − a đều thuộc L và do L là không gian con, nên

(1 − λ)( x − a) + λ(y − a) ∈ L.

16

Nhập môn giải tích lồi ứng dụng

Vậy

(1 − λ) x + λy ∈ M. Suy ra M là tập a-phin. Không gian con L ở trên là duy nhất. Thật vậy, nếu M = a + L và M = a0 + L0 , thì L 0 = M − a 0 = a + L − a 0 = L + ( a − a 0 ). Do a0 ∈ M = a + L, nên a0 − a ∈ L. Suy ra L0 = L + a − a0 = L.  Không gian L trong mệnh đề trên được gọi là không gian con song song với M, hoặc nói ngắn gọn hơn là không gian con của M. Thứ nguyên (hay chiều) của một tập a-phin M được định nghĩa bởi thứ nguyên của không gian song song với M và được ký hiệu là dimM. Mệnh đề 1.4. Bất kỳ một tập a-phin M ⊂ IRn có số chiều r đều có dạng M = { x ∈ IRn | Ax = b}, (1.2) trong đó A là ma trận cấp (m × n), b ∈ IRm và rankA = n − r. Ngược lại, mọi tập hợp có dạng (1.2) với rankA = n − r đều là tập a-phin có số chiều là r. Chứng minh. Giả sử M là tập a-phin có số chiều là r và M = L + a với a ∈ M. Vậy L = M − a là một không gian con có số chiều là r. Theo đại số tuyến tính, không gian con r chiều này có dạng L = { x | Ax = 0} với A là một ma trận cấp m × n và rankA = n − r. Từ M = L + a, suy ra M = { x | A( x − a) = 0} = { x | Ax = Aa = b}.

1.2 Tập a-phin, tập lồi đa diện

17

Ngược lại, giả sử M được cho bởi (1.2). Dễ kiểm ta được rằng M là một tập a-phin và không gian con của M là tập { x | Ax = 0}. Do rankA = n − r, nên dimL = r. Vậy dimM = r.  Để tiện việc theo dõi, ta nhắc lại khái niệm độc lập a-phin đã quen biết trong đại số tuyến tính. Định nghĩa 1.5. Các điểm x0 , x1 , ..., x k trong IRn được gọi là độc lập a-phin, nếu bao a-phin của chúng có thứ nguyên là k. Mệnh đề dưới đây cho một tính chất đặc trưng của các điểm độc lập a-phin. Mệnh đề 1.5. Các điều sau đây là tương đương: (i) Các điểm x0 , x1 , ..., x k độc lập a-phin, (ii) Với mỗi i, các điểm x j − xi ( j = 0, 1, ..., k, j 6= i) độc lập tuyến tính trong IRn . (iii) Các điểm ( x j , 1) (j = 0, 1, ..., k) độc lập tuyến tính trong IRn+1 . Chứng minh. Gọi S là tập hợp gồm các điểm x0 , x1 , ..., x k và L là không gian con của S. Không giảm tổng quát, cho i = 0. Đặt y j = x j − x0 ( j = 1, ..., k). Hiển nhiên y j ∈ L với mọi j. Cho x = ∑kj=0 µ j x j là một tổ hợp a-phin bất kỳ của các điểm x0 , x1 , ..., x k . Do ∑kj=0 µ j = 1, nên µ0 = 1 − ∑kj=1 µ j . Vậy x = x0 + ∑kj=1 µ j y j . Suy ra affS = x0 + span{y1 , ..., yk }, trong đó span{y1 , ..., yk } ký hiệu không gian con căng bởi các điểm {y1 , ..., yk }. Theo mệnh đề 1.3 ta có L = span{y1 , ..., yk }. Vậy dimL = k khi và chỉ khi các điểm y1 , ..., yk độc lập tuyến tính. Chứng tỏ (i) và (ii) là tương đương. Sự tương đương giữa (ii) và (iii) dễ dàng được chứng minh, dựa trực tiếp vào định nghĩa về sự độc lập tuyến tính. 

18

Nhập môn giải tích lồi ứng dụng

Nhắc lại rằng một tập hợp S ⊂ IRn được gọi là một đơn hình có thứ nguyên bằng k (hoặc nói ngắn gọn là k-đơn hình), nếu S là tổ hợp lồi của k + 1 véc-tơ độc lập a-phin. Các véc-tơ này được gọi là đỉnh của đơn hình. Ví dụ, một tam giác trong không gian 3 chiều là 2-đơn hình. Tập hợp k

Sk := { x ∈ IRk | x ≥ 0, ∑ x j ≤ 1} j =1

được gọi là đơn hình chuẩn tắc trong IRk . Đơn hình là một trường hợp riêng của tập lồi đa diện, được định nghĩa ngay dưới đây. Định nghĩa 1.6. Một tập được gọi là tập lồi đa diện, nếu nó là giao của một số hữu hạn các nửa không gian đóng. Như vậy, theo định nghĩa, tập lồi đa diện là tập hợp nghiệm của một hệ hữu hạn các bất phương trình tuyến tính. Dạng tường minh của một tập lồi đa diện được cho như sau: D := { x ∈ IRn | ha j , x i ≤ b j , j = 1, ..., m}. Hoặc nếu ta ký hiệu A là ma trận có m hàng là các véc-tơ a j ( j = 1, ..., m) và véc-tơ bT = (b1 , ..., bm ), thì hệ trên viết được là: D = { x ∈ IRn | Ax ≤ b}. Chú ý rằng do một phương trình

ha, x i = b có thể viết một cách tương đương dưới dạng hai bất phương trình

ha, x i ≤ b, h− a, x i ≤ b, nên tập nghiệm của một hệ hữu hạn các phương trình và bất phương trình cũng là một tập lồi đa diện. Một số các tính chất cơ bản của tập lồi đa diện sẽ được trình bày trong các phần tiếp theo.

19

1.3 Nón lồi

1.3. Nón lồi Trong tối ưu hoá, bất đẳng thức biến phân, lý thuyết trò chơi và nhiều bộ môn toán ứng dụng khác, khái niệm về nón có một vai trò quan trọng. Định nghĩa 1.7. Một tập C được gọi là nón nếu

∀λ > 0, ∀ x ∈ C ⇒ λx ∈ C. Theo định nghĩa, ta thấy rằng gốc tọa độ có thể thuộc nón hoặc không thuộc nón. Dĩ nhiên một nón không nhất thiết là một tập lồi. Ví dụ C := { x ∈ IR | x 6= 0} là một nón, nhưng không lồi. Một nón được gọi là nón lồi nếu nó đồng thời là một tập lồi. Một nón lồi được gọi là nón nhọn nếu nó không chứa đường thẳng. Khi đó ta nói 0 là đỉnh của nón. Nếu nón lồi này lại là một tập lồi đa diện thì ta nói nó là nón lồi đa diện. Một ví dụ điển hình của nón lồi đa diện, thường được sử dụng, là tập hợp nghiệm của hệ bất phương trình tuyến tính có dạng

{ x | Ax ≥ 0}, với A là một ma trận thực cấp hữu hạn (số dòng và số cột là hữu hạn). Mệnh đề 1.6. Một tập C là nón lồi khi và chỉ khi nó có các tính chất sau: (i) λC ⊆ C ∀λ > 0, (ii) C + C ⊆ C.

20

Nhập môn giải tích lồi ứng dụng

Chứng minh. Giả sử C là một nón lồi. Do C là một nón, nên ta có (i). Do C là một tập lồi, nên với mọi x, y ∈ C, thì 21 ( x + y) ∈ C. Vậy theo (i) ta có x + y ∈ C. Ngược lại, giả sử có (i) và (ii). Từ (i) suy ra ngay C là một nón. Giả sử x, y ∈ C và λ ∈ [0, 1]. Từ (i) suy ra λx ∈ C, và (1 − λ)y ∈ C. Theo (ii) có λx + (1 − λ)y ∈ C. Vậy C là một nón lồi.  Một số nón điển hình. Dưới đây ta sẽ xét một số nón lồi điển hình thường được sử dụng trong giải tích lồi. Tập lồi có một đặc trưng là: một tia xuất phát từ một điểm thuộc nó, thì hoặc nằm hẳn trong tập này hoặc một khi đã ra khỏi tập này thì sẽ không "trở lại". Định nghĩa 1.8. Cho C là một tập lồi trong IRn . Một véc-tơ y 6= 0 được gọi là hướng lùi xa của C, nếu mọi tia xuất phát từ một điểm bất kỳ của C theo hướng y đều nằm trọn trong C, tức là: y là hướng lùi xa khi và chỉ khi x + λy ∈ C ∀ x ∈ C, ∀λ ≥ 0. Một hướng lùi xa còn được gọi là hướng vô hạn . Ta sẽ ký hiệu tập hợp của tất cả các hướng lùi xa của C cùng với điểm gốc là reC. Tập hợp này được gọi là nón lùi xa của C. Hiển nhiên nếu C là một tập bị chặn, thì reC chỉ gồm duy nhất điểm gốc. Chú ý rằng, nếu C là một tập lồi đóng, thì trong định nghĩa trên, thay vì đòi hỏi với mọi x ∈ C, chỉ cần đòi hỏi cho một điểm x ∈ C. Cụ thể ta có mệnh đề sau: Mệnh đề 1.7. Giả sử C là một tập lồi đóng. Khi đó y là một hướng lùi xa của C khi và chỉ khi x + λy ∈ C ∀λ ≥ 0, với một điểm x nào đó thuộc C.

21

1.3 Nón lồi

Chứng minh. Giả sử x + λy ∈ C ∀λ > 0, với x ∈ C. Thế thì với mọi u ∈ C và mọi µ > 0, do C lồi, ta có xλ :=

µ µ ( x + λy) + (1 − )u ∈ C. λ+µ λ+µ

Cho λ → ∞, do C đóng, ta thấy u + µy ∈ C, với mọi u ∈ C và µ > 0.  Chú ý. Trong trường hợp C không đóng, bổ đề trên không đúng. Ví dụ, trong IR2 lấy C := { x = ( x1 , x2 )| x1 > 0, x2 > 0} ∪ {0}. Hiển nhiên véc-tơ y = (0, 1) có tính chất là mọi tia xuất phát từ một điểm 0 6= x ∈ C theo hướng này đều nằm trọn trong C, nhưng nếu xuất phát từ x = 0 thì điều này không đúng. Cho C ⊆ IRn là một tập lồi và x ∈ C. Ký hiệu NC ( x ) := {w| hw, y − x i ≤ 0 ∀y ∈ C}. Hiển nhiên 0 ∈ NC ( x ). Dùng định nghĩa, dễ kiểm tra được rằng NC ( x ) là một nón lồi đóng. Nón này được gọi là nón pháp tuyến ngoài của C tại x. Tập − NC ( x ) được gọi là nón pháp tuyến trong của C tại x. Hiển nhiên

− NC ( x ) := {w| hw, y − x i ≥ 0 ∀y ∈ C}. Một nón quan trọng khác là nón đối cực được định nghĩa như sau: C∗ := {w| hw, x i ≤ 0 ∀ x ∈ C}. Dễ thấy rằng đây cũng là một nón lồi đóng chứa gốc. Cho C là một tập lồi khác rỗng và x ∈ C. Ta nói d ∈ IRn là một hướng chấp nhận được của C nếu tồn tại t0 > 0 sao cho x + td ∈ C với mọi 0 ≤ t ≤ t0 . Tập tất cả các hướng chấp nhận được là một

22

Nhập môn giải tích lồi ứng dụng

nón lồi (dễ kiểm tra) chứa gốc. Ta sẽ ký hiệu nón này là FC ( x ) và sẽ gọi là nón các hướng chấp nhận được hoặc nói ngắn gọn là nón chấp nhận được. Nón này có thể không đóng, tuy nhiên nếu lấy bao đóng, ta sẽ dược một nón khác gọi là nón tiếp xúc của C tại x. Ký hiệu nón này là TC ( x ), thì FC ( x ) = TC ( x ). Từ đây suy ra TC ( x ) = {d ∈ IRn | ∃dk → d, ∃tk & 0 : x + tk dk ∈ C ∀k}. Mệnh đề sau đây dễ dàng được suy trực tiếp từ định nghĩa. Mệnh đề 1.8. Nón pháp tuyến và nón tiếp xúc là đối cực của nhau. Ví dụ 1.1. Giả sử tập lồi C được cho bởi C := { x ∈ IRn | ha j , x i ≤ b j , j = 1, ..., m}. Với x ∈ C, đặt J ( x ) := { j| h a j , x i = b j } gọi là tập chỉ số tích cực tại x. Khi đó TC ( x ) = {y ∈ IRn | ha j , yi ≤ 0, j ∈ J ( x )}, NC ( x ) = cone(a j , j ∈ J ( x )) = {y =

λ j a j : λ j ≥ 0}.

j∈ J (x)

1.4. Bài tập I 1.1. Chứng minh rằng một tập là a-phin khi và chỉ khi nó chứa mọi tổ hợp a-phin hữu hạn của các điểm thuộc nó. I 1.2. Chứng minh rằng nếu các véc-tơ x0 , ...., x k độc lập a-phin, thì tồn tại e > 0 sao cho mọi y0 , ..., yk thoả mãn || x j − y j || ≤ e với mọi j cũng độc lập a-phin.

23

1.4 Bài tập

I 1.3. Cho S là một k-đơn hình trong IRn có các đỉnh là v0 , ..., vk và T : IRk → IRn là một ánh xạ được cho bởi k

T (ξ 1 , ..., ξ k ) := v0 + ∑ ξ j (v j − v0 ) j =1

Chứng tỏ rằng T là ánh xạ 1 − 1 thoả mãn T (Sk ) = S. Ngược lại nếu T : IRk → IRn là một ánh xạ a-phin thì T (Sk ) là một k-đơn hình trong IRn và có các đỉnh là T (0), T (e1 ), ..., T (ek ), trong đó e j là véc-tơ đơn vị thứ j của IRn .

I 1.4.

(i) Chứng minh rằng reC là một nón lồi.

(ii) Một hướng d 6= 0 được gọi là hướng tựa lùi xa nếu như với mọi x ∈ C mà

{ x + λd|λ ≥ 0} ∩ C 6= { x }, thì x + λd ∈ C với mọi λ. Hãy tìm một hướng tựa lùi xa nhưng không phải là hướng lùi xa.

I 1.5. Chứng minh rằng nón tiếp xúc của một tập lồi C tại một điểm x ∈ C, chính là bao nón lồi đóng của tập C − { x }. Tức là TC ( x ) = cone (C − x ).

I 1.6. Hãy xét TC ( x ) với C là một nón lồi đóng và x 6= 0. I 1.7. (i) Chứng tỏ rằng nón pháp tuyến có tính chất địa phương theo nghĩa: nón pháp tuyến của tập C ∩ B( x ) tại x chính bằng NC ( x ), trong đó B( x ) là một lân cận của x. (ii) Chứng tỏ rằng nón pháp tuyến có tính chất đơn điệu theo nghĩa:

hw − w0 , x − x 0 i ≥ 0 ∀ x, x 0 ∈ C, ∀w ∈ NC ( x ), ∀w0 ∈ NC ( x 0 ).

24

Nhập môn giải tích lồi ứng dụng

I 1.8. Cho C và D là hai tập lồi đóng và x ∈ C ∩ D. Chứng minh rằng: (i) TC ∩ D ( x ) ⊆ TC ( x ) ∩ TD ( x ), (ii) NC ∩ D ( x ) ⊇ NC ( x ) + ND ( x ) (iii) Với ánh xạ a-phin A( x ) = A0 ( x ) + y0 , trong đó A0 là ánh xạ tuyến tính, thì TA(C ) ( A( x )) = A0 TC ( x ), NA(C ) ( A( x )) = ( A0∗ )−1 NC ( x ), trong đó ( A0∗ )−1 là toán tử nghịch đảo của toán tử liên hợp của A0 .

I 1.9. Cho C1 ⊂ IRni lồi đóng khác rỗng và xi ∈ Ci (i = 1, ..., k). Gọi C := C1 × C2 × ... × Ck . Chứng minh rằng NC ( x1 , ..., x k ) = NC1 ( x1 ) × ... × NCk ( x k ), TC ( x1 , ..., x k ) = TC1 ( x1 ) × ... × TCk ( x k ).

I 1.10. Cho C ⊂ IRn lồi, đóng, khác rỗng. Chứng minh rằng mọi x ∈ Rn đều có thể phân tích dưới dạng x = c + c∗ , trong đó c ∈ C, c∗ ∈ NC ( x ). Xét trường hợp C là nón lồi đóng và C là nửa không gian đóng.

Chương 2 ĐIỂM TRONG TƯƠNG ĐỐI VÀ PHIẾM HÀM MINKOWSKI

2.1. Điểm trong tương đối . . . . . . . . . . . . . . . . . . . . . . . . .

26

2.2. Phiếm hàm Minkowski . . . . . . . . . . . . . . . . . . . . . . .

30

2.3. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

32

Như đã thấy, trong định nghĩa tập lồi ta chỉ sử dụng đến tính chất tuyến tính của không gian. Tuy nhiên tính chất lồi sẽ kéo theo một số tính chất tô-pô rất tiện ích của tập lồi. Trong giải tích lồi, khái niệm điểm trong tương đối, sẽ được định nghĩa ngay sau đây, có một vai trò quan trọng. Lý do chính, một mặt, như sẽ thấy, một tập lồi trong không gian hữu hạn chiều bao giờ cũng có điểm trong tương đối, mặt khác các tập lồi xuất hiện trong nhiều ứng dụng thường không có thứ nguyên đầy đủ, do đó chúng không có điểm trong, nhưng vẫn có điểm trong tương đối.

26

Nhập môn giải tích lồi ứng dụng

2.1. Điểm trong tương đối Trong tối ưu hoá và một số lĩnh vực khác của toán học ứng dụng, người ta thường phải làm việc với các tập lồi trong không gian IRn có thứ nguyên không đầy đủ. Dĩ nhiên, những tập hợp này không có điểm trong. Tuy nhiên, nhờ cấu trúc lồi, chúng có điểm trong tương đối theo nghĩa sau: Định nghĩa 2.1. Một điểm a ∈ C được gọi là điểm trong tương đối của C nếu nó là điểm trong của C theo tô-pô cảm sinh bởi affC (tập a-phin nhỏ nhất chứa C). Ta sẽ ký hiệu tập hợp các điểm trong tương đối của C là riC. Theo định nghĩa trên ta có: riC := { a ∈ C| ∃ B : (a + B) ∩ affC ⊂ C}, trong đó B là một lân cận mở của gốc. Hiển nhiên riC = { a ∈ affC| ∃ B : (a + B) ∩ affC ⊂ C}. Như thường lệ, ta ký hiệu C là bao đóng của C. Khi đó tập hợp C \ riC được gọi là biên tương đối của C. Tập C được gọi là mở tương đối nếu C = riC. Dưới đây là một kết quả quen biết trong đại số tuyến tính. Mệnh đề 2.1. Cho A và B là hai tập a-phin trong IRn . Giả sử dimA = dimB. Khi đó tồn tại một ánh xạ a-phin 1-1 T từ A vào B sao cho TA = B. Trong một trường hợp riêng thường gặp khi C ⊂ IRn là một tập lồi khác rỗng có thứ nguyên là m, thì luôn tồn tại T là một ánh xạ a-phin 1-1 sao cho T (affC) = {( x1 , ..., xm , xm+1, ..., xn ) : xm+1 = ... = xn = 0}.

27

2.1 Điểm trong tương đối

Mệnh đề dưới đây cho một tính chất đặc trưng của điểm trong tương đối. Mệnh đề 2.2. Cho C lồi. Khi đó a ∈ riC khi và chỉ khi

∀ x ∈ affC, ∃λ > 0 : a + λ( x − a) ∈ C.

(2.1)

Chứng minh. Theo Mệnh đề 2.1, bằng cách lấy bao a-phin của C, ta có thể gỉa thiết dimC = n. Khi đó riC = intC. Theo định nghĩa điểm trong, nếu a ∈ intC, sẽ tồn tại một qủa cầu tâm a được chứa trọn trong C. Do đó (2.1) thỏa mãn. Ngược lại giả sử có (2.1). Để đơn giản, không giảm tổng quát ta có thể cho a = 0. Gọi ei (i = 1, ..., n) là véc-tơ đơn vị thứ i của IRn . Do đó đây là một cơ sở của IRn . Theo giả thiết (2.1), tồn tại β i > 0 sao cho β i ei ∈ C. Tương tự, đối với −ei , tồn tại αi > 0, sao cho −αi ei ∈ C (i = 1, ..., n). Lấy α := min{αi , β i , i = 1, ..., n} và quả cầu B := { x | || x ||1 ≤ α}, trong đó || x ||1 ký hiệu chuẩn max của x. Lấy ui = αei (i = 1, ..., n). Hiển nhiên là ui ∈ C, −ui ∈ C với mọi i. Với mọi x T = ( x1 , ..., xn ) ∈ B, đặt I− = {i | xi < 0}, I+ := {i | xi > 0}. Khi đó x=

∑ i ∈ I−

\=

∑ i ∈ I−

xi ei +

xi ei

i ∈ I+

n |x | |x | | xi | (−ui ) + ∑ i ui + (1 − ∑ i )0. α α α i ∈ I+ i =1

Chú ý rằng do x ∈ B và theo định nghĩa của || x ||1 , nên n

| xi | ≤ 1. α i =1

28

Nhập môn giải tích lồi ứng dụng

Chứng tỏ x là tổ hợp lồi của 0 ∈ C và ui ∈ C với i ∈ I+ và −ui ∈ C với i ∈ I− . Do C lồi, nên x ∈ C. Điều này đúng với mọi x ∈ B, do đó B ⊂ C. . Mệnh đề 2.3. Cho C ⊆ IRn là một tập lồi. Giả sử x ∈ riC. Khi đó với mọi y ∈ C tất cả các điểm trên đoạn thẳng nối x và y, có thể trừ y, đều thuộc riC. Nói cách khác, với mọi 0 ≤ λ < 1, thì (1 − λ)riC + λC ⊂ riC. Chứng minh. Theo Mệnh đề 2.1, bằng cách lấy bao a-phin, ta có thể giả sử riC = intC. Với B là quả cầu đơn vị tâm tại gốc, ta cần chứng tỏ tồn tại e > 0 sao cho với mọi 0 ≤ λ < 1, ta có

(1 − λ) x + λy + eB ⊂ C. Theo giả thiết y ∈ C, nên với mọi e > 0, ta có y ∈ C + eB. Vậy

(1 − λ) x + λy + eB ⊂ (1 − λ) x + λ(C + eB) + eB = (1 − λ)[ x + e(11−+λλ) B] + λC. Nhưng do x ∈ intC và 0 ≤ λ < 1, nên biểu thức trong ngoặc vuông, ký hiệu là z, thuộc C với mọi e > 0 đủ nhỏ. Do C lồi, nên

(1 − λ)z + λC ⊂ C.  Ap dụng mệnh đề trên với chú ý rằng riC ⊂ C, ta có hệ quả sau: Hệ quả 2.1. Nếu C lồi thì riC lồi. Định lý 2.1. Mọi tập lồi C ⊆ IRn khác rỗng đều có điểm trong tương đối. Chứng minh. Lấy M = affC. Giả sử dimM = m. Do đó M chứa 1 j (m + 1) điểm độc lập affin x0 , ..., x m thuộc C. Gọi a := ∑m j =0 m+1 x là tâm của đơn hình căng bởi các điểm x0 , ..., x m . Ta sẽ chứng tỏ

29

2.1 Điểm trong tương đối

a ∈ riC. Thật vậy, mọi x ∈ M đều biểu diễn được như là tổ hợp a-phin của các điểm x0 , ..., x m , tức là tồn tại λ j ( j = 0, 1, ..., m), ∑m j=0 λ j = 1 sao cho m

x=

∑ λj x j. j =0

Khi đó tồn tại µ j > 0 (j = 0, ..., m) sao cho m

∑ µ j x j = a + t( x − a) j =0

với t > 0 nào đó. Thật vậy ta có thể chọn µ j = (1 − t )

1 + tλ j . m+1

Với t > 0 và đủ nhỏ, ta có µ j > 0. Ngoài ra ∑m j=0 µ j = 1. Vậy a + t( x − a) ∈ C vì nó là tổ hợp lồi của các điểm của C. Theo Mệnh đề 2.2, điểm a ∈ riC.  Mệnh đề sau cho thấy điểm trong tương đối của một tập lồi được bảo toàn qua phép biến đổi tuyến tính. Mệnh đề 2.4. Cho ∅ 6= C ⊆ IRn là một tập lồi và A : IRn → IRm là toán tử tuyến tính. Khi đó A(riC) = ri( A(C)). Chứng minh. Như thường lệ, ta ký hiệu bao đóng của một tập E là E. Do C 6= ∅ và C lồi, nên riC 6= ∅ và lồi. Do A liên tục, nên dễ thấy rằng A(riC) ⊇ A(riC). Do đó A(riC) ⊇ A(riC ) = A(C ) ⊇ A(C) ⊇ A(riC). Từ đây, lấy bao đóng hai vế, ta có A(riC) = A(C) , và do đó ri( A(riC)) = ri( A(C)).

30

Nhập môn giải tích lồi ứng dụng

Thế nhưng ri( A(riC)) ⊆ A(riC), nên ri( A(C)) ⊆ A(riC). Để chứng minh chiều ngược lại ta lấy z ∈ A(riC). Khi đó tồn tại x ∈ riC sao cho Ax = z. Với mọi z0 ∈ A(C), ta có z0 = Ax 0 với x 0 ∈ C. Để chứng tỏ z ∈ ri( A(C)), ta chỉ cần chứng tỏ đoạn (z, z0 ) ⊂ ri( A(C)). Thật vậy với bất kỳ điểm v nào thuộc đoạn (z, z0 ), ta viết được v = λz + (1 − λ)z0 , 0 < λ < 1. Vậy v ∈ A(C), vì A(C) lồi và z, z0 ∈ A(C). Chú ý rằng do x ∈ riC và x 0 ∈ C, nên xλ = λx + (1 − λ) x 0 ∈ riC ∀λ ∈ (0, 1). Do A tuyến tính, nên v = λAx + (1 − λ) Ax 0 = A[λx + (1 − λ) x 0 ] ∈ A(C). Theo Mệnh đề 2.2, v ∈ ri( A(C)).



2.2. Phiếm hàm Minkowski Phiếm hàm cỡ (gauge) hay còn gọi là phiếm hàm Minkowski được định nghĩa dưới đây là một công cụ rất tiện ích giúp ta "định lượng" khi làm việc với bao đóng và phần trong của một tập lồi. Định nghĩa 2.2. Cho C ⊆ IRn là một tập lồi và 0 ∈ intC. Hàm gC : IRn → IR cho bởi gC ( x ) := inf{λ > 0| x ∈ λC} được gọi là phiếm hàm cỡ hoặcphiếm hàm Minkowski của C.

31

2.2 Phiếm hàm Minkowski

Về mặt hình học ta có thể hình dung tập C "nở ra" hoặc "co lại" thành tập λC, và gC ( x ) là số λ > 0 "nhỏ nhất" để x ∈ λC. Theo định nghĩa và do điểm 0 ∈ intC có lân cận lồi, cân đối, hấp thụ, nên:

• gC (0) = 0 và gC ( x ) > 0 với mọi x 6= 0. • Nếu x ∈ C thì gC ( x ) ≤ 1 vì x ∈ 1C. • Nếu x 6∈ C, thì gC ( x ) ≥ 1. Mệnh đề 2.5. Phiếm hàm cỡ gC của một tập lồi C chứa gốc làm điểm trong có các tính chất sau: (i) gC ((αx ) = αgC ( x ) ∀ x, ∀α ≥ 0 (thuần nhất dương bậc 1). (ii) gC ( x + y) ≤ gC ( x ) + gC (y) ∀ x, y (dưới cộng tính). (iii) gC là hàm liên tục trên toàn không gian. (iv) intC = { x | gC ( x ) < 1} ⊆ C ⊆ C = { x | gC ( x ) ≤ 1}. Chứng minh. (i) Do 0 ∈ intC có lân cận lồi, hấp thụ, nên với mọi x 6= 0, đều tồn tại λ > 0 sao cho x ∈ λC. Vậy gC ( x ) được xác định và gC ( x ) ≥ 0 với mọi x (hiển nhiên gC (0) = 0). Với mọi α > 0, theo định nghĩa ta có gC (αx ) = inf{λ > 0|αx ∈ λC} λ C} α = α inf{λ > 0| x ∈ λC} = αgC ( x ).

\= inf{λ > 0| x ∈

(ii) Nếu x ∈ λC, y ∈ µC với λ > 0, µ > 0, thì x = λx 0 , y = µy0 với x 0 , y0 ∈ C. Khi đó x + y = (λ + µ){

µ λ x0 + y0 } ∈ (λ + µ)C. λ+µ λ+µ

32

Nhập môn giải tích lồi ứng dụng

Vậy gC ( x + y) ≤ λ + µ với mọi λ > 0, µ > 0 sao cho x ∈ λC, y ∈ µC. Do đó g C ( x + y ) ≤ g C ( x ) + g C ( y ). (iii) Do 0 ∈ intC, nên với mọi e > 0, tồn tại δ > 0 sao cho Bδ := {u| ||u|| < δ} ⊂ eC. Với mọi x0 , tồn tại x − x0 ∈ Bδ ⊂ eC. Vậy gC ( x − x0 ) ≤ e. Theo tính chất dưới cộng tính, ta có gC ( x ) = gC ( x0 + x − x0 ) ≤ gC ( x0 ) + gC ( x − x0 ) ≤ gC ( x0 ) + e. Mặt khác do x0 − x ∈ Bδ ⊂ eC, nên tương tự ta có gC ( x0 ) ≤ gC ( x ) + e. Kết hợp lại ta được | gC ( x ) − gC ( x0 )| ≤ e khi || x − x0 || < δ. Vậy gC liên tục tại x0 . (iv) Suy ra dễ dàng từ định nghĩa và từ tính liên tục của hàm gC . 

2.3. Bài tập I 2.1. Hãy xác định bao đóng, điểm trong và điểm biên của các tập sau: a) C := { x ∈ IR3 | | x12 + x22 ≤ x3 }, b) C := { x ∈ IR2 | 1 ≤ x1 ≤ 2, x2 = 3}, 0},

  1. C := { x ∈ IR3 | x1 + x2 ≤ 3, − x1 + x2 + x3 ≤ 5, x1 , x2 , x3 ≥ d) C := { x ∈ IR3 | x1 + x2 = 3, x1 + x2 + x3 ≤ 6}, e) C := { x ∈ IR3 | x12 + x22 + x32 ≤ 4, x1 + x3 = 1}.

I 2.2. Chứng tỏ rằng nếu C lồi, thì C lồi và C = riC, riC = riC.

2.3 Bài tập

33

I 2.3. Cho C lồi. Chứng minh rằng (i) aff(riC) = aff(C) = aff(C ) (ii) dimC = dim(C ) = dim (riC) (iii) ri(λC) = λ(riC) với mọi λ ∈ IR.

I 2.4. Cho A, B là các tập lồi và C = A + B. Chứng minh rằng riC = riA + riB. Hướng dẫn: áp dụng Mệnh đề 2.4 với ánh xạ tuyến tính A thích hợp. Cụ thể: Do C ⊂ C, nên affC ⊂ affC. Mặt khác do affC luôn là tập đóng, nên C ⊂ affC = affC. Vậy affC = affC và do đó dimC = dimC.

I 2.5. Chứng minh rằng bao đóng và điểm trong tương đối được bảo toàn dưới một phép biến đổi a-phin một - một từ không gian IRn vào chính nó. I 2.6. Chứng minh rằng nếu C lồi thì các tập riC, bao đóng C của C cũng lồi.

34

Nhập môn giải tích lồi ứng dụng

Chương 3 BAO LỒI VÀ ĐỊNH LÝ CARATHÉODORY

3.1. Bao lồi, bao a-phin, bao nón lồi . . . . . . . . . . . . . . . 3.2. Định lý Carathéodory . . . . . . . . . . . . . . . . . . . . . . . . . 3.3. Một ứng dụng trong quy hoạch toán học . . . . . . 3.4. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

35 38 44 47

Cấu trúc lồi tuy phức tạp hơn cấu trúc tuyến tính, nhưng tập lồi vẫn còn có một số tính chất rất tiện ích trong nhiều ứng dụng. Do đó trong nhiều trường hợp, người ta hay xấp xỉ một tập không lồi bởi một tập lồi. Dĩ nhiên tập xấp xỉ phải là một tập lồi "sát nhất" tập đã cho theo một nghĩa nào đó.

3.1. Bao lồi, bao a-phin, bao nón lồi Khái niệm bao lồi, bao a-phin và bao nón lồi của một tập có vai trò quan trọng trong việc xấp xỉ một tập không lồi bởi tập lồi, tập a-phin hoặc nón lồi.

36

Nhập môn giải tích lồi ứng dụng

Định nghĩa 3.1. Bao lồi của một tập E là giao của tất cả các tập lồi chứa E. Tương tự, ta định nghĩa bao a-phin của E là giao của tất cả các tập a-phin chứa E, và bao nón lồi của tập E (còn gọi là nón lồi sinh bởi E) là giao của tất cả các nón lồi chứa E. Bao lồi của một tập E sẽ được ký hiệu là coE; bao a-phin của một tập E sẽ được ký hiệu là affE, còn bao nón lồi của E sẽ được ký hiệu là coneE. Do tính chất của nón, nên nếu một điểm x ∈ coneE, thì λx ∈coneE với mọi λ > 0. Do đó để tiện làm việc, người ta thường cho luôn điểm gốc vào bao nón lồi của một tập. Chú ý rằng giao của các tập lồi (tập a-phin, nón lồi) cũng là tập lồi (tập a-phin, nón lồi), nên bao lồi, bao a-phin và bao nón lồi được xác định một cách duy nhất. Như vậy bao lồi của một tập E là tập lồi nhỏ nhất chứa E. Tương tự bao a-phin của E là tập a-phin nhỏ nhất chứa E. Bao nón lồi của E là tập hợp gồm gốc tọa độ và nón lồi nhỏ nhất chứa E. Như vậy khác với bao lồi và bao a-phin, bao nón lồi của một tập nói chung khác một chút với nón lồi nhỏ nhất chứa tập đó. Dĩ nhiên nếu E 6= ∅, thì bao lồi, bao a-phin và bao nón lồi luôn tồn tại duy nhất và khác rỗng vì các tập này đều chứa E và vì bản thân toàn bộ không gian đồng thời vừa là một tập lồi, một tâp a-phin và một nón lồi chứa E. Chú ý rằng có một số tác giả định nghĩa nón như sau: một tập C được gọi là một nón nếu với mọi x ∈ C thì λx ∈ C với mọi λ ≥ 0. Theo định nghĩa này, nón luôn chứa gốc. Khi đó bao nón lồi của một tập E chính là giao của các nón lồi chứa E. Nhắc lại rằng, thứ nguyên (còn gọi là chiều) của một tập E bất kỳ được định nghĩa như là thứ nguyên của bao a-phin của nó. Tức là dimE := dim(affE).

37

3.1 Bao lồi, bao a-phin, bao nón lồi Mệnh đề 3.1. Cho E là một tập lồi. Khi đó coneE = {λx | x ∈ E, λ ≥ 0}.

Chứng minh. Gọi M := {λx | x ∈ E, λ > 0}. Hiển nhiên là bất kỳ nón nào chứa E, đều phải chứa M. Ta sẽ chỉ ra là bản thân M cũng là một nón lồi. Giả sử y1 , y2 ∈ M. Vậy y1 = λ1 x1 , y2 = λ2 x2 với λ1 , λ2 > 0 và x1 , x2 ∈ E. Khi đó ta có y1 + y2 = (λ1 + λ2 )( Do E lồi, nên

λ2 λ1 x1 + x 2 ). λ1 + λ2 λ1 + λ2

λ2 λ1 x1 + x2 ∈ E. λ1 + λ2 λ1 + λ2

Vậy y1 + y2 ∈ M. Suy ra M là nón lồi nhỏ nhất chứa E và do đó bao nón lồi của E là tập hợp gồm M và gốc tọa độ. Tức là coneE = {λx | x ∈ E, λ ≥ 0}.  Mệnh đề 3.2. Cho E là một tập bất kỳ. Khi đó (i) coE là tập hợp các tổ hợp lồi của các điểm thuộc E. (ii) affE là tập hợp các tổ hợp a-phin của các điểm thuộc E. (iii) coneE là tập hợp các tổ hợp không âm của các điểm thuộc E. Chứng minh. (i) Gọi M là tập hợp các tổ hợp lồi của các điểm thuộc E. Vì E ⊂ coE và coE lồi, nên M ⊂ coE. Vì thế để chỉ ra M = coE, ta chỉ cần chứng tỏ M là tập lồi. Thật vậy lấy x, y ∈ M. Theo định nghĩa của M, các điểm này có dạng x = ∑ik=1 λi xi , y = ∑hj=1 µ j y j , với xi , y j ∈ E, λi > 0, µ j > 0 với mọi i, j và ∑ik=1 λi = 1, ∑hj=1 µ j = 1, Khi đó nếu α ∈ (0, 1) thì z := αx + (1 − α)y =

k

h

i =1

j =1

∑ αλi xi + ∑ (1 − α)µ j y j .

38

Nhập môn giải tích lồi ứng dụng

Do 0 < α < 1 và λi > 0, µ j > 0 với mọi i, j, và do k

h

i =1

j =1

∑ αλi + ∑ (1 − α)µ j = 1, nên z là một tổ hợp lồi của các điểm thuộc E. Vậy z ∈ M. Suy ra M lồi, và do đó M = coE. (ii) Vẫn như trên, ta gọi M là tập hợp của các tổ hợp a-phin của các điểm thuộc E. Do E ⊆ affE và affE là tập a-phin, nên M ⊆ affE. Ta chỉ cần chứng tỏ M là tập a-phin. Giả sử x, y ∈ M. Theo định nghĩa của M, các điểm này có dạng x = ∑ik=1 λi xi , y = ∑hj=1 µ j y j , với xi , y j ∈ E với mọi i, j và ∑ik=1 λi = 1, ∑hj=1 µ j = 1. Với α bất kỳ, ta có k

h

i =1

j =1

∑ αλi xi + ∑ (1 − α)µ j y j .

z := αx + (1 − α)y = Do

k

h

i =1

j =1

∑ αλi + ∑ (1 − α)µ j = 1, nên z ∈ M và do đó M là tập a-phin. Suy ra M = affE. (iii) Từ tính chất (i) và (ii) vừa chứng minh, suy ra rằng một nón lồi là đóng với phép cộng hai phần tử của nó và phép nhân một phần tử với một số dương. Từ đây suy ra coneE là tập hợp gồm các tổ hợp không âm của các phần tử thuộc E. 

3.2. Định lý Carathéodory Theo mệnh đề trên, mọi phần tử x thuộc coE đều là tổ hợp lồi của các phần tử thuộc E. Số phần tử của E tham gia trong tổ hợp lồi này dĩ nhiên phụ thuộc vào mỗi điểm x. Định lý sau nói rằng

39

3.2 Định lý Carathéodory

nếu dim E ≤ k, thì mọi điểm thuộc coE đều biểu diễn được như là một tổ hợp lồi của nhiều nhất là (k + 1) phần tử của E. Định lý 3.1 (Carathéodory). Cho E là một tập bị chứa trong một tập a-phin có thứ nguyên là k. Khi đó mọi x ∈ coE đều có thể biểu diễn như là tổ hợp lồi của nhiều nhất (k + 1) phần tử của E. Chứng minh định lý này sẽ dùng đến mệnh đề sau, cũng là một dạng của định lý Carathéodory đối với bao nón lồi. Mệnh đề 3.3. Giả sử E ⊂ IRk . Khi đó mỗi điểm x 6= 0 thuộc coneE đều có thể biểu diễn dưới dạng x = λ1 x1 + ... + λr xr , trong đó xi ∈ E, λi > 0 với mọi i và các điểm x1 , ..., xr độc lập tuyến tính. Nói riêng r ≤ k. Chứng minh. Với mọi x ∈ coneE, theo Mệnh đề 3.2. x = µ1 x1 + ... + µh x h

(3.1)

với µi > 0, xi ∈ E với mọi i = 1, ..., h. Nếu các véc-tơ x1 , ..., x h phụ thuộc tuyến tính, thì sẽ tồn tại các số γ1 , ..., γh không đồng thời bằng 0 sao cho γ1 x1 + ... + γh x h = 0.

(3.2)

Bằng cách đổi dấu toàn bộ γ1 , ..., γh nếu cần, ta có thể giả sử γ j > 0 với một j nào đó. Vậy nếu I = {i |1 ≤ i ≤ h, γi > 0}, thì I 6= ∅. Đặt β := min i∈ I

µi , γi

40

Nhập môn giải tích lồi ứng dụng µi0 := µi − βγi (i = 1, ..., h).

Khi đó µi0 ≥ 0 (i = 1, ..., h) và có ít nhất một µ0j0 = 0. Mặt khác theo (3.1) và (3.2) ta có h

∑ i =1,i 6= j0

µi0 xi =

h

∑ µ i x i − β ∑ γi x i =

h

h

∑ µi xi = x.

i =1

i =1

i =1

Như vậy ta có một tổ hợp tuyến tính không âm mới của x với (h − 1) phần tử. Nếu các phần tử trong biểu diễn mới này vẫn phụ thuộc tuyến tính, thì lặp lại quá trình trên cho đến lúc các phần tử trong biểu diễn tổ hợp tuyến tính của x độc lập tuyến tính.  Chứng minh định lý Carathéodory. Xét tập hợp B := {1} × E = {(1, x ) | x ∈ E} ⊂ IR × IRk . Ta có coB = {1} × coE. Giả sử coneB là nón lồi sinh bởi B. Do coB là tập lồi nhỏ nhất chứa B, nên coB ⊂ coneB. Với mọi (1, x ) ∈ coB, theo mệnh đề trên, tồn tại các điểm

(1, x1 ), ..., (1, xr ) ∈ B và các số λ1 , ..., λr , với r ≤ k + 1 thỏa mãn: x = λ1 x1 + ... + λr xr , xi ∈ E ∀i, λ1 + ... + λr = 1, λi > 0 ∀i .

 Ta nhắc lại các khái niệm về điểm trong, điểm biên, tập compắc v.v... trong giải tích cổ điển. Cho E ⊆ IRn . Điểm a được gọi là

41

3.2 Định lý Carathéodory

điểm trong của E nếu tồn tại một lân cận mở U (a) của a sao cho U (a) ⊂ E. Ký hiệu tập hợp các điểm trong của tập E là intE và B là quả cầu đơn vị, tâm ở gốc. Khi đó theo định nghĩa ta có intE = { x : ∃r > 0, x + rB ⊂ E}. Điểm a được gọi là điểm biên của E nếu mọi lân cận của a đều có điểm thuộc E và điểm không thuộc E. Tập E được gọi là tập mở nếu mọi điểm của E đều là điểm trong của E. Tập E được gọi là tập đóng, nếu E chứa mọi điểm biên của nó. Tập E ⊂ IRn được gọi là một tập com-pắc, nếu E là một tập đóng và bị chặn. Ta nói điểm a thuộc bao đóng của tập E nếu mọi lân cận của a đều chứa điểm thuộc E. Ký kiệu E là bao đóng của E. Khi đó từ định nghĩa suy ra E = ∩r>0 (E + rB). Chú ý rằng bao lồi của một tập đóng không nhất thiết đóng. Ví dụ, nếu E = {( x, 0) ∈ IR2 , x ∈ IR} ∪ {(0, 1)}, thì coE = {( x, y) ∈ IR2 | x ∈ IR, 0 ≤ y < 1} ∪ {(0, 1)}. Tuy nhiên nếu E là com-pắc, thì coE cũng là com-pắc theo hệ qủa sau đây: Hệ quả 3.1. Nếu E ⊂ IRn là một tập com-pắc, thì coE cũng com-pắc. Chứng minh. Gọi S là n-đơn hình trong IRn+1 được cho bởi: n +1

S := {(λ1 , ..., λn+1)|

∑ λi = 1, λi ≥ 0 ∀i}.

i =1

Xét ánh xạ ϕ : S × E × ... × E → IRn

42

Nhập môn giải tích lồi ứng dụng

được xác định như sau: 1

ϕ(λ, x , ..., x

n +1

n +1

)=

∑ λi x i .

i =1

Như vậy ϕ(λ, x1 , ..., x n+1) là một tổ hợp lồi của n + 1 điểm của E. Theo định lý Carathéodory ϕ(S × E × ... × E) = coE. Hiển nhiên ϕ liên tục. Do tập S × E × ... × E com-pắc, nên ϕ(S × E × ... × E) cũng com-pắc và do đó coE là tập com-pắc.  Định nghĩa 3.2. Một điểm x ∈ C được gọi là điểm cực biên của C, nếu không tồn tại a, b ∈ C, a 6= b và 0 < λ < 1 sao cho x = λa + (1 − λ)b. Trong trường hơp tập lồi là đa diện, điểm cực biên cũng được gọi là đỉnh. Ta sẽ ký hiệu V (C) là tập các điểm cực biên của C. Theo hệ quả trên, bao lồi của một số hũu hạn điểm là một tập đa diện lồi, com-pắc. Nếu v0 , v1 , ..., , vm độc lập a-phin, thì bao lồi của chúng là một đơn hình. Đơn hình này có thứ nguyên là m. Các điểm v0 , v1 , ..., vm được gọi là đỉnh (điểm cực biên) của đơn hình này. Theo mệnh đề trên, mỗi điểm x thuộc bao lồi của các điểm v0 , v1 , ..., vm đều là tổ hợp lồi của các điểm này. Khi đó tồn tại các số λ j ( j = 0, ..., m), thoả mãn m

λ j ≥ 0, ( j = 0, ..., m),

m

∑ λ j = 1, x =

∑ λj vj.

j =0

j =0

Nếu v0 , v1 , ..., vm độc lập a-phin, thì các số λ j như trên được xác định duy nhất. Các số này được gọi là tọa độ trọng tâm của x. Mệnh đề 3.4. Cho E 6= ∅ là một tập bất kỳ. Khi đó mọi điểm cực biên của bao lồi của E đều thuộc E, tức là V (coE) ⊂ E.

43

3.2 Định lý Carathéodory

Chứng minh. Gọi C = coE và x ∈ V (C) là một điểm cực biên của C. Khi đó x ∈ C và do C là bao lồi của E, nên nó có thể biểu diễn được như là một tổ hợp lồi của một số điểm của E, tức là tồn tại λ j > 0, x j ∈ E, ( j = 1, ..., m) sao cho ∑m j=1 λ j = 1 và m

x=

∑ λj x j. j =1

Do x là điểm cực biên của C, nên m = 1 vì trái lại thì x không phải là điểm cực biên.  Định nghĩa 3.3. Bao lồi đóng của một tập E là tập lồi đóng nhỏ nhất chứa E. Ta sẽ ký hiệu bao lồi đóng của một tập E là coE. Tính chất lồi của một tập luôn được bảo toàn với việc lấy bao đóng và lấy phần trong, theo mệnh đề sau: Mệnh đề 3.5. Nếu E là một tập lồi, thì E, intE, riE cũng là các tập lồi. Chứng minh. Bài tập 2 Việc lấy bao lồi đóng và việc lấy bao đóng của bao lồi có thể thay thế cho nhau. Ta có mệnh đề sau: Mệnh đề 3.6. Bao lồi đóng của một tập E trùng với bao đóng của bao lồi của E, tức là coE = coE. Chứng minh. Bài tập. 2 Bao lồi có rất nhiều ứng dụng quan trọng, đặc biệt trong tối ưu hóa và toán học tính toán nói chung. Dưới đây ta sẽ xét một vài ứng dụng của bao lồi.

44

Nhập môn giải tích lồi ứng dụng

3.3. Một ứng dụng trong quy hoạch toán học Bài toán quy hoạch toán học đuợc hiểu như là bài toán tìm cực trị (cực đại hoặc cực tiểu theo một tiêu chuẩn nào đó) của một hàm (hàm số hay hàm véc-tơ, đơn trị hoặc đa trị) dưới những điều kiện nhất định. Để đơn giản, trước hết ta xét bài toán qui hoạch đơn trị, có một mục tiêu sau: Cho E ⊆ IRn và f là một hàm số thực xác định trên một tập nào đó chứa E. Xét bài toán qui hoạch toán học: min f ( x ) với điều kiện x ∈ E.

( P)

Bài toán này được hiểu là hãy tìm một điểm x ∗ ∈ E sao cho f ( x ∗ ) ≤ f ( x ) với mọi x ∈ E. Điểm x ∗ thỏa mãn điều kiện này được gọi là điểm cực tiểu toàn cục của f trên E, hoặc là nghiệm tối ưu (toàn cục) của bài toán (P). Điểm x ∗ ∈ E được gọi là nghiệm cực tiểu địa phương của (P), nếu tồn tại một lân cận mở U của x ∗ sao cho f ( x ∗ ) ≤ f ( x ) với mọi x ∈ E ∩ U. Hàm f dược gọi là hàm mục tiêu, còn tập E được gọi là miền ràng buộc hoặc là miền chấp nhận được của bài toán (P). Mỗi điểm x ∈ E được gọi là một phương án chấp nhận được của bài toán (P). Thông thường tập E được cho như là tập nghiệm của một hệ bất đẳng thức hoặc/và đẳng thức có dạng E := { x ∈ IRn : g j ( x ) ≤ 0, hi ( x ) = 0, j = 1, .., m, i = 1, ..., p}, trong đó g j và hi ( j = 1, ..., m, i = 1, ..., p) là các hàm số thực xác định trên IRn . Bài toán (P) có rất nhiều ứng dụng trong các lĩnh vực khác nhau. Ví dụ, trong kinh tế nó là bài toán xác định phương án sản xuất sao cho chi phí thấp nhất. Trong ví dụ này x là phương án sản xuất, mà mỗi tọa độ x j của nó là số lượng sản phẩm loại j cần sản xuất, còn f ( x ) là chi phí ứng với phương án x. Bài toán

3.3 Một ứng dụng trong quy hoạch toán học

45

(P) trong mô hình này có nghĩa là tìm một phương án sản xuất trong tập hợp các phương án chấp nhận được E sao cho chi phí sản xuất ứng với phương án này là thấp nhất. Nói chung nghiệm tối ưu của bài toán (P) có thể không tồn tại. Tuy nhiên khi E là một tập com-pắc và f nửa liên tục dưới, thì theo định lý Weirstrass quen thuộc, bài toán (P) luôn có nghiệm. Mệnh đề sau đây cho thấy vai trò của bao lồi trong bài toán quy hoạch toán học. Mệnh đề 3.7. Giả sử f là một hàm tuyến tính trên IRn và ∅ 6= E ⊂ IRn là tập com-pắc. Khi đó min{ f ( x ) : x ∈ E} = min{ f ( x ) : x ∈ coE}. Hơn nữa tồn tại x min ∈ E sao cho f ( x min ) = min{ f ( x ) : x ∈ coE}

( P1)

Trước khi chứng minh mệnh đề này, ta nhắc lại rằng, tính chất tuyến tính của f trên IRn có nghĩa là với mọi x, y ∈ IRn và mọi α, β ∈ IR, ta có f (λx + βy) = α f ( x ) + β f (y). Chứng minh. Do E là tập com-pắc, nên theo Hệ qủa 3.1 bao lồi coE của E cũng là tập com-pắc. Do một hàm tuyến tính trong không gian IRn là liên tục, nên bài toán (P1) luôn có nghiệm tối ưu (toàn cục). Giả sử x ∗ là một nghiệm tối ưu của (P1). Theo định nghĩa của bao lồi, điểm x ∗ là một tổ hợp lồi của các điểm cực biên của tập coE. Do đó các điểm này cũng thuộc E. Nói cách khác tồn tại các số thực λ j > 0 và các điểm x j ∈ E ( j = 1, ..., K ), ∑Kj=1 λ j = 1 sao cho x∗ =

K

∑ λj x j. j =1

46

Nhập môn giải tích lồi ứng dụng

Gọi x min ∈ { x1 , ..., x K } sao cho f ( x min ) = min{ f ( x1 ), ..., f ( x K )}. Theo tính chất tuyến tính của f ta có f ( x ∗ ) = f (∑ Kj=1 λ j x j ) = ∑Kj=1 λ j f ( x j ) ≥ f ( xmin ) ∑Kj=1 λ j = f ( x min ). Nhưng do x ∗ là nghiệm tối ưu của bài toán (P1) và do E ⊂ coE, nên f ( x ∗ ) ≤ f ( x min ). Từ đây có f ( x ∗ ) = f ( x min ), và do x min ∈ E, nên suy ra x min là nghiệm tối ưu của bài toán (P1).  Chú ý rằng giả thiết tuyến tính của f , về mặt lý thuyết, không phải là một hạn chế, vì bằng cách thêm một biến phụ, ta luôn có thể đưa một bài toán quy hoạch có hàm mục tiêu bất kỳ về bài toán có hàm mục tiêu tuyến tính. Theo mệnh đề này, việc tìm cực tiểu của một hàm tuyến tính f trên một tập com-pắc E có thể thay thế bằng việc tìm cực tiểu của f trên các đỉnh của bao lồi của E. Một ví dụ khác về ứng dụng của bao lồi là bài toán nhận dạng, ví dụ nhận dạng chữ cái la tinh. Mỗi chữ cái có thể coi như một tập đóng trong IR2 . Do bản thân mỗi chữ (nếu không phải là một tập lồi) thường phức tạp hơn rất nhiều bao lồi của chữ đó. Ngoài ra bao lồi của mỗi chữ cái khác nhau thường là khác nhau, nên có thể thay cho việc nhận dạng mỗi chữ cái không phải là tập lồi, bằng việc nhận dạng bao lồi của nó. Việc tính hoặc biểu diễn tường minh bao lồi của một tập, nói chung là một bài toán khó, đặc biệt là trong không gian cao chiều. Trong không gian 2 chiều (mặt phẳng) việc tìm tập đỉnh của bao lồi của một số hữu hạn điểm có thể thực hiện bằng một thuật toán khá hiệu qủa với độ phức tạp là NlogN, trong đó N là số các điểm này trong không gian 2 chiều.

47

3.4 Bài tập

Trong phần hai của giáo trình này, ta sẽ còn đề cập đến các ứng dụng khác của bao lồi trong tối ưu hoá.

3.4. Bài tập I 3.1. Hãy tính bao lồi và bao nón lồi của các tập sau: a) E := { x ∈ IR2 k x12 + x22 = 1}, b) E := {( x1 , x2 )| x2 = 0} ∪ {( x1 , x2 ) |0 ≤ x2 ≤ 1}. Tính coE

I 3.2. Cho x1 , ...x k ∈ IRn . Chứng minh rằng ri (co{ x1 , ..., x k }) = { x | x =

k

k

i =1

i =1

∑ λi xi , λi > 0, ∑ = 1}.

ri [cone{ x1 , ..., x k }] = { x | x =

k

∑ λi x i ,

λi > 0 ∀ i } .

i =1

I 3.3. Chứng minh rằng phép lấy bao lồi và phép lấy bao nón lồi có thể hoán vị. Tức là cone[coE] = co[coneE].

I 3.4. Cho A, B là hai tập lồi trong IRn . Chứng minh rằng co( A ∪ B) = {z = λx + (1 − λ)y | x ∈ A, y ∈ B, 0 ≤ λ ≤ 1}. Hãy mở rộng cho trường hợp có một số hữu hạn tập.

48

Nhập môn giải tích lồi ứng dụng

Chương 4 CẤU TRÚC BIÊN VÀ BIỂU DIỄN TẬP LỒI

4.1. Diện, điểm và hướng cực biên, siêu phẳng tựa 4.2. Trường hợp tập lồi đa diện . . . . . . . . . . . . . . . . . . . 4.3. Định lý biểu diễn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

49 53 61 63

Trong chương trước, chúng ta đã thấy cấu trúc "bên trong" của tập lồi có nhiều tính chất rất tiện ích. Trong chương này ta sẽ xem xét các cấu trúc biên và cực biên của tập lồi.

4.1. Diện, điểm và hướng cực biên, siêu phẳng tựa Các khái niệm về diện, hướng và điểm cực biên có vai trò quan trọng trong việc khảo sát các tính chất về cấu trúc của tập lồi. Có thể nói diện của một tập lồi như là bộ mặt của nó. Thông thường cấu trúc của một tập lồi được xác định thông qua các diện của

50

Nhập môn giải tích lồi ứng dụng

nó. Định nghĩa 4.1. Một tập F ⊆ C được gọi là một diện của một tập lồi C nếu F là tập lồi có tính chất là:

∀ x, y ∈ C : tx + (1 − t)y ∈ F, 0 < t < 1 ⇒ [ x, y] ⊂ F. Điều này có nghĩa rằng, tập lồi F là một diện của C, nếu như khi F chứa một điểm của đoạn mở ( x, y) thì F chứa toàn bộ khoảng [ x, y]. Do C lồi, nên bản thân C cũng là một diện của chính nó. Ta sẽ nói F là một diện không tầm thường của C nếu như F 6≡ ∅ và F 6≡ C. Điểm cực biên là diện có thứ nguyên bằng 0. Cạnh là diện có thứ nguyên bằng 1. Tia cực biên là một diện nửa đường thẳng. Như vậy tia cực biên là một cạnh vô hạn. Hướng cực biên là hướng của tia cực biên. Ta nói hai hướng d và h là khác nhau nếu không thể biểu diễn được d = αh vơi α > 0. Dễ thấy rằng d là hướng cực biên của một tập lồi, nếu nó không thể biểu diễn bằng tổ hợp tuyến tính dương của hai hướng khác thuộc tập lồi đó. Từ định nghĩa này suy ra ngay rằng x0 ∈ C là một điểm cực biên của C khi và chỉ khi không tồn tại hai điểm x, y ∈ C sao cho x0 = λx + (1 − λ)y với 0 < λ < 1. Ngoài ra một điểm hoặc một tia cực biên của một diện của một tập lồi C cũng là một điểm hoặc một tia cực biên của C. Tập hợp các điểm cực biên của C thường được ký hiệu là V (C). Khi C là một tập lồi đa diện, thì điểm cực biên còn được gọi là đỉnh. Định nghĩa 4.2. Cho x0 ∈ C. Ta nói aT x = α là siêu phẳng tựa của C tại x0 , nếu aT x0 = α, aT x ≥ α ∀ x ∈ C. Như vậy siêu phẳng tựa của C tại x0 là siêu phẳng đi qua x0 và để tập C về một phía. Nửa không gian aT x ≥ α trong định nghĩa trên, được gọi là nửa không gian tựa của C tại x0 .

4.1 Diện, điểm và hướng cực biên, siêu phẳng tựa

51

Mệnh đề 4.1. Nếu H là một siêu phẳng tựa của C thì H ∩ C là một diện của C; diện này là không tầm thường khi và chỉ khi H ∩ riC = ∅. Chứng minh. Gọi F = C ∩ H. Do C và H lồi, nên F lồi. Giả sử siêu phẳng tựa H có dạng H := { x | ht, x i = α} và ht, x i ≥ α ∀ x ∈ C. Để chứng tỏ F là một diện của C, hãy cho a, b ∈ C, x = λa + (1 − λ)b với 0 < λ < 1 và giả sử x ∈ F. Khi đó α = ht, x i = λht, ai + (1 − λ)ht, bi. Do a, b ∈ C, nên

ht, x i ≥ α, ht, bi ≥ α. Từ đây suy ra

ht, ai = α ht, bi = α. Như vậy a, b ∈ F. Và do F lồi, nên cả đoạn [ a, b] ⊂ F. Do đó F là một diện. Việc chứng minh rằng F không tầm thường khi và chỉ khi H ∩ riC = ∅, chỉ cần sử dụng trực tiếp định nghĩa.  Mệnh đề sau đây cho phép tính diện của tập tích Descartes (Đề-Các). Mệnh đề 4.2. Cho Ci ⊆ IRni (i = 1, ..., k) là các tập lồi khác rỗng. Khi đó một tập F là một diện của tập C := C1 × ... × Ck , khi và chỉ khi F có dạng F = F1 × ... × Fk , trong đó Fi là diện của Ci . Chứng minh. Do tích Descartes có tính chất kết hợp, ta chỉ cần chứng minh cho trường hợp k = 2. Giả sử F = F1 × F2 với Fi là diện của Ci (i = 1, 2). Dùng trực tiếp định nghĩa của diện, dễ dàng chỉ ra được rằng F là một diện của C.

52

Nhập môn giải tích lồi ứng dụng

Để chứng minh điều ngược lại, ta giả sử F là một diện của C. Gọi F1 và F2 là hình chiếu của F trên IRn1 và trên IRn2 . Khi đó F ⊆ F1 × F2 . Ta sẽ chứng minh bao hàm thức ngược lại. Thật vậy, nếu x1 ∈ F1 , thì sẽ có x2 sao cho ( x1 , x2 ) ∈ F ⊆ C1 × C2 . Vậy x1 ∈ C1 . Suy ra F1 ⊆ C1 . Hiển nhiên là F1 là tập lồi, vì nó là hình chiếu của tập lồi F. Tương tự, ta có F2 là tập lồi và F2 ⊆ C2 . Vậy F1 × F2 là tập lồi thuộc C1 × C2 . Do F ⊆ F1 × F2 và do F là một diện, nên F1 × F2 ⊆ F. Kết hợp lại F1 × F2 = F.  Bây giờ ta xét diện của một tập là giao của một số hữu hạn các tập lồi. Mệnh đề 4.3. Cho Ci ⊆ IRn (i = 1, ..., k) là các tập lồi khác rỗng. Khi đó một tập F = F1 ∩ ... ∩ Fk , trong đó Fi là diện của Ci , là một diện của tập C := C1 ∩ ... ∩ Ck . Chứng minh. Giả sử Fi ⊆ Ci là một diện của Ci . Ta chỉ ra rằng F := ∩ Fi là một diện của C. Thật vậy, vì F ⊂ Fi ⊆ Ci với mọi i, nên F ⊂ C. Lấy x, y ∈ C và cho λx + (1 − λ)y ∈ F, với λ ∈ (0, 1). Vậy λx + (1 − λ)y ∈ Fi với mọi i. Nhưng do Fi là diện của Ci , nên [ x, y] ⊂ Fi với mọi i. Do đó [ x, y] ⊂ F. Chứng tỏ F là diện của C.  Nhớ lại rằng một véc- tơ d 6= 0 được gọi là hướng lùi xa, hay là hướng vô hạn của tập C nếu

∀ x ∈ C, ∀λ ≥ 0 ⇒ x + λd ∈ C. Chú ý rằng nếu C lồi, đóng thì định nghĩa trên tương đương với

∃ x ∈ C : ∀λ ≥ 0 ⇒ x + λd ∈ C. Trong chương 1, ta đã thấy rằng tập hợp gồm gốc tọa độ và tất cả các hướng vô hạn của tập lồi C là một nón lồi. Nón này được

4.2 Trường hợp tập lồi đa diện

53

gọi là nón các hướng vô hạn, hay là nón lùi xa của C và được ký hiệu là reC. Tập L(C) := (reC) ∩ (−reC) là một không gian con và được gọi là không gian thẳng của C. Thứ nguyên của không gian này được gọi là độ thẳng của C và được ký hiệu là lineality C. Vậy lineality C = dim L(C). Như vậy không gian thẳng của C là không gian con lớn nhất bị chứa trong reC. Ví dụ: Tập lồi C cho bởi C := {( x1 , x2 , x3 ) ∈ IR3 | x22 + x32 ≤ 1}. có linealityC = 1. Định lý 4.1 (Krein-Milman). Mọi tập lồi đóng khác rỗng, không chứa đường thẳng đều có điểm cực biên. Chứng minh. Giả sử C là tập lồi nói trong định lý. Ta chứng minh bằng quy nạp theo số chiều. Hiển nhiên định lý đúng khi số chiều của C là 0. Giả sử x ∈ C bất kỳ. Xét đường thẳng Γ := {y = x + λu} với u 6= 0. Do C đóng và không chứa đường thẳng, nên Γ cắt C tại một điểm biên của C, giả sử là z. Gọi H là siêu phẳng tựa của H tại z. Khi đó theo mệnh đề trên, F := H ∩ C là một diện của C và dimF < dimC. Hiển nhiên F là tập lồi, đóng và không chứa đường thẳng. Theo giả thiết qui nạp, F có điểm cực biên. Vì F là một diện của C, nên điểm cực biên của F cũng là điểm cực biên của C. 

4.2. Trường hợp tập lồi đa diện Mục này xét tập lồi đa diện là trường hợp thường gặp trong nhiều ứng dụng, ví dụ trong quy hoạch tuyến tính. Các diện của một tập lồi đa diện, như sẽ thấy dưới đây, có thể biểu diễn được

54

Nhập môn giải tích lồi ứng dụng

một cách tường minh, do đó việc sử dụng chúng trong tính toán dễ dàng hơn nhiều so với trường hợp tập lồi tổng quát. Nhắc lại rằng tập lồi đa diện (khúc lồi) là giao của một số hữu hạn các nửa không gian đóng. Như vậy một tập lồi đa diện D được cho như là tập nghiệm của một hệ bất phương trình tuyến tính. Tức là D := { x ∈ IRn | ha j , x i ≤ b j , j = 1, ..., m}.

(4.1)

Hoặc nếu ký hiệu A là ma trận có m hàng là các véc-tơ a j , ( j = 1, ..., m) và vectơ bT = (b1 , ..., bm ), thì hệ (4.1) viết được là: D = { x ∈ IRn | Ax ≤ b}.

(4.1a)

Chú ý rằng một đẳng thức có thể biểu diễn một cách tương đương qua hai bất đẳng thức, nên mọi tập được biểu diễn như là nghiệm của một hệ hữu hạn các bất đẳng thức hoặc/và các đẳng thức đều là một tập lồi đa diện. Đối với tập lồi đa diện cho bởi (4.1), ta có thể đặc trưng được các diện của nó như sau: Ký hiệu Im := {i | 1 ≤ i ≤ m} và I0 := {i ∈ Im | hai , x i = bi ∀ x ∈ D }. Hiển nhiên I0 có thể là một tập rỗng. Với mỗi tập chỉ số I thỏa mãn I0 ⊆ I ⊆ Im , ta đặt FI := { x | hai , x i = bi , i ∈ I, hai , x i ≤ bi , i ∈ Im \ I } và M I := { x | hai , x i = bi , i ∈ I }. Từ định nghĩa, thấy ngay FI ⊆ M I và do với mọi x ∈ D, mọi i ∈ I0 , ta có hai , x i = bi , nên D = FI0 .

55

4.2 Trường hợp tập lồi đa diện

Hiển nhiên nếu FI 6= ∅, thì nó là một tập lồi đa diện, còn M I là một đa tạp a-phin. Để đơn giản ký hiệu ta đặt M0 = M I0 . Mệnh đề 4.4. Giả sử FI 6= ∅. Khi đó affFI = M I và do đó dimFI = dimM I . Chứng minh. Do FI ⊆ M I và M I là tập a-phin, nên affFI ⊆ M I . Ta chỉ cần chỉ ra M I ⊆ affFI . Nếu I = Im thì theo định nghĩa của FI và M I , ta có FI = M I . Vậy ta chỉ cần xét trường hợp I 6= Im . Gọi I1 = Im \ I. Với mọi i ∈ I1 , tồn tại xi ∈ FI sao cho (ai )T xi < bi . Lấy x0 là trọng tâm của các điểm xi , tức là q

1 x = ∑ xi , q i =1 0

trong đó q là lực lượng (số phần tử) của tập chỉ số I1 . Vậy x0 ∈ M I , hai , x0 i < bi ∀i ∈ I1 . Suy ra x0 ∈ FI . Từ đây và do M I là tập a-phin, nên với mọi x ∈ M I và mọi λ > 0 đủ nhỏ ta có x0 + λ( x − x0 ) ∈ M I , hai , x0 + λ( x − x0 )i ≤ bi , ∀i ∈ I1 . Tức là với mọi λ > 0 đủ nhỏ, thì

hai , x0 + λ( x − x0 )i = bi , ∀i ∈ I, hai , x0 + λ( x − x0 )i ≤ bi , ∀i ∈ I1 . Vậy với λ > 0 đủ nhỏ, véc-tơ y := x0 + λ( x − x0 ) ∈ FI . Suy ra cả x0 và y đều thuộc FI , nên đường thẳng nối x0 và y thuộc affFI . Nói riêng x ∈ affFI , vì x nằm trên đường thẳng này. Do x là điểm bất

56

Nhập môn giải tích lồi ứng dụng

kỳ thuộc M I , nên suy ra M I ⊆ affFI . Kết hợp lại ta có M I = affFI .  Mệnh đề sau đây cho một đặc trưng về diện của một tập lồi đa diện. Mệnh đề 4.5. Giả sử D là tập lồi đa diện được cho bởi (4.1). Khi đó một tập F là một diện của D khi và chỉ khi nó có dạng

{ x | hai , x i = bi , i ∈ I, hai , x i ≤ bi , i 6∈ I }

(4.2)

với I0 ⊆ I ⊆ {1, ..., m}. Chứng minh. (i) Ta chỉ ra mọi tập F có dạng (4.2) đều là diện của D. Thật vậy, hiển nhiên F là lồi. Giả sử một đoạn [y, z] ⊂ D có một điểm trong (tương đối) x ∈ F. Ta có z = (1 − λ) x + λy với λ < 0. Vậy nếu hai , yi < bi với một i ∈ I, thì

hai , zi = (1 − λ)hai , x i + λhai , yi > (1 − λ)bi + λbi = bi . Mâu thuẩn với hai , zi ≤ bi , vì z ∈ D. Do đó hai , yi = bi với mọi i ∈ I. Hoàn toàn tương tự, có hai , zi = bi với mọi i ∈ I. Vậy cả y và z đều thuộc F. Chứng tỏ F là một diện của D. (ii) Ngược lại mọi diện F của D đều có dạng (4.2). Thật vậy, trước hết thấy rằng, nếu x0 là một điểm trong tương đối của F, thì diện nhỏ nhất chứa x0 là Fx0 = F0 . Ký hiệu F0 là tập cho bởi vế phải của (4.2), với I := {i |hai , x0 i = bi }. theo phần trên vừa chứng minh, F0 là một diện của D. Hiển nhiên F0 chứa x0 , nên Fx0 ⊆ F. Để chứng minh bao hàm thức ngược lại, ta lấy x ∈ F0 và y = x0 + λ( x0 − x ). Do

hai , x0 i = hai , x i = bi ∀i ∈ I, hai , x0 i < bi ∀i 6∈ I,

4.2 Trường hợp tập lồi đa diện

57

nên với mọi λ > 0 và đủ nhỏ, ta có

hai , yi = bi ∀i ∈ I, hai , yi < bi ∀i 6∈ I. Suy ra y ∈ F0 , và do đó [ x, y] ⊆ F0 ⊆ D. Nhưng do F là một diện của D và x0 là một điểm trong tương đối của đoạn [ x, y], nên cả đoạn [ x, y] ⊆ F. Nói riêng x ∈ F. Điều này đúng với mọi x ∈ F0 , nên F0 ⊆ F. Kết hợp lại có F0 = F.  Theo đại số tuyến tính, ta biết rằng, nếu hệ { ai | i ∈ I } có hạng là r, thì tập nghiệm của hệ phương trình tuyến tính x ∈ IRn , hai , x i = 0, i ∈ I (là một không gian con) có số chiều là (n − r ). Từ đây và Mệnh đề 4.4, 4.5 ta suy ra ngay hệ quả sau: Hệ quả 4.1. Cho FI = { x | hai , x i = bi , i ∈ I, hai , x i ≤ bi , i ∈ Im \ I } là một diện của D ⊂ IRn . Khi đó dimFI = n − rank{ ai | i ∈ I }. Nói riêng dimD = n − rank{ ai | i ∈ I0 }. Mệnh đề 4.6. Giả sử D được cho bởi (4.1). Khi đó: (i) Một điểm x0 là điểm cực biên của D khi và chỉ khi nó thỏa mãn chặt ít nhất n ràng buộc độc lập tuyến tính. (ii) Một đoạn thẳng (một nửa đường thẳng hay một đường thẳng) Γ ⊆ D là một cạnh của D khi và chỉ khi mọi điểm trên Γ thoả mãn chặt (n − 1) ràng buộc độc lập tuyến tính.

58

Nhập môn giải tích lồi ứng dụng

Chứng minh. Một điển cực biên là diện 0 thứ nguyên, một cạnh là diện 1 thứ nguyên. Các diện này đều có dạng (4.2). Vậy mệnh đề được suy ra ngay Hệ quả (4.1)  Nếu điểm cực biên (đỉnh) x0 của D thoả mãn chặt vừa đúng n ràng buộc độc lập tuyến tính, thì ta nói x0 là đỉnh không suy biến hoặc là không thoái hoá. Như vậy từ một đỉnh không suy biến của tập lồi đa diện D xuất phát vừa đúng n cạnh của D. Hướng của n cạnh này có thể tính được dựa theo kết quả sau: Mệnh đề 4.7. Từ một đỉnh không suy biến x0 của tập lồi đa diện D cho bởi (4.1) xuất phát vừa đúng n cạnh. Gọi I là tập hợp các bất đẳng thức mà x0 thoả mãn chặt. Khi đó mỗi k ∈ I ứng với một cạnh xuất phát từ x0 có hướng d được xác định bởi hệ phương trình tuyến tính sau:

(ak )T d = −1, (ai )T d = 0, i ∈ I \ {k}. Chứng minh. Gọi d là hướng của một cạnh của D xuất phát từ x0 . Mỗi điểm trên cạnh có hướng này đều có dạng x + λd, λ ≥ 0. Do tính không suy biến, các điểm này thoả mãn chặt đúng (n − 1) ràng buộc độc lập tuyến tính xác định tập D cho bởi (4.1). Vậy, theo cạnh thứ k, ta có:

(ak )T ( x0 + λd) < bk . Với các cạnh còn lại thì

(ai )T ( x0 + λd) = bi ∀i ∈ I \ {k}. Thế nhưng do x0 thoả mãn chặt đúng n ràng buộc này, nên

(ai )T x0 = bi ∀i ∈ I.

59

4.2 Trường hợp tập lồi đa diện Từ đây suy ra:

(ak )T d < ξ < 0, (ai )T d = 0 ∀i ∈ I \ {k}. Bằng cách thay đổi độ dài của hướng d, ta có thể viết

(ak )T d = −1, (ai )T d = 0 ∀i ∈ I \ {k}. Do các véc-tơ ai (i ∈ I ) độc lập tuyến tính, nên hệ phương trình tuyến tính trên có nghiệm duy nhất, nghiệm này cho ta hướng của một cạnh xuất phát từ x0 .  Trong nhiều trường hợp, ví dụ trong quy hoạch tuyến tính, ta thường làm việc với tập lồi đa diện có dạng sau (gọi là dạng chính tắc): { x ∈ IRn | Ax = b, x ≥ 0}, trong đó A là một ma trận cấp m × n, b ∈ IRm . Bằng cách bỏ đi các hàng phụ thuộc tuyến tính trong số các hàng của ma trận A, ta có thể giả sử rankA = m, và do đó m ≤ n. Mệnh đề 4.8. Giả sử D được cho ở dạng chính tắc và x0 ∈ D. Đặt J0 := { j| x0j > 0}. Điều kiện cần và đủ để x0 là đỉnh của D là các cột { a j | j ∈ J0 } của ma trận A độc lập tuyến tính. Chứng minh. Giả sử các cột A j với j ∈ J0 độc lập tuyến tính. Nếu x0 không phải là một đỉnh thì x0 = ty + (1 − t)z với y, z ∈ D, 0 < t < 1. Do x0j = 0 với mọi j 6∈ J0 và y j ≥ 0, z j ≥ 0, t > 0, nên y j = z j = 0 với mọi j 6∈ J0 . Vì y, z ∈ D, nên

∑ y j A j = b, ∑ z j A j = b. j∈ J0

j∈ J0

Do các véc-tơ A j , ( j ∈ J0 ) độc lập tuyến tính, nên chỉ có duy nhất một biểu diễn của b qua các véc-tơ này, nên y j = z j với mọi j ∈ J0 . Vậy y = z.

60

Nhập môn giải tích lồi ứng dụng Ngược lại, cho x0 là đỉnh của D và x0j = 0 với mọi j 6∈ J0 . Do

x0 ∈ D, nên

∑ x0j A j = b

j∈ J0

Nếu hệ A j với j ∈ J0 phụ thuộc tuyến tính, thì hệ thuần nhất

∑ xj Aj = 0 j∈ J0

có một nghiệm khác không. Với mọi t > 0 có:

∑ tx j A j = 0. j∈ J0

Cộng và trừ đẳng thức này với ∑ j∈ J0 x0j A j = b, ta được

∑ (x0j + tx j ) A j = b,

j∈ J0

∑ (x0j − tx j ) A j = b.

j∈ J0

Vậy với mọi t > 0 hệ ∑ j∈ J0 x j A j = b có hai nghiệm u = x0 + tx và v = x0 − tx Do x0j > 0 với j ∈ J0 , nên có thể chọn t > 0 đủ nhỏ để u j ≥ 0, v j ≥ 0 với mọi j ∈ J0 . Vậy cả u và v đều thuộc D. Rõ ràng x0 = (u + v)/2. Chửng tỏ x0 không phải là đỉnh của D.  Một diện F của D được gọi là một mặt của D, nếu dimF = dimD − 1. Theo Hệ quả (4.1), nếu F là một mặt của D, thì tồn tại chỉ số k 6∈ I0 sao cho F = { x ∈ D | h a k , x i = bk }.

(4.3)

Tuy nhiên không phải mọi tập có dạng này đều là một mặt của D. Ta nói một ràng buộc hak , x i ≤ bk trong biểu diễn (4.1) là thừa, nếu bỏ nó đi thì hệ (4.1) vẫn không thay đổi theo nghĩa là tập nghiệm của hệ

ha j , x i ≤ b j j = 1, ..., m, j 6= k trùng với tập nghiệm của hệ (4.1).

4.3 Định lý biểu diễn

61

Mệnh đề 4.9. Nếu k 6∈ I0 và hak , x i ≤ bk không phải là ràng buộc thừa, thì F = { x ∈ D | h a k , x i = bk } là một mặt của D. Chứng minh. Do hak , x i ≤ bk không là ràng buộc thừa, nên tồn tại y thoả mãn

hai , yi ≤ bi , i ∈ I0 , hai , yi < bi i 6∈ I0 , i 6= k, hak , yi > bk . Cho x0 ∈ D thoả mãn

hai , x0 i = bi , i ∈ I0 , hai , x0 i < bi i 6∈ I0 . Khi đó đoạn [ x0 , y] cắt siêu phẳng hak , x i = bk tại điểm z thoả mãn

hai , zi = bi , i ∈ ({ I0 ∪ {k}), hai , zi < bi i 6∈ ({ I0 ∪ {k}). Chứng tỏ diện F = { x | hai , x i = bi , i ∈ I0 , hak , x i = bk , hai , x i ≤ bi , i 6∈ I0 , } có thứ nguyên bằng dimD − 1.



4.3. Định lý biểu diễn Định lý biểu điễn dưới đây cho thấy rằng một tập lồi được hoàn toàn xác định bởi các điểm và hướng cực biên của nó. Ký hiệu V (C) là tập hợp các điểm cực biên và U (C) là tập hợp các hướng cực biên của C. Ta có định lý sau nói về sự biểu diễn của một tập lồi thông qua các điểm và hướng cực biên của nó.

62

Nhập môn giải tích lồi ứng dụng

Định lý 4.2 (Biểu diễn tập lồi). Nếu C là một tập lồi đóng không chứa trọn một đường thẳng nào thì C = coV (C) + coneU (C), tức là mọi điểm của C đều biểu diễn được như là tổng của một tổ hợp lồi của các đỉểm cực biên và tổ hợp không âm của các hướng cực biên của C. Chứng minh. Ta chứng minh bằng quy nạp theo số chiều. Hiển nhiên định lý đúng khi số chiều của C là 0 và 1. Giả sử x ∈ C bất kỳ. Xét tia Γ := {y = x + λu, λ ≥ 0} với u 6= 0 sao cho Γ cắt biên của C tại một điểm v. Vậy v = x + λu. Ta có hai trường hợp sau: a) Trường hợp u ∈ U (C). Do C lồi đóng và không chứa đường thẳng, nên tia này phải cắt C tại ít nhất một điểm v nào đó thuộc biên của C. Khi đó tồn tại một siêu phẳng tựa H của C tại v và tập F := H ∩ C là một diện của C và dimF < dimC. Hiển nhiên F lồi đóng và cũng không chứa đường thẳng. Theo giả thiết quy nạp ta có: v ∈ F = coV ( F) + coneU ( F) Do F là một diện của C, nên v ∈ F = coV ( F) + coneU ( F) ⊂ coV (C) + coneU (C) Do u ∈ U (C) và x = v + λu với λ ≥ 0, nên từ đây suy ra x = v + λu ∈ coV (C) + coneU (C) + coneU (C) = coV (C) + coneU (C). b) Trường hợp u 6∈ U (C) ( chú ý U (C) có thể bằng rỗng). Trong trường hợp này tia Γ có thể cắt biên của C tại hai điểm, nhưng định lý cũng được chứng minh hoàn toàn tương tự. 

63

4.4 Bài tập

4.4. Bài tập I 4.1. a) Hãy xác định tập điểm cực biên và tập hướng cực biên của các bài tập cho ở bài tập 11. b) Cho tập C := {( x, y) ∈ IR2 |, x + y ≤ 1}. Hãy xác định tập hợp các điểm cực biên và hướng cực biên của C. Mọi điểm thuộc C có thể biểu diễn như là tổ hợp lồi của các điểm cực biên và hướng cực biên không?

I 4.2. Hãy xác định các diện của các tập sau: a) C := {( x1 , x2 )| x1 + x2 ≤ 1}, b) C := {( x1 , x2 , x3 )| x12 + x22 + x32 = 1}.

I 4.3. Cho C ⊂ IRn lồi khác rỗng và F là một mặt của C. Chứng minh rằng: (i) Nếu D ⊂ C và F ∩ riC 6= ∅, thì D ⊂ F. (ii) Nếu F là một diện không tầm thường của C, thì F ⊂ C \ riC và dimF < dimC.

I 4.4. Cho a ∈ D, giao của tất cả các diện của D chứa a được gọi là diện nhỏ nhất của D chứa a. Ta ký hiệu diện nhỏ nhất chứa a là Fa . Chứng minh rằng F = Fa khi và chỉ khi a ∈ riF. I 4.5. Cho D := { x ∈ IRn | hai , x i ≤ bi , i = 1, ., m}. Giả sử tồn tại x0 thoả mãn hai , x0 i < bi , i = 1, ., m. Chứng tỏ rằng dimD = n.

I 4.6. Giả sử D := { x ∈ IRn | Ax = b, x ≥ 0},

64

Nhập môn giải tích lồi ứng dụng

trong đó A là một ma trận cấp m × n, rankA = m và b ∈ IRm . Chứng minh rằng một véc-tơ x là một đỉnh của D khi và chỉ khi A phân tích đuợc dưới dạng [ B, N ] và x = [ x B x N ] = [ B−1 b, 0] trong đó B là ma trận khả nghịch cấp m × m và B−1 b ≥ 0. Chỉ dẫn. Chuyển vị trí các cột của ma trận A sao cho A = [ B, N ] với B là ma trận khả nghịch cấp m × m, còn N là ma trận cấp m × (n − m). Phân tích x = [ x B , x N ], trong đó x B ứng với B và x N ứng với N. Khi đó tập lồi đa diện { x ∈ IRn | Ax = b, x ≥ 0} được biểu diễn là Bx B + Nxn = b, x B ≥ 0, x N ≥ 0. Điều kiện đủ. Giả sử A được phân tích dưới dạng [ B, N ] với ≥ 0. Ta có

B −1 b

Ax = Bx B + Nx N = BB−1 b + N0 = b. Vậy x = [ x B x N ] ∈ D. Giả sử x = λu + (1 − λ)v với u, v ∈ D và λ ∈ (0, 1). Ta viết u = [u1 , u2 ], v = [v1 , v2 ]. Vậy

[ B−1 b, 0] = λ[u1 , u2 ] + (1 − λ[v1 , v2 ]. Từ đây suy ra u1 = v2 = 0 và u2 = v2 = B−1 b. Chứng tỏ x là một điểm cực biên của D.

I 4.7. Một điểm x ∈ C được gọi là điểm cực biên lộ (expose) nếu tồn tại một siêu phẳng H tựa của C thoả mãn C ∩ H = { x }. Chứng tỏ rằng mọi điểm cực biên lộ đều là cực biên. Hãy tìm ví dụ về một điểm cực biên của một tập lồi nhưng không là điểm cực biên lộ.

I 4.8. Chứng tỏ rằng mọi diện của một tập lồi đa diện D đều có dạng H ∩ D, trong đó H là một siêu phẳng tựa của D. Nếu D là

4.4 Bài tập

65

tập lồi đóng, không phải là tập lồi đa diện, thì điều khẳng định trên có đúng không?

I 4.9. Chứng tỏ rằng một tập lồi đa diện khác rỗng luôn tồn tại mặt. Trong trường hợp tập lồi không phải là đa diện, điều khẳng định trên có còn đúng không? Cho ví dụ.

66

Nhập môn giải tích lồi ứng dụng

Chương 5 PHÉP CHIẾU VUÔNG GÓC VÀ XẤP XỈ TUYẾN TÍNH TẬP LỒI

5.1. Toán tử chiếu và bất đẳng thức biến phân . . . .

68

5.2. Xấp xỉ tập lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

76

5.3. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

78

Chương này đề cập đến hai vấn đề quan trọng trong giải tích lồi. Đó là phép chiếu vuông góc (còn gọi là phép chiếu Euclidean) xuống một tập lồi đóng và xấp xỉ tuyến tính của tập lồi. Bài toán tìm hình chiếu xuống một tập lồi có vai trò rất quan trọng trong tối ưu và nhiều lĩnh vực khác như bất đẳng thức biến phân, cân bằng, xấp xỉ v.v... Bài toán này có rất nhiều ứng dụng, đặc biệt nó xuất hiện như một bài toán phụ trong rất nhiều phương pháp số trong tối ưu, bất đẳng thức biến phân và cân bằng. Đây cũng là một công cụ sắc bén và khá đơn giản để chứng minh nhiều định lý quan trọng như định lý tách, các định lý về sự tồn tại nghiệm của nhiều vấn đề khác nhau trong toán học ứng dụng. Những cách chứng minh dựa trên phép chiếu vuông góc thường mang tính chất kiến thiết.

68

Nhập môn giải tích lồi ứng dụng

Trong chương này, ta sẽ xét ứng dụng của phép chiếu vuông góc vào bài toán bất đẳng thức biến phân và vào việc xấp xỉ tuyến tính của tập lồi. Tập lồi tuy đã có những tính chất khá tiện lợi, nhưng nói chung so với các tập lồi đa diện vẫn còn khó xử lý hơn nhiều. Do đó việc xấp xỉ tập lồi bởi các tập lồi đa diện rất có ý nghĩa khi nghiên cứu các tập lồi và đặc biệt khi xây dựng các phương pháp giải các bài toán liên quan đến tập lồi. Trong toán phổ thông, khi tính chu vi và diện tích hình tròn, chúng ta đã sử dụng đến việc xấp xỉ hình tròn bởi các đa giác. Ta sẽ chỉ ra rằng, với những giả thiết rất hợp lý, một tập lồi có thể xấp xỉ với độ chính xác tuỳ ý bởi các tập lồi đa diện.

5.1. Toán tử chiếu và bất đẳng thức biến phân Trong mục này ta sẽ chứng minh sự tồn tại và tính duy nhất của hình chiếu xuống một tập lồi đóng. Tiếp đến sẽ khảo sát một số tính chất cơ bản của toán tử chiếu. Cuối mục sẽ trình bày việc xử dụng toán tử chiếu để chứng minh sự tồn tại nghiệm cũng như vai trò của toán tử này trong một thuật toán giải bất đẳng thức biến phân. Định nghĩa 5.1. Cho C 6= ∅ (không nhất thiết lồi) và y là một véc-tơ bất kỳ, đặt dC (y) := inf || x − y||. x∈C

Ta nói dC (y) là khoảng cách từ y đến C. Nếu tồn tại π ∈ C sao cho dC (y) = ||π − y||, thì ta nói π là hình chiếu (vuông góc) của y trên C . Theo định nghĩa, ta thấy rằng hình chiếu pC (y) của y trên C

5.1 Toán tử chiếu và bất đẳng thức biến phân

69

sẽ là nghiệm của bài toán tối ưu 1 min{ || x − y||2 | x ∈ C}. x 2 Nói cách khác việc tìm hình chiếu của y trên C có thể đưa về việc tìm cực tiểu của hàm toàn phương || x − y||2 trên C. Như thường lệ, sẽ ký hiệu π = pC (y), hoặc đơn giản hơn là p(y) nếu không cần nhấn mạnh đến tập chiếu C. Chú ý rằng, nếu C 6= ∅, thì dC (y) hữu hạn, vì 0 ≤ dC (y) ≤ ||y − x || với mọi x ∈ C. Cho C ⊆ IRn , x0 ∈ C. Nhớ lại là nón pháp tuyến (ngoài) của tập C tại x0 là tập hợp NC ( x0 ) := {w| w T ( x − x0 ) ≤ 0 ∀ x ∈ C}. y

P(y)

C

Hình 5.1: Hình chiếu vuông góc Mệnh đề 5.1. Cho C là một tập lồi đóng khác rỗng. Khi đó: (i) Với mọi y ∈ IRn , π ∈ C hai tính chất sau là tương đương: a) π = pC (y), b) y − π ∈ NC (π ).

70

Nhập môn giải tích lồi ứng dụng

(ii) Với mọi y ∈ IRn , hình chiếu pC (y) của y trên C luôn tồn tại và duy nhất. (iii) Nếu y 6∈ C, thì h pC (y) − y, x − pC (y)i = 0 là siêu phẳng tựa của C tại pC (y) và tách hẳn y khỏi C, tức là

h pC (y) − y, x − pC (y)i ≥ 0, ∀ x ∈ C, và

h pC (y) − y, y − pC (y)i < 0. (iv) Anh xạ y ,→ pC (y) có các tính chất sau: a) || pC ( x ) − pC (y)|| ≤ || x − y|| ∀ x, ∀y. (tính không giãn), b) h pC ( x ) − pC (y), x − yi ≥ || pC ( x ) − pC (y)||2 , (tính đồng bức). Chứng minh. (i) Giả sử có a). Lấy x ∈ C và λ ∈ (0, 1). Đặt xλ := λx + (1 − λ)π. Do x, π ∈ C và C lồi, nên xλ ∈ C. Hơn nữa do π là hình chiếu của y, nên ||π − y|| ≤ ||y − xλ ||. Hay

||π − y||2 ≤ ||λ( x − π ) + (π − y)||2 . Khai triển vế phải, ước lược và chia hai vế cho λ > 0 , ta có λ|| x − π ||2 + 2h x − π, π − yi ≥ 0. Điều này đúng với mọi x ∈ C và λ ∈ (0, 1). Do đó khi cho λ tiến đến 0, ta được hπ − y, x − π i ≥ 0 ∀ x ∈ C. Vậy y − π ∈ NC (π ). Bây giờ giả sử có b). Với mọi x ∈ C, có 0 ≥ (y − π ) T ( x − π ) = (y − π ) T ( x − y + y − π )

5.1 Toán tử chiếu và bất đẳng thức biến phân

71

\= ||y − π ||2 + (y − π )T ( x − y). Từ đây và b), dùng bất đẳng thức Cauchy-Schwarz ta có:

||y − π ||2 ≤ (y − π )T (y − x ) ≤ ||y − π )||||y − x ||. Suy ra ||y − π || ≤ ||y − x || ∀ x ∈ C, và do đó π = p(y). (ii) Do dC (y) = infx∈C || x − y||, nên theo định nghĩa của cận dưới đúng (infimum), tồn tại một dãy x k ∈ C sao cho lim || x k − y|| = dC (y) < +∞. k

Vậy dãy { x k } bị chặn, do đó nó có một dãy con { x kj } hội tụ đến một điểm π nào đó. Do C đóng, nên π ∈ C. Vậy

||π − y|| = lim || x kj − y|| = lim || x k − y|| = dC (y). j

k

Chứng tỏ π là hình chiếu của y trên C. Bây giờ ta chỉ ra tính duy nhất của hình chiếu. Thật vậy, nếu tồn tại hai điểm π và π 1 đều là hình chiếu của y trên C, thì y − π ∈ NC (π ), y − π 1 ∈ NC (π 1 ). Tức là

hπ − y, π 1 − π i ≥ 0 và

hπ 1 − y, π − π 1 i ≥ 0. Cộng hai bất đẳng thức này ta suy ra ||π − π 1 || ≤ 0, và do đó π = π1 . (iii) Do y − π ∈ NC (π ), nên

hπ − y, x − π i ≥ 0 ∀ x ∈ C.

72

Nhập môn giải tích lồi ứng dụng

Vậy hπ − y, x i = hπ − y, π i là một siêu phẳng tựa của C tại π. Siêu phẳng này tách y khỏi C vì y 6= π, nên

hπ − y, y − π i = −||π − y||2 < 0. (iv) Theo phần (ii) ánh xạ x ,→ p( x ) xác định khắp nơi. Do z − p(z) ∈ NC ( p(z)) với mọi z, nên áp dụng với z = x và z = y, ta có: h x − p( x ), p(y) − p( x )i ≤ 0 và

hy − p(y), p( x ) − p(y)i ≤ 0. Cộng hai bất đẳng thức lại sẽ được

h p(y) − p( x ), p(y) − p( x ) + x − yi ≤ 0. Từ đây và theo bất đẳng thức Cauchy-Schwarz, suy ra

|| p( x ) − p(y)|| ≤ || x − y||. Để chứng minh tính đồng bức, áp dụng tính chất b) của (i), lần lượt với p( x ) và p(y), ta có:

h p( x ) − x, p( x ) − p(y)i ≤ 0. hy − p(y), p( x ) − p(y)i ≤ 0. Cộng hai bất đẳng thức ta được

h p( x ) − p(y) + y − x, p( x ) − p(y)i = h p( x ) − p(y), y − x i + || p( x − p(y||2 ≤ 0. Chuyển vế ta có

h p( x ) − p(y), x − yi ≥ || p( x ) − p(y)||2 .

5.1 Toán tử chiếu và bất đẳng thức biến phân

73

Đây chính là tính đồng bức cần được chứng minh



Chú ý. Thực ra phép chiếu vuông góc còn có một tính chất mạnh hơn tính không giãn nêu ở trên. Cụ thể ta có (xem bài tập 33)

|| p( x ) − p(y)||2 ≤ || x − y||2 − || p( x ) − p(y) − x + y||2 ∀ x, y. Trong nhiều ứng dụng thường gặp, tập chiếu có những tính chất đặc biệt: ví dụ nó là một không gian con, siêu hộp, hình cầu, hay đơn hình v.v....Trong các trường hợp riêng này điểm chiếu có thể tính được một cách tường minh (xem các bài tập 32, 35, 36). Hãy xét một ứng dụng của phép chiếu vuông góc trong bài toán bất đẳng thức biến phân sau: Cho C là một tập lồi đóng khác rỗng trong IRn và F : C → Rn . Xét bài toán bất đẳng thức biến phân:  Tìm x ∗ ∈ C, (V IP) sao cho h F( x ∗ ), x − x ∗ i ≥ 0 ∀ x ∈ C. Nhiều bài toán trong tối ưu hoá, phương trình vật lý toán và nhiều vấn đề trong kinh tế, kỹ thuật, cân bằng giao thông đô thị v.v... đều có thể mô tả dưới dạng bài toán (VIP). Sự tồn tại nghiệm và phương pháp giải bài toán (VIP) có thể dựa vào phép chiếu vuông góc. Cụ thể ta có các kết quả sau: Mệnh đề 5.2. Giả sử α > 0. Với mỗi x ∈ C, đặt  1 h( x ) := pC x − F( x ) . α ∗ ∗ ∗ Khi đó x = h( x ) khi và chỉ khi x là nghiệm của (VIP). Chứng minh. Theo tính chất của phép chiếu, h là ánh xạ đơn trị từ C vào C. Do (i) trong Mệnh đề 5.1,  1 x ∗ = h( x ∗ ) = pC x ∗ − F( x ∗ ) α

74

Nhập môn giải tích lồi ứng dụng

khi và chỉ khi 1 h x ∗ − x ∗ + F( x ∗ ), x − x ∗ i ≥ 0 ∀ x ∈ C. α Bất đẳng thức cuối đúng khi và chỉ khi h F( x ∗ ), x − x ∗ i ≥ 0 ∀ x ∈ C.  Hệ quả 5.1. Nếu C là tập lồi, compắc và F liên tục trên C, thì bài toán bất đẳng thức biến phân (VIP) có nghiệm. Chứng minh. Do phép chiếu lên tập lồi đóng là liên tục và do F liên tục trên tập C, nên h là ánh xạ liên tục trên tập C, vì nó là hợp của hai ánh xạ liên tục. Do h là ánh xạ liên tục từ C vào C, nên theo định lý điểm bất động Brouwer h tồn tại điểm bất động, Theo mệnh đề trên điểm bất động này là nghiệm của (VIP).  Theo mệnh đề trên việc giải bài toán (VIP) có thể chuyển về việc tìm điểm bất động của ánh xạ h. Do ánh xạ chiếu không giãn, nên h là một ánh xạ không giãn, vì vậy có thể mở rộng nguyên lý ánh xạ co Banach để tìm một điểm bất động của ánh xạ này. Trong một số trường hợp riêng quan trọng h là một ánh xạ co. Khi đó nguyên lý ánh xạ Banach có thể áp dụng trực tiếp để giải (VIP). Dưới đây ta sẽ xét trường hợp này. Ta cần đến định nghĩa sau Định nghĩa 5.2. Một ánh xạ F : C → IRn được gọi là đơn điệu trên C, nếu h F( x ) − F(y), x − yi ≥ 0 ∀ x, y ∈ C. Anh xạ F được gọi là đơn điệu mạnh trên C với hệ số β > 0, nếu

h F( x ) − F(y), x − yi ≥ β|| x − y||2 ∀ x, y ∈ C. Ví dụ về ánh xạ đơn điệu. Cho F( x ) = Qx. Dùng trực tiếp định nghĩa, ta thấy F là đơn điệu trên toàn không gian khi Q là ma

5.1 Toán tử chiếu và bất đẳng thức biến phân

75

trận vuông, đối xứng, nửa xác định dương. Nếu Q là đối xứng, xác định dương, thì F đơn điệu mạnh. Một cách tổng quát, sau này ta sẽ thấy, đạo hàm của một hàm lồi (lồi mạnh) là đơn điệu (đơn điệu mạnh) trên C (xem bài tập 37 Phần 2). Khi F là ánh xạ đơn điệu mạnh và liên tục Lipschitz trên C thì có thể chọn α thích hợp để h là ánh xạ co trên C. Cụ thể ta có mệnh đề sau: Mệnh đề 5.3. Giả sử C là tập lồi đóng và ánh xạ F : C → IRn đơn điệu mạnh trên C với hệ số β và Lipschitz trên C với hằng số L. Khi đó L2 . thì nếu α > 2β  1 h( x ) := pC x − F( x ) α là ánh xạ co trên C với hệ số co r δ=

1−

2β L2 + 2. α α

Chứng minh. Do tính không giãn của phép chiếu, nên 1 1 ||h( x ) − h(y)||2 ≤ || x − F( x ) − (y − F(y))||2 α α 2 1 = || x − y||2 − h x − y, F( x ) − F(y)i + 2 || F( x ) − F(y)||2 . α α Do F là đơn điệu mạnh với hệ số β và Lipschitz với hằng số L, nên h x − y, F( x ) − F(y)i ≥ β|| x − y||2 và

|| F( x ) − F(y)||2 ≤ L2 || x − y||2 . Từ đây suy ra

||h( x ) − h(y)||2 ≤ || x − y||2 +

2β L2 || x − y||2 − || x − y||2 2 α α

76

Nhập môn giải tích lồi ứng dụng

\= (1 +

L2 2β − )|| x − y||2 . α2 α

Vậy h là ánh xạ co khi α >

L2 2β .



Từ mệnh đề này ta suy ra ngay hệ quả sau: Hệ quả 5.2. Nếu C lồi, đóng, còn ánh xạ F đơn điệu mạnh và Lipschitz trên C, thì bài toán (VIP) luôn có duy nhất nghiệm.

5.2. Xấp xỉ tập lồi Việc xấp xỉ tập lồi bởi các tập lồi đa diện được xác định bởi các siêu phẳng tựa là nội dung chủ yếu của mục này. Ta sẽ thấy dưới đây rằng một tập lồi có thể xấp xỉ với độ chính xác tuỳ ý bởi các tập lồi đa diện được xác định bởi các siêu phẳng tựa của nó. Cho x0 ∈ C. Nhớ lại rằng aT x = α là siêu phẳng tựa của C tại x0 , nếu aT x0 = α, aT x ≥ α ∀ x ∈ C. Mệnh đề 5.4. Cho C là một tập lồi khác rỗng và x0 6∈ riC. Khi đó tồn tại siêu phẳng tựa của C tại hình chiếu của x0 trên C. Chứng minh. Gọi hình chiếu của x0 trên C là p( x0 ). Trước hết xét trường hợp intC 6= ∅. Vậy x0 6∈ intC. Phân biệt hai trường hợp: a) x0 6∈ C. Do C lồi, đóng, nên theo (iii) của Mệnh đề 5.1. siêu phẳng h p( x0 ) − x0 , x i = h p( x0 ) − x0 , p( x0 )i là siêu phẳng tựa của C tại p( x0 ) và tách hẳn C và x0 . b) x0 ∈ C. Khi đó do x0 6∈ intC, nên x0 ∈ IRn \ C. Vậy tồn tại dãy x k → x0 với x k 6∈ C với mọi k. Do C lồi, đóng, nên lại áp dụng

77

5.2 Xấp xỉ tập lồi

(iii) của Mệnh đề 5.1, tồn tại siêu phẳng tựa của C tại p( x k ). Tức là tồn tại π k 6= 0, thoả mãn:

hπ k , x i ≤ hπ k , p( x k )i ∀ x ∈ C. Bằng cách chuẩn hoá π k , ta có thể coi ||π k || = 1, và do đó có thể giả sử π k → π 0 . Do ánh xạ chiếu liên tục, nên từ bất đẳng thức trên, qua giới hạn và chú ý là p( x0 ) = x0 (vì x0 ∈ C), ta có:

hπ 0 , x i ≤ hπ 0 , p( x0 )i = hπ 0 , x0 i ∀ x ∈ C. Vậy hπ 0 , x i = hπ 0 , x0 i là siêu phẳng tựa của C tại x0 . Trong trường hợp intC = ∅, thì dimC < n. Vậy C bị chứa trong một siêu phẳng H chứa affC. Gọi w là véc-tơ pháp tuyến của H. Khi đó tồn tại số thực α sao cho H = { x ∈ IRn |w T x = α}. Do C ⊆ C ⊆ H, nên suy ra H là siêu phẳng tựa của cả C và C.  Định lý 5.1 (xấp xỉ tuyến tính tập lồi). Mọi tập lồi đóng khác rỗng và không trùng với toàn bộ không gian đều là giao của tất cả các nửa không gian tựa của nó. Chứng minh. Gọi C là tập lồi đóng khác rỗng và E là giao của tất cả các nửa không gian tựa của C. Do C không trùng với toàn bộ không gian, nên theo mệnh đề trên, C có nửa không gian tựa. Vậy E tồn tại duy nhất. Do mọi nửa không gian tựa của C chứa C, nên C ⊆ E. Giả sử ngược lại E 6= C, khi đó tồn tại y0 ∈ E \ C. Gọi x0 là hình chiếu của y0 trên C, theo (ii) của Mệnh đề 5.1, ta có

h x0 − y0 , x − x0 i ≥ 0 ∀ x ∈ C. Vậy H := { x | h x0 − y0 , x i ≥ h x0 − y0 , x0 i} là nửa không gian tựa của C. Thế nhưng nửa không gian này không chứa y0 , vì

h x0 − y0 , y0 − x0 i = −|| x0 − y0 ||2 < 0.

78

Nhập môn giải tích lồi ứng dụng

Mâu thuẫn với việc y0 ∈ E.



Một số ứng dụng khác của phép chiếu trong việc chứng minh định lý tách các tập lồi, tính dưới vi phân và trong bài toán cân bằng sẽ được xét ở các chương sau.

5.3. Bài tập I 5.1. Cho C là một tập lồi đóng. Chứng minh rằng: (i) Với mọi x ∈ C, tập NC ( x ) là một nón lồi đóng. (ii)

pC ( x ) = ( I + NC )−1 ( x ) ∀ x,

trong đó pC là phép chiếu vuông góc xuống tập C.

I 5.2. Cho H là một không gian con trong IRn và p(.) là ánh xạ chiếu. Chứng minh rằng (i) x − p( x ) ∈ H T với mọi x, trong đó H T là không gian con vuông góc với H; (ii) || p( x )|| ≤ || x || với mọi x (iii) h p( x ), yi = h p(y), x i ∀ x, ∀y.

I 5.3. Giả sử S ⊂ IRn là một đơn hình được cho bởi n

S := { x T = ( x1 , ..., xn ) ∈ IRn | x ≥ 0, ∑ x j = α} j =1

trong đó α > 0 Cho x0 ∈ IRn . Hãy tính hình chiếu của x0 trên tập S.

I 5.4. Cho C := {( x1 , x2 , x3 )| x12 + x22 + x32 ≤ 1, x12 − x2 ≤ 0}

5.3 Bài tập

79

và y T = (1, 0, 2). Hãy tính khoảng cách dC (y) và hình chiếu π (y) của y trên C.

I 5.5. Cho E là một tập com-pắc khác rỗng và H là một siêu phẳng bất kỳ. Chứng minh rằng E có một siêu phẳng tựa song song với H. I 5.6. Tính hình chiếu của một điểm y lên hình cầu đóng tâm x0 , bán kính r và lên siêu hộp H := { x | a ≤ x ≤ b}, trong đó a, b ∈ IRn . I 5.7. Cho A là một ma trận cấp m × n có hạng là m. Chứng minh rằng hình chiếu của một điểm y lên không gian con C := { x | Ax = 0} là điểm y − AT ( AAT )−1 Ay. Tìm toán tử chiếu lên không gian trực giao của không gian con C. I 5.8. Cho C ⊆ IRn là một tập lồi đóng khác rỗng và M là một ma trận thực đối xứng cấp n × n xác định dương. Chứng minh rằng với mọi y, đều tồn tại duy nhất π ∈ C thoả mãn (y − π )T M(y − π ) ≤ (y − x )T M(y − x ) ∀ x ∈ C. Chỉ dẫn. Điểm π là hình chiếu của y trên C theo chuẩn xác định bởi M.

80

Nhập môn giải tích lồi ứng dụng

Chương 6 ĐỊNH LÝ TÁCH CÁC TẬP LỒI

6.1. Các định lý tách và bổ đề Farkas . . . . . . . . . . . . . . 6.2. Mở rộng và ứng dụng . . . . . . . . . . . . . . . . . . . . . . . . . 6.3. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

82 88 91

Trong giải tích lồi và nhiều lĩnh vực khác như giải tích hàm, giải tích không trơn và giải tích phi tuyến v.v... các định lý tách hai tập lồi có một vai trò trung tâm. Về bản chất, định lý tách trả lời câu hỏi rằng một phần tử có thuộc một tập lồi không, và nếu không thuộc thì nó sẽ có tính chất gì? Đây là câu hỏi về liên thuộc (membership), một vấn đề cơ bản của toán học. Ta có thể hình dung tập lồi đó là tập hợp nghiệm của một hệ phương trình đại số, hay vi, tích phân, tập các điểm bất động của một ánh xạ, hay là tập nghiệm của một bài toán tối ưu v.v.... Dĩ nhiên nếu câu trả lời là có, thì vấn đề liên thuộc đã được giải quyết. Trái lại, nếu câu trả lời là không, thì sẽ xảy ra điều gì? Điều này giải thích vì sao các định lý tách thuộc loại các định lý chọn và là công cụ rất mạnh, thường được dùng để chứng minh sự tồn tại của một đối tượng trong nhiều vấn đề thuộc những lĩnh vực rất khác nhau. Người ta đã chứng minh được sự tương đương giữa định lý tách

82

Nhập môn giải tích lồi ứng dụng

và định lý Hahn-Banach rất quen thuộc trong giải tích hàm. Sự mở rộng các định lý tách và những ứng dụng đa dạng của chúng từ lý thuyết đến các vấn đề thực tế (chẩn đoán u lành, u ác trong y học, hoặc dự đoán sự thành bại, phát triển của các doanh nghiệp v..v...) hiện vẫn là một đề tài nghiên cứu thu hút sự quan tâm của nhiều người.

6.1. Các định lý tách và bổ đề Farkas Định nghĩa 6.1. Cho hai tập C và D khác rỗng, ta nói siêu phẳng aT x = α tách C và D nếu aT x ≤ α ≤ aT y, ∀ x ∈ C, ∀y ∈ D.

(6.1)

Ta nói siêu phẳng aT x = α tách chặt C và D nếu aT x < α < aT y, ∀ x ∈ C, ∀y ∈ D. Ta nói siêu phẳng aT x = α tách mạnh C và D nếu sup aT x < α < inf aT y. x∈C

y∈ D

(6.2)

Định lý 6.1 (Định lý tách 1). Cho C và D là hai tập lồi khác rỗng trong IRn sao cho C ∩ D = ∅. Khi đó có một siêu phẳng tách C và D. Định lý tách vừa nêu có thể suy ra ngay từ Bổ đề 6.1 dưới đây, chính là định lý tách một tập lồi và một phần tử không thuộc nó. Bổ đề 6.1 (Bổ đề liên thuộc). Cho C ⊂ IRn là một tập lồi khác rỗng. Giả sử x0 6∈ C. Khi đó tồn tại t ∈ IRn , t 6= 0 thoả mãn

ht, x i ≥ ht, x0 i ∀ x ∈ C.

(6.3)

6.1 Các định lý tách và bổ đề Farkas

83

Chứng minh. Do x0 6∈ riC, nên sự tồn tại siêu phẳng tách trong bổ đề, được suy ra từ Mệnh đề 5.4.  Chứng minh Định lý 6.1. Do C và D là lồi, nên C − D cũng lồi. Hơn nữa 0 6∈ (C − D ), vì C ∩ D = ∅. Theo bổ đề trên áp dụng với x0 = 0, tồn tại véc-tơ t ∈ IRn , t 6= 0 sao cho ht, zi ≥ 0 với mọi z ∈ C − D. Vì z = x − y với x ∈ C, y ∈ D, nên ta có

ht, x i ≥ ht, yi ∀ x ∈ C, y ∈ D. Lấy α := supht, yi, y∈ D

khi đó siêu phẳng ht, x i = α tách C và D.



Chú ý. Chứng minh bổ đề liên thuộc ở trên gợi ý cho việc xác định siêu phẳng tách. Theo chứng minh Mệnh đề 5.4, việc xác định siêu phẳng tách điểm x0 và tập C chính là việc tìm điểm chiếu của x0 trên C. Điểm này chính là nghiệm của bài toán min{|| x − x0 ||2 | x ∈ C }. Do phạm vi sử dụng rộng rãi và vai trò quan trọng của định lý tách trong nhiều lĩnh vực của toán học, nên việc tìm các phương pháp giải cho bài toán tối ưu này luôn là một đề tài rất được quan tâm. Trong nhiều trường hợp riêng của tập C, bài toán trên đã có những phương pháp giải hiệu quả. Tuy nhiên trong trường hợp chung, đây vẫn còn là một bài toán rất khó giải. Định lý sau đây nói về việc tách mạnh hai tập lồi: Định lý 6.2 (Định lý tách 2). Cho C và D là hai tập lồi đóng khác rỗng sao cho C ∩ D = ∅ . Giả sử có ít nhất một tập là com-pắc. Khi đó hai tập này có thể tách mạnh được bởi một siêu phẳng. Cũng như trên, định lý tách mạnh được dễ dàng suy ra từ bổ đề sau nói về sự tách mạnh giữa một tập lồi đóng và một điểm bên ngoài tập này.

84

Nhập môn giải tích lồi ứng dụng

Bổ đề 6.2. Cho C ⊂ IRn là một tập lồi đóng khác rỗng sao cho 0 6∈ C. Khi đó tồn tại một véc-tơ t ∈ IRn , t 6= 0 và α > 0 sao cho

ht, x i ≥ α > 0, ∀ x ∈ C. Theo bổ đề này, thì C và điểm gốc toạ độ có thể tách mạnh, ví dụ bởi siêu phẳng ht, x i = α2 . Chứng minh bổ đề. Do C đóng và 0 6∈ C, nên tồn tại quả cầu B tâm ở gốc, bán kính r > 0 sao cho C ∩ B = ∅. Ap dụng định lý tách 1 cho hai tập C và B, ta có t ∈ IRn \ {0} và α ∈ IR, sao cho

ht, x i ≥ α ≥ ht, yi ∀ x ∈ C, ∀y ∈ B. Bằng cách chuẩn hóa ta có thể xem ||t|| = 1 và do đó khoảng cách từ gốc đến siêu phẳng ít nhất là bằng α ≥ r. Vậy thì

ht, x i ≥ α ≥ r > 0.  Chững minh Định lý 6.2. Giả sử C là tập compact. Ta chỉ ra tập C − D đóng. Thật vậy, giả sử zk ∈ C − D và zk → z. Ta có zk = x k − yk với x k ∈ C, yk ∈ D. Vì C compact, nên có một dãy con x k j → x khi j → +∞. Vậy yk j = zk j − x k j → z − x ∈ D. Vậy z = x − y ∈ C − D. Chứng tỏ C − D là tập đóng. Do 0 6∈ C − D, nên theo bổ đề trên, tồn tại t 6= 0, sao cho ht, x − yi ≥ α > 0 với mọi x ∈ C, y ∈ D. Vậy inf ht, x i −

x∈C

α α ≥ supht, yi + . 2 2 y∈ D

Chứng tỏ C và D có thể tách mạnh.

.

Chú ý. Điều kiện một trong hai tập là com-pắc trong định lý là không thể bỏ được. Hãy xét ví dụ trong đó C := {( x, t) ∈ IR2 | x ≥ 0, t = 0}, D := {( x, t) ∈ IR2 | t ≥

1 , t > 0, x > 0}. x

6.1 Các định lý tách và bổ đề Farkas

85

D

O

C Hình 6.1: Tách nhưng không tách mạnh

Rõ ràng hai tập này lồi, đóng không có điểm chung, nhưng chúng không thể tách mạnh được. Từ định nghĩa ta thấy rằng, nếu hai tập nằm trong cùng một siêu phẳng, thì chúng vẫn tách được, ví dụ chính bằng siêu phẳng đó. Để loại bỏ trường hợp cực đoan này, người ta đưa ra khái niệm tách đúng sau: Ta nói hai tập C và D được tách đúng bởi siêu phẳng aT x = α nếu (6.1) thỏa mãn và cả hai tập này không cùng nằm trọn trong siêu phẳng tách. Chú ý rằng nếu A và B là hai tập lồi mà riA ∩ riB 6= ∅, thì hai tập này vẫn có thể tách được, ví dụ A và B là hai đường chéo của một hình chữ nhật trong mặt phẳng 2 chiều. Tuy nhiên chúng không thể tách đúng, theo mênh đề sau đây: Mệnh đề 6.1. Cho hai tập lồi khác rỗng A và B. Điều kiện cần và đủ để hai tập này tách đúng được là riA ∩ riB = ∅. Chứng minh. Trước hết chứng minh điều kiện đủ. Giả sử

86

Nhập môn giải tích lồi ứng dụng

riA ∩ riB = ∅. Khi đó 0 6∈ (riA − riB) = ri( A − B). Xét hai trường hợp: 1. Trường hợp int( A − B) 6= ∅. Khi đó 0 6∈ int( A − B). Vậy tồn tại t 6= 0 và tT x < tT y với mọi x ∈ intA , y ∈ intB. Đặt β = inf{tT y|y ∈ intB}, α = sup{tT x | x ∈ intA}, thì α ≤ β. Lấy α ≤ γ ≤ β. Khi đó siêu phẳng tT x = γ sẽ tách A và B, nhưng không thể đồng thời chứa cả A và B . 2. Trường hợp int( A − B) = ∅. Đặt C = A − B và F là không gian con song song với bao a-phin của C. Khi đó áp dụng lập luận ở phần trên cho không gian F, sẽ tồn tại một siêu phẳng H 0 (trong F) tách đúng A và B. Gọi t0 là phiếm hàm tuyến tính từ F → IR xác định siêu phẳng H 0 . Goi F⊥ là không gian vuông góc với F. Với mỗi x ∈ IRn đặt t( x ) là hàm hợp giữa t0 và p, trong đó p là ánh xạ chiếu xuống không gian con F. Do p là tuyến tính, nên dễ thấy t và t0 cũng là tuyến tính và là siêu phẳng tách đúng hai tập A và B. Để chứng minh điều kiện cần, ta giả sử có siêu phẳng tT x = γ 0 tách A và B, tức là t T x ≤ γ ≤ tT y với mọi x ∈ A và y ∈ B. Giả sử siêu phẳng này không chứa B. Khi đó tT y > γ với mọi y ∈ riB. Suy ra riA ∩ riB = ∅.  Một hệ quả rất quan trọng của định lý tách là bổ đề chọn mang tên nhà toán học Hungary Farkas, được chứng minh từ năm 1892 dưới dạng một định lý hình học. Bổ đề này rất trực quan, dễ áp dụng trong nhiều lĩnh vực như tối ưu, điều khiển, lý thuyết toán tử v.v... Hệ quả 6.1. Cho A là một ma trận thực cấp m × n và a ∈ IRn . Khi đó trong hai hệ dưới đây có một hệ và chỉ duy nhất một hệ có nghiệm: Ax ≥ 0, aT x < 0 với một x ∈ IRn ,

(6.4)

A T y = a, y ≥ 0 với một y ∈ IRm .

(6.5)

87

6.1 Các định lý tách và bổ đề Farkas

Một cách phát biểu tương đương, dưới ngôn ngữ hình học, của bổ đề Farkas là: Nửa không gian { x | aT x ≥ 0} chứa nón { x | Ax ≥ 0} khi và chỉ khi véc-tơ a nằm trong nón sinh bởi các hàng của ma trận A. Tức là A T x ≥ 0 ⇒ aT x ≥ 0 khi và chỉ khi A T y = a, y ≥ 0. Tính chất hình học của bổ đề này rất rõ. Nó nói rằng nón lồi, đóng { x | Ax ≥ 0} nằm trong nửa không gian { x | aT x ≥ 0} khi và chỉ khi véc-tơ pháp tuyến a ở trong nón sinh bởi các hàng của ma trận A. Ax ≥ 0 a

0

aT x = 0 Hình 6.2: Bổ đề Farkas Chứng minh bổ đề Farkas. Giả sử (6.5) có một nghiệm y nào đó. Nếu như Ax ≥ 0, thì từ A T y = a, nhân tích vô hướng với x, và do Ax ≥ 0, y ≥ 0, ta có aT x = y T Ax ≥ 0. Vậy (6.4) không thể có nghiệm. Bây giờ ta giả sử hệ (6.5) không có nghiệm. Lấy tập C = { x | ∃y ≥ 0 : AT y = x }. Hiển nhiên C là tập lồi đóng và 0 ∈ C.

88

Nhập môn giải tích lồi ứng dụng

Do (6.5) không có nghiệm, nên a 6∈ C. Theo định lý tách mạnh, tồn tại p 6= 0 và một số α ∈ IR sao cho p T a < α < p T x với mọi x ∈ C. Do 0 ∈ C, nên α < 0. Thay x = A T y, với y ≥ 0, ta viết được α ≤ p T A T y = y T Ap. Chú ý rằng nếu x ∈ C, thì ξx ∈ C với mọi ξ ≥ 0, vì từ x = có ξx = A T ξy. Vậy các toạ độ của y có thể lớn tuỳ ý, nên từ bất đẳng thức α ≤ p T A T y = y T Ap, suy ra Ap ≥ 0. Vậy ta đã chỉ ra sự tồn tại của một véc-tơ p sao cho Ap ≥ 0 và aT p < 0. Chứng tỏ hệ (6.4) có nghiệm.  A T y,

6.2. Mở rộng và ứng dụng Các định lý tách đã nêu ở trên xét việc tách các tập lồi bởi một siêu phẳng. Người ta đã mở rộng việc tách các tập lồi bởi siêu phẳng bằng tách các tập không lồi, nhưng có thêm một cấu trúc riêng nào đó, ví dụ như tập hình sao, còn siêu phẳng tách thì được mở rộng bởi những siêu mặt tổng quát hơn, không nhất thiết là siêu phẳng, ví dụ siêu mặt phẳng từng khúc v. v... Ngoài ra người ta cũng nghiên cứu việc tách xấp xỉ (e-tách). Gần đây các ý tưởng tách đã được xử dụng vào các bài toán xử lý số liệu và áp dụng vào nhiều lĩnh vực thực tế khác nhau. Hãy xét bài toán sau: Giả sử ta có hai tập hợp điểm A và B trong không gian IRn . Tập A gồm K điểm a1 , ..., aK và tập B gồm N điểm b1 , ..., b N . Bài toán đặt ra là hãy tìm một phiếm hàm f thuộc một lớp hàm F nào đó sao cho f tách hai tập điểm này. Giả sử siêu mặt tách được cho bởi f ( x ) = 1, với f ∈ F. Như vậy điều muốn có là: f (a) ≥ 1 ∀ a ∈ A và f (b) ≤ 1 ∀b ∈ B.

89

6.2 Mở rộng và ứng dụng

x

x

x x

x x

x

x

Hình 6.3: Tách 2 tập rời rạc Bài toán này có thể không có nghiệm, do đó ta muốn giải nó một cách xấp xỉ theo nghĩa làm sao siêu mặt f ( x ) = 1 tách "nhiều nhất" hai tập này. Đặt δi := f (ai ) − 1. Hiển nhiên, nếu δi ≥ 0, thì ai thoả mãn điều kiện tách. Trái lại, nếu δi < 0, thì ai không thoả mãn điều kiện tách, và độ sai lệch là 1 − f (ai ) = −δi . Vậy giá trị yi được xác định bởi yi := max{0, −δi } = max{0, f (ai ) − 1} là độ sai lệch đối với điểm ai . Do đó độ sai lệch trung bình cho Kphần tử của tập A là K1 ∑iK=1 yi . Tương tự, đối với các phần tử của tập B, đại lượng zi := max{0, 1 − f (bi )} sẽ đo độ sai lệch đối với phần tử bi ∈ B. Do đó độ sai lệch trung bình cho N phần tử của tập B là N1 ∑iN=1 zi . Vậy sai lệch trung bình đối với việc tách các phần tử của hai tập A và B bởi phiếm hàm tách f ∈ F là e( f ) :=

1 K 1 yi + ∑ K i =1 N

N

∑ zi . i =1

Như vậy bài toán đặt ra là phải tìm f ∈ F sao cho độ sai lệch trung bình e( f ) là nhỏ nhất có thể được. Tức là phải giải bài toán

90

Nhập môn giải tích lồi ứng dụng

tối ưu sau: min e( f ) := min{ f ∈F

f ∈F

1 K

K

∑ yi + i =1

1 N

N

∑ z j }. j =1

Theo định nghĩa của yi và z j , bài toán trên có thể viết được dưới dạng

min{ f ∈F

1 1 K max{0, f (ai ) − 1} + ∑ K i =1 N

N

∑ max{0, 1 − f (b j )}}. j =1

Bài toán này khó giải khi F là lớp hàm tổng quát. Người ta đã giải bài toán này với F là lớp hàm a-phin và F là lớp hàm toàn phương lồi. Hãy xét trường hợp F là lớp hàm a-phin. Khi đó mọi f ∈ F dều có dạng f ( x ) = w T x − w0 , trong đó w ∈ IRn và w0 ∈ IR. Trong trường hợp này, bài toán có dạng sau: min

1 K 1 yi + ∑ K i =1 N

N

∑ zj j =1

Với điều kiện yi ≥ w T ai − w0 − 1, i = 1, .., K, z j ≥ −w T b j + w0 + 1, j = 1, ..., N, yi ≥ 0, z j ≥ 0 ∀i, j. Đây là một qui hoạch tuyến tính với các biến là yi , z j , w0 thuộc IR và w ∈ IRn . Khi áp dụng mô hình này vào các bài toán khai thác dữ liệu, người ta coi mỗi tọa độ của một véc-tơ a ∈ A hoặc b ∈ B là một

6.3 Bài tập

91

thông số đặc trưng cho vấn đề cần xét (ví dụ bệnh ung thư, hoặc cho sự kinh doanh thành đạt của một công ty). Ta gọi mỗi phần tử của A và B là các véc-tơ số liệu. Ví dụ trong khi nghiên cứu về khối u, người ta thường lấy các tế bào và khảo sát nhân của các tế bào đó. Mỗi nhân được xét bởi một số đặc trưng quyết định đến việc khối u là ác hay lành như diện tích, chu vi, tính đối xứng, kích thước các lỗ lõm vào, lồi ra, các thành phần a-xít v.v... Sau khi xác định được hàm tách, việc chẩn đoán bệnh trở nên dễ dàng. Chỉ việc lắp véc-tơ số liệu vào hàm tách để biết véc-tơ đó nằm về phía nào của siêu mặt tách, từ đó có thể khẳng định tính chất của căn bệnh. Để kiểm tra tính chính xác của phương pháp, người ta đã sử dụng nhiều số liệu thống kê với các khối u đã biết rõ từ trước và nhận thấy rằng, ngay với lớp hàm a-phin, việc chẩn đoán theo phương pháp này chỉ sai sót với số liệu đã có với một tỉ lệ rất nhỏ (dưới 5 phần trăm). Các ứng dụng khác trong sử lý số liệu để phân loại, có thể thực hiện một cách tương tự.

6.3. Bài tập I 6.1. Cho hai đường thẳng A và B cắt nhau trong không gian IR3 . (i) Có tồn tại siêu phẳng tách hai đường thẳng này không? Nếu không thì sao? nếu có thì hãy cho một siêu phẳng tách chúng. (ii) Hai đường thẳng A và B này có tách đúng được không?

I 6.2. Định lý Gordan. Cho A là một ma trận cấp m × n. Khi đó trong hai hệ dưới đây có đúng một hệ có nghiệm: (i) Ax < 0,

92

Nhập môn giải tích lồi ứng dụng

(ii) A T y = 0, y ≥ 0. Chỉ dẫn. Chuyển hệ đầu về dạng Ax + te ≤ 0 với t > 0. Viết lại theo dạng để có thể áp dụng Bổ đề Farkas. 2a) Cho x0 , ..., x m là các điểm trong Rn . Chứng minh rằng hai khẳng định dưới đây có đúng một điều thoả mãn: (i) x0 ∈ co{ x1 , ..., x m }, (ii) Tồn tại x ∗ ∈ IRn sao cho h x ∗ , xi i < h x ∗ , x0 i với mọi i = 1, ...m.

I 6.3. Chứng minh rằng nếu A, B là hai tập lồi, khác rỗng và riA ∩ riB = ∅, thì chúng có thể tách được. I 6.4. Cho A như bài tập 2 và c ∈ IRn . Khi đó trong hai hệ sau có đúng một hệ có nghiệm: Ax ≤ 0, x ≥ 0, c T x > 0, A T y ≥ c, y ≥ 0.

I 6.5. Cho e > 0. Ta nói siêu phẳng ha, x i = α là e-tách hai tập C và D, nếu supha, x i − e ≤ α ≤ inf ha, x i + e. x∈C

y∈ D

Hãy tìm một ví dụ về hai tập lồi đóng C và D sao cho intA ∩ intB 6= ∅, nhưng e-tách được.

I 6.6. Cho A là một ma trận thực cấp m × n. Chứng minh rằng trong hai hệ dưới đây có đúng một hệ có nghiệm: Hệ 1: Ax > 0, Hệ 2: Ay = 0, y ≥ 0, y 6= 0.

93

6.3 Bài tập

I 6.7. Cho A là một ma trận như bài tập trên và c ∈ IRn . Chứng tỏ rằng trong hai hệ dưới đây có đúng một hệ có nghiệm: Hệ 1: Ax = c, Hệ 2: A T y = 0, c T y = 1.

I 6.8. Cho A là một ma trận thực cấp m × n. Chứng minh rằng hai hệ Hệ 1: Ax ≥ 0, Hệ 2: A T y = 0, y ≥ 0 có nghiệm thoả mãn Ax + y > 0.

I 6.9. Cho hai tập lồi C và D trong IRn Chứng minh rằng điều kiện cần và đủ để hai tập này tách chặt được là inf{|| x − y|| | x ∈ C, y ∈ D } > 0.

I 6.10. Cho C := {( x1 , x2 )k x2 ≥ e− x1 }, D := {( x1 , x2 )k x2 ≤ −e− x1 }. Chứng tỏ hai tập này lồi, không giao nhau. Tìm siêu phẳng tách chúng. Có tồn tại siêu phẳng tách chặt hai tập này không? I 6.11. Cho hình tròn đơn vị C := {( x1 , x2 )| x12 + x22 ≤ 1}. Hãy tìm một biểu diễn của hình tròn này bởi giao của các nửa không gian đóng. I 6.12. Hai tập A và B được gọi là tách đẹp, bởi siêu phẳng H, nếu ít nhất có một trong hai tập sau A ∩ H và B ∩ H khác rỗng. Hãy cho một điều kiện để hai tập có siêu phẳng tách đẹp.

94

Nhập môn giải tích lồi ứng dụng

Chương 7 ĐỐI CỰC CỦA TẬP LỒI

7.1. Định nghĩa và tính chất cơ bản . . . . . . . . . . . . . . .

96

7.2. Trường hợp tập lồi đa diện . . . . . . . . . . . . . . . . . . .

99

7.3. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

101

Giữa các phần tử của một tập hợp và các phiếm hàm tuyến tính xác định trên tập hợp đó có một mối liên hệ mật thiết với nhau. Trong nhiều trường hợp, mối liên hệ này cho phép ta nghiên cứu một tập hợp thông qua việc khảo sát các phiếm hàm tuyến tính trên tập hợp này và ngược lại. Mối liên hệ này được xây dựng trên khái niệm về đối cực của một tập hợp. Khái niệm đối cực rất hữu ích trong lý thuyết đối ngẫu, cũng như trong các phương pháp hạ thứ nguyên, phương pháp phân rã trong tối ưu hoá.

96

Nhập môn giải tích lồi ứng dụng

7.1. Định nghĩa và tính chất cơ bản Cho E ⊆ IRn (không nhất thiết lồi). Tập E∗ := {y ∈ IRn | y T x ≤ 1 ∀ x ∈ E} được gọi là tập đối cực của E. Từ định nghĩa của nón, dễ thấy rằng khi E là một nón, thì tập đối cực của E trở thành E∗ := {y ∈ IRn | y T x ≤ 0 ∀ x ∈ E}. Ví dụ: nếu E là một không gian con thì tập đối cực của E là không gian vuông góc với E. Tức là E ∗ = E T = { y | y T x = 0 ∀ x ∈ E }. Mệnh đề 7.1. (i) Tập đối cực E∗ của E là một tập lồi đóng chứa gốc và E ⊆ F khi và chỉ khi F∗ ⊆ E∗ . (ii) E ⊆ E∗∗ . Nếu E là lồi đóng chứa gốc, thì E = E∗∗ . (iii) 0 ∈ intE khi và chỉ khi E∗ bị chặn. Chứng minh. (i) E∗ lồi đóng, chứa gốc vì nó là giao của các nửa không gian đóng chứa gốc. Điều khẳng định tiếp theo ở (i) suy trực tiếp từ định nghĩa. (ii) E ⊆ E∗∗ được suy trực tiếp từ định nghĩa. Bây giờ giả sử E lồi, đóng chứa gốc. Do E ⊆ E∗∗ , nên ta cần chỉ ra E∗∗ ⊆ E. Thật vậy, nếu trái lại, sẽ tồn tại u ∈ E∗∗ \ E. Do E lồi đóng và u 6∈ E, nên theo định lý tách mạnh, tồn tại y 6= 0, thoả mãn

hy, x i < 1 < hy, ui, ∀ x ∈ E. Từ bất đẳng thức đầu suy ra y ∈ E∗ và do đó hy, ui ≤ 1, vì u ∈ E∗∗ , Mâu thuẫn với bất đẳng thức sau. Vậy E = E∗∗ .

97

7.1 Định nghĩa và tính chất cơ bản

(iii) Trước hết ta chỉ ra rằng tập đối cực của hình cầu Br : tâm 0, bán kính r là hình cầu B 1 : tâm 0, bán kính 1r . Thật vậy, dễ thấy r

rằng khoảng cách từ 0 đến siêu phẳng hy, x i = 1 bằng

)∗

1 . || y||

Vậy

1 || y||

≥ r. Điều này tương đương với y ∈ B 1 . Chứng tỏ ( Br )∗ = B 1 . Do 0 ∈ intE khi và chỉ khi tồn tại r > 0

y ∈ ( Br

khi và chỉ khi

r

r

sao cho Br ⊂ E. Điều này tương đương với E∗ ⊂ ( Br )∗ = B 1 . r Tương đương với việc E∗ là tập bị chặn.  Mệnh đề dưới đây cho một quy tắc tính tập đối cực của tổng và giao của các nón lồi đóng. Mệnh đề 7.2. Nếu C1 và C2 là các nón lồi đóng khác rỗng trong IRn thì

(C1 + C2 )∗ = (C1 )∗ ∩ (C2 )∗ , (C1 ∩ C2 )∗ = C1∗ + C2∗ . Chứng minh. Do C1 và C2 là các nón lồi đóng, nên với mọi x ∈ C1 , thì x = x + 0 ∈ C1 + C2 . Do đó với mọi y ∈ (C1 + C2 )∗ , theo định nghĩa tập đối cực ta có hy, x i ≤ 0. Suy ra y ∈ (C1 )∗ . Tương tự ta cũng có y ∈ (C2 )∗ . Vậy (C1 + C2 )∗ ⊆ (C1 )∗ ∩ (C2 )∗ . Ngược lại, với mọi y ∈ (C1 )∗ ∩ (C2 )∗ , thì hy, x i ≤ 0 với i = 1, 2. Từ đây thấy rằng với mọi x1 ∈ C1 , x2 ∈ C2 , thì

hy, x1 + x2 i = hy, x1 i + hy, x2 i ≤ 0. Suy ra y ∈ (C1 + C2 )∗ . Vậy

(C1 )∗ ∩ (C2 )∗ ⊆ (C1 + C2 )∗ . Kết hợp lại

(C1 )∗ ∩ (C2 )∗ = (C1 + C2 )∗ . Điều khẳng định

(C1 ∩ C2 )∗ = (C1 )∗ + (C2 )∗

98

Nhập môn giải tích lồi ứng dụng

suy ra từ việc (C1 )∗ + (C2 )∗ là tập lồi đóng, và do đó, theo mệnh đề trên và điều vừa chứng minh ta viết được

(C1 )∗ + (C2 )∗ = [(C1 )∗ + (C2 )∗ ]∗ [(C1 )∗ ]∗ ∩ [(C2 )∗ ]∗ = [C1 ∩ C2 ]∗ .  Mỗi y ∈

IRn

xác định một phiếm hàm tuyến tính hy, .i. Gọi s E (y) := sup{hy, x i | x ∈ E}

là cận trên đúng của phiếm hàm này trên tập E. Khi thay đổi y thì cận trên đúng này cũng thay đổi và do đó ta nhận được một hàm số. Hàm số này được gọi là hàm tựa của E. Cũng như tập đối cực, hàm tựa cũng cho ta một mối quan hệ giữa một tập và các phiếm hàm tuyến tính xác định trên tập đó. Vì vậy giữa hàm tựa và tập đối cực có mối liên quan mật thiết, thể hiện qua mệnh đề sau: Mệnh đề 7.3. Giả sử C là một tập lồi đóng chứa gốc. Khi đó (i) Phiếm hàm Minkowski của C chính là hàm tựa của tập đối cực C∗ . (ii) Tập đối cực của nón lùi xa của C chính là bao nón lồi đóng của tập đối cực của C∗ , do đó (reC)∗ = coneC∗ . (iii) Không gian thẳng của C là phần bù trực giao của không gian tuyến tính căng bởi tập đối cực của C, tức là L(C) + lin(C∗ ) = IRn Chứng minh. (i) Theo định nghĩa của phiếm hàm Minkowski gC ( x ), định nghĩa tập đối cực và do C∗∗ = C, ta có: gC ( x ) = inf{λ > 0| x ∈ λC} = inf{λ > 0|hy,

x i ≤ 1 ∀y ∈ C∗ } λ

99

7.2 Trường hợp tập lồi đa diện

\= inf{λ > 0|hy, x i ≤ λ ∀y ∈ C∗ } = sup hy, x i = sC ∗ (y). y∈ C ∗

(ii) Do 0 ∈ C, nên nón các hướng vô hạn của C là: reC = {y| λy ∈ C ∀λ > 0} ⊆ C. Vậy C∗ ⊆ (reC)∗ . Do reC là nón lồi đóng, nên (reC)∗ cũng là nón lồi, đóng. Nón này chứa C∗ , nên (reC)∗ ⊇ coneC∗ . Mặt khác do reC là nón lồi đóng lớn nhất bị chứa trong tập C, nên đối cực của nó là nón lồi đóng nhỏ nhất chứa tập đối cực C∗ của C. Kết hợp lại có (reC)∗ = coneC∗ . (iii) Theo định nghĩa, không gian thẳng của C là không gian con lớn nhất bị chứa trong C. Do đó không gian trực giao của không gian này chính là không gian con nhỏ nhất chứa C∗ .  Hệ qủa 7.1. Với mọi tập lồi đóng C ⊂ IRn ta có: dimC∗ + linealityC = n dim C + linealityC∗ = n. Chứng minh. Suy ra từ (iii) của mệnh đề trên và từ (C∗ )∗ = C.  Như đã nêu, rank C := dimC − linalityC là đại lượng đo " độ phi tuyến" của một tập C. Từ hệ quả trên, suy ra rằng với mọi tập lồi đóng C, thì rankC = rankC∗ .

7.2. Trường hợp tập lồi đa diện Tính đối cực của một tập, dù đó là tập lồi, nói chung là một vấn đề khó. Tuy nhiên trong trường hợp tập lồi đa diện được cho tường minh bởi một hệ bất đẳng thức tuyến tính, ta có công thức tường minh của tập đối cực của nó.

100

Nhập môn giải tích lồi ứng dụng

Giả sử P là tập lồi đa diện cho bởi P := { x | hai , x i ≤ bi , i = 1, ..., m} và x0 ∈ P. Giả sử x0 = 0. Như vậy bi ≥ 0 với mọi i. Giả sử bi > 0, (i = 1, ..., p) và bi = 0 với i = p + 1, ..., m. Bằng cách chia cho bi > 0, ta viết được P := { x | hai , x i ≤ 1, i = 1, ..., p, hai , x i ≤ 0, i = p + 1, ..., m}. (7.1) Mệnh đề 7.3. Giả sử P là tập lồi đa diện cho bởi (7.1). Khi đó đối cực của P là tập Q = co{0, a1 , ..., a p } + cone{ a p+1 , ..., am }. Chứng minh. Theo định nghĩa của Q, mọi phần tử thuộc Q đều là tổ hợp lồi của các điểm 0, a1 , ..., a p và tổ hợp không âm của các điểm a p+1 , ..., am . Vậy với mọi y ∈ Q, ta có biểu diễn p

y=

m

∑ λj aj + j =1

ξ j aj

j = p+1

với

p

λ j ≥ 0, ξ j ≥ 0 ∀ j,

∑ λ j ≤ 1. j =1

Nhân tích vô hướng với x, ta có p

h x, yi =

∑ λ j ha j , xi + j =1

m

λ j ha j , x i ∀ x ∈ P.

j = p+1

Do ha j , x i ≤ 1 với mọi j = 1, ..., p và ha j , x i ≤ 0 với mọi j = p + 1, ..., m, nên từ đây suy ra h x, yi ≤ 1 với mọi x ∈ P và mọi y ∈ Q. Suy ra Q ⊆ P∗ . Ngược lại, theo định nghĩa của Q∗ thì hy, x i ≤ 1 với mọi y ∈ Q∗ và mọi x ∈ Q. Với j ≤ p lấy x = a j , ta có hy, a j i ≤ 1. Với j > p lấy x = ta j với t > 0 bất kỳ. Theo định nghĩa của Q, ta có ta j ∈ Q với mọi t > 0. Vậy hy, ta j i ≤ 1 với mọi t > 0. Do đó hy, a j i ≤ 0. Suy ra Q∗ ⊆ P, và do đó P∗ ⊆ Q. Kết hợp lại P∗ = Q. 

101

7.3 Bài tập

7.3. Bài tập I 7.1. Hãy xác định dạng tường minh của tập đối cực cho các tập sau: a. A := {( x1 , x2 ) | 0 ≤ x1 ≤ x1 }, b. B := {( x1 , x2 ) | x2 ≥ −| x1 |}, c. C := { x ∈ IRn | | x = Ay, y ≥ 0}, trong đó A là ma trận thực cho trước.

I 7.2. Hãy xác định tập đối cực của các tập sau: a. A := {( x1 , x2 )| x12 + x22 ≤ 1}, b. B := {( x1 , x2 )| x1 + x2 ≤ 2, − x1 + 2x2 ≤ 1, x1 , x2 ≥ 0}.

I 7.3. Cho B = { x | max | xi | ≤ 1} = { x | − 1 ≤ xi ≤ 1, ∀i } i

là quả cầu theo chuẩn max (chuẩn l∞ ). Chứng minh rằng tập đối cực của B là quả cầu theo chuẩn l1 , tức là B ∗ = { x | ∑ | x j | ≤ 1} j

I 7.4. a) Cho C := { x ∈ IRn | Ax ≤ 0}, trong đó A là ma trận cấp p × n và rankA = k. Tính tập đối cực C∗ của C và dimC∗ . b) Cho C là một không gian con. Chứng minh rằng C ∩ (−C∗ ) = {0}.

I 7.5. Chứng tỏ rằng một nón lồi đóng C là không gian con khi và chỉ khi C ∩ (−C∗ ) = {0}. I 7.6. Cho C là một nón lồi đóng và K là một tập com-pắc. Chứng minh rằng K ∩ C∗ 6= ∅ khi và chỉ khi với mọi p ∈ C, tồn tại x ∈ K thoả mãn p T x ≤ 0.

102

Nhập môn giải tích lồi ứng dụng

I 7.7. Cho C là một nón lồi đóng trong IRn và x ∈ C. Gọi π ( x ) là hình chiếu của x lên −C. Chứng tỏ rằng x − π ( x ) ∈ C ∩ (−C)∗ .

Chương 8 ĐỊNH NGHĨA VÀ CÁC TÍNH CHẤT CƠ BẢN HÀM LỒI

8.1. Định nghĩa và ví dụ . . . . . . . . . . . . . . . . . . . . . . . . . 8.2. Tính liên tục . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3. Các phép toán bảo toàn tính lồi . . . . . . . . . . . . . . 8.4. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

103 109 116 124

Trong mục đầu tiên của chương này, chúng ta sẽ đưa ra các định nghĩa và một số ví dụ điển hình về hàm lồi. Mục tiếp theo sẽ khảo sát tính liên tục của hàm lồi. Mục cuối cùng của chương sẽ giới thiệu một số phép toán thường gặp đối với các hàm lồi.

8.1. Định nghĩa và ví dụ Cho C ⊆ IRn là tập lồi và f : C → IR. Ta sẽ ký hiệu dom f := { x ∈ C| f ( x ) < +∞}. Tập dom f được gọi là miền hữu dụng của f . Tập epi f := {( x, µ) ∈ C × IR | f ( x ) ≤ µ}

104

Nhập môn giải tích lồi ứng dụng

được gọi là trên đồ thị của hàm f . Bằng cách cho f ( x ) = +∞ nếu x 6∈ C, ta có thể coi f được xác định trên toàn không gian và hiển nhiên là dom f = { x ∈ IRn | f ( x ) < +∞}, epi f = {( x, µ) ∈ IRn × IR | f ( x ) ≤ µ}. Do sẽ làm việc với hàm số nhận cả giá trị −∞ và +∞, nên, như thường lệ, ta có quy ước sau: Nếu λ = 0, thì λ f ( x ) = 0 với mọi x. Định nghĩa 8.1. Cho ∅ 6= C ⊆ IRn lồi và f : C → IR . Ta nói f là hàm lồi trên C, nếu epi f là một tập lồi trong IRn+1 . Sau đây ta sẽ chủ yếu làm việc với hàm f : IRn → IR ∪ {+∞}. Trong trường hợp này, dễ thấy rằng định nghĩa trên tương đương với f (λx + (1 − λ)y) ≤ λ f ( x ) + (1 − λ) f (y) ∀ x, y ∈ C, ∀λ ∈ (0, 1). (8.1) Hàm f : IRn → IR ∪ {+∞} được gọi là lồi chặt trên C nếu f (λx + (1 − λ)y) < λ f ( x ) + (1 − λ) f (y) ∀ x, y ∈ C, ∀λ ∈ (0, 1). (8.2) Hàm f : IRn → IR ∪ {+∞} được gọi là lồi mạnh trên C với hệ số η > 0, nếu ∀ x, y ∈ C, ∀λ ∈ (0, 1) có: 1 f (λx + (1 − λ)y) ≤ λ f ( x ) + (1 − λ) f (y) − ηλ(1 − λ)|| x − y||2 . 2 Dễ kiểm tra được rằng, f lồi mạnh trên C với hệ số η > 0 khi và chỉ khi hàm η h(.) := f (.) − ||.||2 2

105

8.1 Định nghĩa và ví dụ lồi trên C.

Bằng qui nạp, dễ dàng chứng minh được rằng, nếu f nhận giá trị hữu hạn trên tập lồi C, thì với mọi số tự nhiên m và mọi x1 , .., , x m ∈ C thoả mãn λ1 ≥ 0, ..., λm ≥ 0, ∑m j=1 λ j = 1, ta có m

f ( ∑ λj x j) ≤ j =1

m

∑ λ j f (x j ) (bất đẳng thức Jensen). j =1

Hàm f được gọi là một hàm lõm trên C, nếu − f lồi trên C. Dưới đây là một điều kiện cần và đủ về hàm lồi, rất tiện ích trong nhiều trường hợp. Mệnh đề 8.1. Một hàm f : C → IR là lồi trên C khi và chỉ khi

∀ x, y ∈ C, ∀α > f ( x ), ∀ β > f (y), ∀λ ∈ [0, 1] =⇒ f (λx + (1 − λ)y) ≤ λα + (1 − λ) β. Chứng minh. Chứng minh diều kiện cần. Giả sử f lồi. Chọn x, y, α, β như đã nêu trong mệnh đề. Chọn α0 ∈ ( f ( x ), α) và β0 ∈ ( f (y), β). Vậy ( x, α0 ) và (y, β0 ) thuộc epi f . Do epi f lồi, nên

((1 − λ) x + λy, (1 − λ)α0 + λβ0 ) ∈ epi f . Do đó f ((1 − λ) x + λy) ≤ (1 − λ)α0 + λβ0 < (1 − λ)α + λβ. Chứng minh điều kiện đủ. Chọn ( x, µ) và (y, ν) thuộc epi f và λ ∈ (0, 1). Thế thì với mọi e > 0, ta có f ( x ) < µ + e, f (y) < ν + e. Do đó f [(1 − λ)α0 + λβ0 ] < (1 − λ)(µ + e) + λ(ν + e) = (1 − λ)µ + λν + e.

106

Nhập môn giải tích lồi ứng dụng

Điều này đúng với mọi e > 0, nên cho e → 0, ta được f [(1 − λ)α0 + λβ0 ] ≤ (1 − λ)µ + λν. Chứng tỏ

(1 − λ)( x, µ) + λ(y, ν) ∈ epi f . Vậy f lồi.



Dưới đây là một định nghĩa khác, tương đương về hàm lồi, lồi mạnh, dựa vào khái niệm hệ số lồi, Định nghĩa 8.2. Cho f : IRn → IR ∪ {+∞} (không nhất thiết lồi), C ⊆ IRn là một tập lồi khác rỗng và η là một số thực. Ta nói η là hệ số lồi của f trên C, nếu với mọi λ ∈ (0, 1), mọi x, y thuộc C, ta có 1 f [(1 − λ) x + λy] ≤ (1 − λ) f ( x ) + λ f (y) − ηλ(1 − λ)|| x − y||2 . 2 Hiển nhiên nếu η = 0 thì f lồi trên C. Nếu f có hệ số lồi trên C là η > 0, thì f lồi mạnh trên C với hệ số η. Một hàm f được gọi là chính thường nếu dom f 6= ∅ và f ( x ) > −∞ với mọi x. Hàm f được gọi là đóng, nếu epi f là một tập đóng trong IRn+1 . Như đã nói ở trên, nếu f là một hàm lồi trên một tập lồi C, thì có thể thác triển f lên toàn không gian bằng cách đặt  f ( x ), nếu x ∈ C, f e ( x ) := +∞, nếu x ∈ / C. Hiển nhiên f e ( x ) = f ( x ) với mọi x ∈ C và f e lồi trên IRn . Hơn nữa f e là chính thường khi và chỉ khi f chính thường. Tương tự f e đóng khi và chỉ khi f đóng. Chú ý rằng, nếu f là một hàm lồi trên IRn thì dom f là một tập lồi, vì dom f chính là hình chiếu trên IRn của epi f , tức là: dom f = { x |∃µ ∈ IR : ( x, µ) ∈ epi f }.

107

8.1 Định nghĩa và ví dụ Ví dụ về hàm lồi.

1. Hàm a-phin. f ( x ) := aT x + α, trong đó a ∈ IRn , α ∈ IR. Dễ dàng kiểm tra được rằng f là một hàm vừa lồi vừa lõm trên toàn không gian. Khi α = 0, thì hàm này được gọi là hàm tuyến tính. Cho C 6= ∅ là một tập lồi. 2. Hàm chỉ. Đặt δC ( x ) :=



0 nếu x ∈ C, +∞ nếu x ∈ / C.

Ta nói δC là hàm chỉ của C. Do C lồi, nên δC là một hàm lồi. 3. Hàm mặt cầu. Cho S := { x ∈ IRn | || x || = 1} là một mặt cầu và h : S → IR+ là một hàm bất kỳ. Định nghĩa hàm f như sau: f ( x ) :=



0 nếu || x || < 1, h( x ) nếu || x || = 1, +∞ nếu || x || > 1.

Hàm này được gọi là hàm mặt cầu. Dễ thấy rằng f là một hàm lồi trên IRn , mặc dù h là một hàm không âm bất kỳ trên mặt cầu S. 4. Hàm tựa. Hàm dưới đây được gọi là hàm tựa của C. sC (y) := suphy, x i. x∈C

5. Hàm khoảng cách. Cho C lồi đóng, hàm khoảng cách đến tập C được định nghĩa bởi dC ( x ) := min || x − y||. y∈ C

6. Hàm chuẩn. Giả sử x = ( x1 , ..., x n ). f ( x ) := || x ||1 := max | xi | i

108

Nhập môn giải tích lồi ứng dụng

Hoặc 1

f ( x ) := || x || := ( x12 + ... + x2n ) 2 . 7. Hàm tổng chập. Cho f 1 , ..., f m là các hàm lồi chính thường trên IRn . Khi đó hàm f được xác định bởi m

j

f ( x ) := inf{ ∑ f j ( x ) : j =1

m

∑ x j = x} j =1

được gọi là hàm tổng chập của các hàm f 1 , ..., f m . Hàm tổng chập này thường được ký hiệu là f 1 ⊕ ... ⊕ f m . Từ định nghĩa của tập trên đồ thị, ta thấy rằng một hàm lồi được xác định bởi trên đồ thị của nó. Mệnh đề đưới đây cho thấy lý do vì sao trong thực tế người ta thường chỉ quan tâm đến các hàm lồi chính thường. Mệnh đề 8.2. Giả sử f là một hàm lồi không chính thường trên IRn và f 6≡ +∞. Khi đó f ( x ) = −∞ với mọi x ∈ ri(dom f ). Chứng minh. Theo định nghĩa hàm chính thường, nếu dom f 6= ∅, thì tồn tại một x0 sao cho f ( x0 ) = −∞. Giả sử x ∈ ri(dom f ). Theo định nghĩa của điểm trong tương đối, tồn tại y ∈ dom f thoả mãn x = λy + (1 − λ) x0 với λ ∈ (0, 1). Do f lồi và f (y) < +∞, nên f ( x ) ≤ λ f (y) + (1 − λ) f ( x0 ) = −∞.

 Theo mệnh đề trên, để tránh làm việc với các hàm lồi đồng nhất với −∞ tại miền trong tương đối của miền hữu dụng, từ nay về sau, nếu không nhấn mạnh gì thêm, khi nói đến một hàm lồi trên IRn , ta luôn hiểu đó là một hàm chính thường, tức là nó không đồng nhất với +∞ và không nhận giá trị −∞.

109

8.2 Tính liên tục Mệnh đề 8.3. Nếu f là một hàm lồi trên IRn , thì các tập mức L f ( α ) : = { x | f ( x ) ≤ α }, l f ( α ) : = { x | f ( x ) < α } là lồi với mọi α ∈ IR.

Chứng minh. Trường hơp α = +∞ hoặc −∞ là hiển nhiên (nhớ rằng tập rỗng là lồi). Lấy x, y ∈ l f (α). Tức là f ( x ) < α, f (y) < α. Do f lồi, nên theo Mệnh đề 8.1, với mọi λ ∈ (0, 1), ta có: f (λx + (1 − λ)y) < λα + (1 − λ)α = α. Vậy λx + (1 − λ)y ∈ l f (α). Tập L f (α) = ∩µ>α l f (µ), nên nó cũng là tập lồi.



Một lớp hàm lồi rất quan trọng là hàm lồi thuần nhất dương. Nhắc lại rằng một hàm f được gọi là thuần nhất dương (bậc 1) trên IRn nếu f (λx ) = λ f ( x ) ∀ x ∈ IRn , ∀λ > 0. Một hàm thuần nhất dương không nhất thiết là hàm lồi, tuy nhiên ta dễ dàng chứng minh mệnh đề sau: Mệnh đề 8.4. Cho f là một hàm thuần nhất dương trên IRn . Khi đó f lồi khi và chỉ khi nó là dưới cộng tính, theo nghĩa f ( x + y) ≤ f ( x ) + f (y) ∀ x, y. Một hàm thuần nhất dương và dưới cộng tính được gọi là dưới tuyến tính. Một ví dụ điển hình về hàm dưới tuyến tính là hàm chuẩn f ( x ) = || x ||.

8.2. Tính liên tục Tính chất lồi của một hàm kéo theo nhiều tính chất tô-pô quan trọng, mặc dù trong định nghĩa hàm lồi ta không đòi hỏi một cách trực tiếp đến bất kỳ tính chất tô-pô nào.

110

Nhập môn giải tích lồi ứng dụng

Nhắc lại rằng một hàm f : IRn → IR được gọi là nửa liên tục dưới đối với E tại một điểm x, nếu như với mọi dãy { x k } ⊂ E, x k → x ta có lim inf f ( x k ) ≥ f ( x ). Hàm f được gọi là nửa liên tục trên, đối với E, tại x nếu − f nửa liên tục dưới, đối với E, tại x. Hay là với mọi dãy { x k } ⊂ E, x k → x, thì lim sup f ( x k ) ≤ f ( x ). Hàm f được gọi là liên tục đối với E, tại x nếu như nó vừa nửa liên tục trên và nửa liên tục dưới, đối với E, tại x. Hàm f được gọi là nửa liên tục dưới, đối với E trong tập A, nếu nó nửa liên tục dưới đối với E, tại mọi điểm thuộc A. Tương tự, ta cũng nói như vậy với hàm nửa liên tục trên và hàm liên tục.Khi f liên tục (nửa liên tục) tai một điểm x, đối với toàn không gian, thì ta nói đơn giản f liên tục (nủa liên tục) tại x. Cho hai hàm f và g xác định trên IRn , ta nói g là bao đóng của f , nếu epig = epi f . Hàm f được gọi là đóng nếu epi f = epi f . Bao đóng của f sẽ được kí hiệu là f . Mệnh đề 8.5. Với mọi hàm f : IRn → IR ∪ {+∞} các điều sau là tương đương: (i) Trên đồ thị của f là một tập đóng trên IRn+1 , nói cách khác f = f . (ii) Với mọi số thực α, tập mức dưới Lα ( f ) : = { x | f ( x ) ≤ α } là một tập đóng. (iii) f nửa liên tục dưới trên IRn . Chứng minh. (i) → (ii). Giả sử x j → x, f ( x j ) ≤ α. Khi dó ( x j , α) ∈ epi f . Do epi f đóng, nên ( x, α) ∈ epi f . Vậy x ∈ L f (α). (ii) → (iii). Giả sử x j → x. Nếu lim inf f ( x j ) < f ( x ), khi đó tồn tại α < f ( x ) sao cho f ( x j ) ≤ α với mọi j đủ lớn. Vậy x j ∈ L f (α)

8.2 Tính liên tục

111

với mọi j đủ lớn. Do x j → x và L f (α) đóng, nên x ∈ L f (α). Tức là f ( x ) ≤ α. Mâu thuẫn với điều ta đã giả sử là α < f ( x ). (iii) → (i). Giả sử ( x j , µ j ) ∈ epi f và ( x j , µ j ) → ( x, µ). Khi đó f ( x j ) ≤ µ j với mọi j. Do (iii), suy ra lim inf f ( x j ) ≥ f ( x ). Vậy µ ≥ f ( x ). Suy ra ( x, µ) ∈ epi f , và do đó epi f là tập đóng.  Mệnh đề 8.6. Đối với một hàm lồi chính thường trên IRn và x0 ∈ int(dom f ), các khẳng định sau đây là tương đương: (i) f liên tục tại điểm x0 . (ii) f bị chặn trên trong một lân cận của x0 , (iii) int(epi f ) 6= ∅. (iv) int(dom f ) 6= ∅ và f liên tục trên tập int(dom f ). Chứng minh. Dễ thấy rằng (i) tương đương với (ii). (ii) → (iii): Giả sử có một lân cận U sao cho f ( x ) ≤ c ∀ x ∈ U. Vậy U × (c, ∞) ⊂ epi f . Do đó int(epi f ) 6= ∅. (iii) → (iv): Do int(epi f ) 6= ∅, nên nếu ( x, µ) ∈ int(epi f ), thì f bị chận trên trong một lân cận của x. Vậy theo phần (i) và (ii), f liên tục tại x. Hơn nữa do int(dom f ) là hình chiếu lên IRn của int(epi f ), tức là int(dom f ) = { x | ∃µ ∈ IR : ( x, µ) ∈ int(epi f )}. Suy ra int(dom f ) 6= ∅. Từ (iv) suy ra (i) là hiển nhiên.



Mệnh đề 8.7. Giả sử f là một hàm lồi chính thường trên IRn . Khi đó f liên tục tại mọi điểm x ∈ int(dom f ).

112

Nhập môn giải tích lồi ứng dụng

Chứng minh. Do f lồi, nên dom f và int(dom f ) là các tập lồi. Khi đó có một đơn hình n-chiều S ⊂ int(dom f ). Giả sử v1 , ..., vn+1 là các đỉnh của đơn hình S. Với mọi x ∈ S, ta có n +1

x=

j

∑ λj v ,

n +1

λ j ≥ 0,

j =1

∑ λ j = 1.

j =1

Do f lồi nên n +1

f (x) ≤

∑ λ j f ( v j ).

j =1

Suy ra f ( x ) ≤ max{ f (v j )| j = 1, ..., n + 1}. Thế nhưng do phần trong của đơn hình S khác rỗng, nên f bị chặn trên trong một lân cận của một điểm x0 ∈ intS và do đó, theo mệnh đề trên, f liên tục trên tập int(dom f ).  Chú ý 8.1. Bằng cách chứng minh hoàn toàn tương tự, ta chứng minh được rằng một hàm lồi chính thường liên tục đối với tập aff(dom f ) tại mọi điểm thuộc ri(dom f ). Hệ quả 8.1. Cho f là một hàm lồi chính thường trên IRn . Khi đó với mọi tập com-pắc C ⊆ int(dom f ), tập f (C) com-pắc. Chứng minh. Do C ⊂ int(dom f ), nên với mọi x ∈ C tồn tại một quả cầu mở U ( x ) tâm ở x, sao cho U ( x ) ⊂ dom f . Do f lồi, nên dom f lồi. Do C com-pắc, nên tồn tại một số hữu hạn các điểm x j ∈ C (j = 1, ..., k) sao cho C ⊂ ∪kj=1U ( x j ). Lấy V ( x j ) := U ( x j ) ∩ C với mọi j = 1, ..., k). Do C ⊂ int(dom f ), nên f liên tục trên tập V ( x j ). Vậy f đạt cực đại và cực tiểu trên tập compact V ( x j ). Đặt M j := max{ f ( x )| x ∈ V ( x j )}; mi := min{ f ( x )| x ∈ V ( xi )} và M := max Mi , m := min mi . i =1,...,k

i =1,...,k

113

8.2 Tính liên tục

Khi đó m ≤ f ( x ) ≤ M với mọi x ∈ C. Do tính liên tục của f và C đóng, nên tập f (C) đóng. Do đó nó com-pắc.  Hàm lồi có tính nửa liên tục trên đối với một tập lồi đa diện. Cụ thể ta có mệnh đề sau: Mệnh đề 8.8. Cho f là một hàm lồi chính thường trên IRn và D ⊆ dom f là một tập lồi đa diện. Khi đó f nửa liên tục trên, đối với tập D, tại mọi điểm của D. Chứng minh. Xét x ∈ D. Bằng phép tịnh tiến (nếu cần), có thể giả thiết x = 0. Giả sử dãy { x k } ⊂ D hội tụ đến x = 0. Gọi G là họ gồm 2n - đơn hình n-chiều. Mỗi đơn hình trong họ này đều có một đỉnh là 0 và n đỉnh còn lại là các điểm thuộc tập hợp {e1 , ..., en , −e1 , ..., −en }, trong đó ei là véc-tơ đơn vị thứ i (i = 1, ..., n). Do x k → 0, nên tồn tại một đơn hình S ∈ G sao cho x k ∈ S với vô hạn k. Để đơn giản, ta ký hiệu luôn dãy vô hạn này là { x k }. Gọi D1 = D ∩ S. Do D là tập đa diện lồi, nên D1 là một đa diện lồi bị chặn. Ký hiệu tập đỉnh của D1 là V1 . Khi đó mọi x k sẽ là tổ hợp lồi của 0 và các điểm của V1 . Tức là x k = (1 −

λk (v))0 +

v∈V1

λk (v)v,

v∈V1

trong đó λk (v) ≥ 0 và ∑v∈V1 λk (v) ≤ 1. Do x k → 0, nên λk (v) → 0 với mọi v ∈ V1 . Mặt khác do f lồi, nên f ( x k ) ≤ (1 −

λk (v)) f (0) +

v∈V1

λ k ( v ) f ( v ).

v∈V1

Chú ý là, do v ∈ V1 ⊂ D ⊂ dom f , nên f (v) < ∞. Từ đây và bất đẳng thức trên, cho k → ∞, ta suy ra lim sup f ( x k ) ≤ f (0). k→∞

Vậy f nửa liên tục trên tại 0 ∈ D.



Hàm lồi còn có tính liên tục Lipschitz. Ta nhắc lại định nghĩa liên tục Lipschitz.

114

Nhập môn giải tích lồi ứng dụng

Định nghĩa 8.3. Một hàm f : IRn → IR được gọi là Lipschitz địa phương tại x với hằng số Lipschitz L nếu tồn tại một lân cận U của x sao cho

|| f ( x ) − f (y)|| ≤ L|| x − y|| ∀ x, y ∈ U. Hàm f được gọi là Lipschitz địa phương trên D nếu nó Lipschitz địa phương tại mọi điểm thuộc D (tất nhiên hằng số Lipschitz có thể khác nhau ở mỗi điểm). Mệnh đề 8.9. Giả sử f là một hàm lồi chính thường trên IRn và bị chặn trên trong một lân cận của một điểm nào đó thuộc một tập mở D ⊆ dom f . Khi đó f Lipschitz địa phương trên tập D. Chứng minh. Không mất tổng quát, ta giả sử 0 ∈ D và f ( x ) ≤ γ < ∞ với mọi x ∈ eB, trong đó e > 0 và B là quả cầu mở đơn vị có tâm ở gốc. Giả sử x ∈ D. Khi đó tồn tại ρ > 1 sao cho điểm y = ρx ∈ D. Với λ = ρ1 tập hợp V := {v|v = (1 − λ) x 0 + λy x 0 ∈ eB} là một lân cận của điểm x := λy. Do f lồi và bị chặn trên bởi γ trong tập eB, nên với mọi v ∈ V, ta có f ( v ) ≤ (1 − λ ) f ( x 0 ) + λ f ( y ) ≤ (1 − λ ) γ + λ f ( y ).

(8.3)

Vậy f bị chặn trên trong lân cận V của x. Hơn nữa với mọi z ∈ V, tồn tại z0 ∈ V sao cho x = 21 (z + z0 ). Lại theo tính lồi của f , ta có f (x) ≤

1 1 f ( z ) + f ( z 0 ). 2 2

Từ đây và (8.3), ta được f ( z ) ≥ 2 f ( x ) − f ( z 0 ) ≥ 2 f ( x ) − (1 − λ ) γ − λ f ( y ).

115

8.2 Tính liên tục

Vậy f bị chặn dưới trên V. Kết hợp lại ta có f bị chặn trong tập V. Do D mở thuộc dom f , nên theo (iv) của Mệnh đề 8.6 f liên tục trên tập D. Chọn δ > 0 sao cho quả cầu B( x ) := x + 2δB ⊂ D và | f (u)| ≤ L0 < ∞ với mọi u ∈ B( x ). Lấy x1 , x2 ∈ x + δB, x1 6= x2 . Ký hiệu α = || x1 − x2 || và đặt δ x 3 = x 2 + ( x 2 − x 1 ). α

(8.4)

Khi đó x3 ∈ B( x ), bởi vì x2 ∈ x + δB. Theo (8.4), thì x2 =

α δ x1 + x3 . α+δ α+δ

Do f lồi, nên f ( x2 ) ≤

α δ f ( x1 ) + f ( x 3 ). α+δ α+δ

Suy ra

α [ f ( x3 ) − f ( x1 )] α+δ α α ≤ | f ( x3 ) − f ( x1 )| ≤ (| f ( x1 )| + | f ( x3 )|), δ δ 1 3 Do | f ( x )| ≤ L0 , | f ( x )| ≤ L0 và α = || x1 − x2 ||, nên ta có tiếp f ( x2 ) − f ( x1 ) ≤

f ( x2 ) − f ( x1 ) ≤

2L0 1 || x − x2 ||. δ

Thay đổi vai trò của x1 và x2 , ta có f ( x1 ) − f ( x2 ) ≤

2L0 1 || x − x2 ||. δ

Kết hợp lại

| f ( x1 ) − f ( x2 )| ≤

2L0 1 || x − x2 || ∀ x1 , x2 ∈ x + δB. δ

Vậy f Lipschizt trong lân cận x + δB của x với hằng số là L = 

2L0 δ .

116

Nhập môn giải tích lồi ứng dụng

Hệ quả 8.2. Nếu f : IRn → IR lồi, thì f Lipschitz địa phương trên toàn IRn (do đó liên tục). Chứng minh. Do f hữu hạn trên toàn không gian, nên int(epi f ) 6= ∅. Theo Mệnh đề 8.6 , f liên tục trên dom f = IRn . Lại theo Mệnh đề 8.6, f bị chặn trên trong một lân cận của dom f . Ap dụng Mệnh đề 8.9 với D = IRn , ta suy ra tính Lipschitz của f trên IRn .  Để kết thúc mục này, ta lưu ý rằng mặc dù hàm lồi có những tính chất đẹp như vừa nêu, nhưng cấu trúc của một hàm lồi cũng khá tuỳ tiện. Hãy xét ví dụ hàm mặt cầu cho ở phần trên. Ta thấy trên mặt cầu hàm lồi chính thường này chỉ cần đòi hỏi nhận giá trị thực không âm.

8.3. Các phép toán bảo toàn tính lồi Cho f và g là hai hàm xác định trên C và không nhận giá trị −∞. Như thường lệ, với mọi x ∈ C, ta định nghĩa các hàm:

( f + g)( x ) := f ( x ) + g( x ), (λ f )( x ) := λ f ( x ), λ là số thực. Mệnh đề dưới đây suy ra trực tiếp từ định nghĩa, nhưng rất bổ ích. Mệnh đề 8.10. (i) Cho f và g là các hàm lồi lần lượt trên các tập lồi A và B, với A ∩ B 6= ∅. Khi đó hàm (λ f ) + ( βg) lồi trên A ∩ B, với mọi λ, β ≥ 0. (ii) Giới hạn theo từng điểm của một dãy các hàm lồi cũng là một hàm lồi. Tức là: nếu f i : C → IR (i ∈ N ) và dãy số { f i ( x )} hội tụ với mỗi x ∈ C, thì hàm f ( x ) := limi →∞ f i ( x ) cũng lồi trên C.

117

8.3 Các phép toán bảo toàn tính lồi

(iii) Nếu f : C → IR lồi trên tập lồi C và hàm một biến ϕ : I → IR không giảm trên khoảng I, sao cho f (C) ⊆ I, thì hàm hợp ϕo f lồi trên C. Dưới đây là một số phép toán khác bảo toàn tính lồi. Mệnh đề 8.11. Nếu F là một tập lồi trong IRn+1 , thì hàm số f ( x ) := inf{µ ∈ IR|(µ, x ) ∈ F} là một hàm lồi trên IRn (như thường lệ, ta qui ước inf trên tập rỗng là +∞). Chứng minh. Giả sử x, y ∈ IRn và r, s ∈ IR thỏa mãn f ( x ) < r, f (y) < s. Theo định nghĩa của cận dưới đúng, ta có µ ∈ IR, ν ∈ IR, sao cho (µ, x ) ∈ F, (ν, y) ∈ F và µ < r, ν < s. Do F là tập lồi, nên với mọi λ ∈ [0, 1], ta có:

(λµ + (1 − λ)ν, λx + (1 − λ)y) ∈ F. Từ đây và theo định nghĩa của f , suy ra f (λx + (1 − λ)y) ≤ λµ + (1 − λ)ν. Vậy theo Mệnh đề 8.1 f lồi.



Mệnh đề 8.12. Giả sử f 1 , ..., f m là các hàm lồi chính thường trên IRn . Khi đó hàm tổng chập f ( x ) := inf{ f 1 ( x1 ) + ... + f m ( x m )| x1 + ... + x m = x } sẽ là một hàm lồi trên IRn . Chứng minh. Đặt F = ∑m j=1 epi f j . Do đó F là tập lồi và ( x, µ) ∈ F khi và chỉ khi tồn tại ( x j , µ j ) ∈ epi f j với j = 1, ..., m sao cho m

m

∑ µ j = µ,

∑ x j = x.

j =1

j =1

118

Nhập môn giải tích lồi ứng dụng

Từ đây và theo định nghĩa, ta thấy hàm tổng chập chính là hàm được xác định theo Mệnh đề 8. 11 Do đó nó là hàm lồi.  Chú ý rằng hàm tổng chập của hai hàm f 1 và f 2 có thể viết được ( f 1 ⊕ f 2 )( x ) = inf{ f 1 ( x − y) + f 2 (y)} y

Mệnh đề 8.13. Cho A ⊆ IRm , B ⊆ IRn là các tập lồi. Giả sử ϕ : A × B → IR ∪ {+∞} là một hàm lồi trên A × B. Khi đó f ( x ) := inf ϕ( x, y) y∈ B

là một hàm lồi trên A. Chứng minh. Giả sử x1 , x2 ∈ A và λ ∈ [0, 1] và x = λx1 + (1 − λ) x2 . Theo tính chất của cận dưới đúng, với mỗi i = 1, 2 ta có dãy yi,k ∈ B sao cho ϕ( xi , yi,k ) → f ( xi ), (i = 1, 2) Theo định nghĩa của f và do tính lồi (đồng thời hai nhóm biến x và y), ta có f ( x ) ≤ ϕ[λx1 + (1 − λ) x2 , λy1,k + (1 − λ)y2,k ] ≤ λϕ( x1 , y1,k ) + (1 − λ) ϕ( x2 , y2,k ). Cho k → ∞, ta được f ( x ) ≤ λ f ( x 1 ) + (1 − λ ) f ( x 2 ). Vậy f lồi trên tập A.



Định nghĩa 8.4. Giả sử { f α }α∈ I là một họ tùy ý các hàm số trên IRn và E ⊆ IRn . Hàm cận trên của họ hàm này trên coE, ký hiệu là ∨α∈ I f α là hàm số được định nghĩa như sau:

(∨α∈ I f α )( x ) := sup f α ( x ) α∈ I

với mỗi x ∈ coE.

119

8.3 Các phép toán bảo toàn tính lồi

Như ta sẽ thấy ở mệnh đề dưới đây, hàm cận trên của một họ các hàm lồi là một hàm lồi. Hàm cận dưới: của họ { f α } trên tập coE, ký hiệu ∧α∈ I f α , là hàm số được định nghĩa như sau:

(∧α∈ I f α )( x ) := inf f α ( x ) α∈ I

với mỗi x ∈ coE. Hàm cận dưới của một họ các hàm lồi không nhất thiết là một hàm lồi. Khi đó ta định nghĩa một hàm lồi gọi là bao lồi cận dưới theo nghĩa sau: Bao lồi cận dưới: của họ hàm { f α }α∈ I trên coE, ký hiệu co(∧α∈ I f α ), được định nghĩa như sau: co(∧α∈ I f α )( x ) := inf{µ ∈ IR| x ∈ coE, ( x, µ) ∈ co(∪α∈ I epi f α )}. Từ định nghĩa ta thấy rằng bao lồi cận dưới của một họ hàm { f α } là hàm lồi trên coE có tính chất sau: (i) Là hàm lồi non của hàm cận dưới, tức là: co(∧α∈ I f α )( x ) ≤ (∧α∈ I f α )( x ) ∀ x ∈ coE. (ii) Nếu ϕ cũng là một hàm lồi non của hàm cận dưới trên coE, thì ϕ( x ) ≤ co(∧α∈ I f α )( x ) ∀ x ∈ coE. Như vậy bao lồi cận dưới là hàm lồi lớn nhất trong các hàm lồi nhỏ hơn hàm cận dưới của họ { f α }. Trong trường hợp riêng quan trọng, khi { f α } chỉ có duy nhất một phần tử f , ta nói bao lồi cận dưới của hàm f là hàm bao lồi của f và ký hiệu là co f . Như vậy epi(co f ) = co(epi f ) ∩ (coE × IR).

120

Nhập môn giải tích lồi ứng dụng

Mệnh đề 8.14. Giả sử { f α } là một họ hàm lồi trên IRn và E ⊆ IRn . Khi đó hàm cận trên và hàm bao lồi cận dưới của họ này là các hàm lồi trên coE và có trên đồ thị thuộc coE × IR. Chứng minh. Hàm cận trên ∨α∈ I f α lồi vì trên đồ thị của nó là ∩α∈ I epi f α ∩ (coE × IR). Hàm bao lồi cận dưới co(∧α∈ I f α ) lồi là do Mệnh đề 8.11. Theo định nghĩa trên đồ thị của bao lồi cận dưới (có thể bằng rỗng) thuộc tập lồi coE × IR.  Trong những phương pháp giải các bài toán tối ưu không lồi, bao lồi cận dưới có một vai trò quan trọng trong việc xấp xỉ các hàm không lồi bởi các hàm lồi. Tuy nhiên, cũng như việc tính bao lồi của một tập, việc tính bao lồi cận dưới cũng là một vấn đề khó khăn. Dưới đây ta xét vấn đề này trong trường hợp họ hàm chỉ gồm duy nhất một hàm số f . Để đơn giản ký kiệu, giả sử rằng E lồi. Theo định nghĩa hàm bao lồi của f trên E, ta có: co f ( x ) = inf{µ|( x, µ) ∈ co(epi f ), x ∈ E}. Do

( x, µ) ∈ co(epi f ), x ∈ E, nên theo định nghĩa của bao lồi, với mỗi x ∈ E, tồn tại tập chỉ số J ( x ) và các số thực λ j (j ∈ J ( x )) sao cho:

λ j ≥ 0 ∀ j ∈ J ( x ),

λ j = 1.

j∈ J (x)

x=

λ j x j , x j ∈ E,

j∈ J (x)

µ=

λ j µ j và ( x j , µ j ) ∈ epi f .

j∈ J (x)

Do f ( x j ) ≤ µ j với mọi j, nên co f ( x ) = inf



∑ j∈ J (x)

λj f (x j )

121

8.3 Các phép toán bảo toàn tính lồi với điều kiện x=

λ j x j , x j ∈ E, λ j ≥ 0, j ∈ J ( x ),

λ j = 1.

j∈ J (x)

j∈ J (x)

Theo định lý Carathéodory, nếu dimE = k, thì ta có thể giả thiết tập chỉ số J ( x ) chỉ có (k + 1) phần tử. Những điều trên đã chứng minh mệnh đề sau: Mệnh đề 8.15. Cho f là một hàm số thực trên IRn và E ⊆ IRn với dimE = k. Khi đó hàm bao lồi của f trên tập lồi E được xác định như sau k+1

k+1

j =1

j =1

co f ( x ) = min{ ∑ λ j f ( x j )| x =

λ j x j , x j ∈ E, λ j ≥ 0,

k+1

∑ λ j = 1}.

j =1

Trong nhiều ứng dụng, E là một tập lồi đa diện bị chặn (gọi tắt là đa diện lồi). Khi đó, nếu dimE = k, thì E có ít nhất k + 1 đỉnh và theo định lý Carathéodory mọi điểm của E đều là tổ hợp lồi của không quá k + 1 đỉnh của E. Hệ quả 8.3. Giả sử f là một hàm lõm nhận giá trị hữu hạn trên tập đa diện lồi C ⊂ IRn với dimC = k. Khi đó hàm bao lồi co f được xác định như sau:

k+1

k+1

k+1

j =1

j =1

j =1

F( x ) = min{ ∑ λ j f (v j )| x =

∑ λ j v j , v j ∈ V (C), λ j ≥ 0, ∑ λ j = 1}.

Chứng minh. Trước tiên ta thấy rằng hàm F được định nghĩa như trên là một hàm lồi, hữu hạn trên C. Thật vậy, theo định lý biểu diễn tập lồi, mọi điểm x ∈ C đều biểu diễn được dưới dạng tổ hợp lồi của các đỉnh của C, nên với mọi x ∈ C, miền chấp nhận được của bài toán xác định F( x ) khác rỗng, compact. Vậy F( x ) hữu hạn với mọi x ∈ C.

122

Nhập môn giải tích lồi ứng dụng

Giả sử x, y ∈ C và t ∈ (0, 1). Ký hiệu λ và ξ là nghiệm của bài toán xác định F( x ) và F(y). Vậy x = ∑kj=1 λ j v j , y = ∑kj=1 ξ j v j . Đặt z := tx + (1 − t)y. Khi đó z = ∑kj=1 [tλ j + (1 − t)ξ j ]v j , nên véc-tơ tλ + (1 − t)ξ là điểm chấp nhận được của bài toán xác định F(z). Do đó k

F (z) ≤

∑ [tλ j + (1 − t)ξ j ] F(v j ) j =1

k

k

j =1

j =1

\= t ∑ λ j f ( v j ) + (1 − t ) ∑ ξ j f ( v j ) = tF( x ) + (1 − t) F(y). Chứng tỏ F lồi trên C. Theo mệnh đề trên và theo định nghĩa của F( x ), ta có co f ( x ) ≤ F( x ) với mọi x ∈ C. Theo định lý Carathéodory mọi x ∈ C đều có dạng x=

k+1

k+1

j =1

j =1

∑ λ j v j , ∑ λ j = 1, λ j ≥ 0,

v j ∈ V (C) ∀ j.

Do f lõm trên C và do định nghĩa của F, ta lại có k+1

f (x) ≥

∑ λ j f (v j ) ≥ F(x) ∀ x ∈ C.

j =1

Vậy F là một hàm lồi non của f trên C. Kết hợp lại, ta được co f ( x ) = F( x ) với mọi x ∈ C.  Chú ý. Theo định lý Carathéodory, số các đỉnh của C cần đến trong biểu diễn x tối đa là k + 1. Tuy nhiên do các đỉnh trong mỗi biểu diễn có thể khác nhau, nên trong thực tế vẫn cần đến tất cả các đỉnh của C. Nói chung, về phương diện tính toán, việc xác định tất cả các đỉnh của một đa diện lồi là một bài toán khó. Do

123

8.3 Các phép toán bảo toàn tính lồi

đó việc tính hàm bao lồi là một vấn đề phức tạp. Mệnh đề dưới đây xét việc tính hàm bao lồi của một hàm lõm trên một đơn hình. Trong trường hợp này ta có công thức giải tích của hàm bao lồi, theo mệnh đề dưới đây. Mệnh đề 8.16. Giả sử S ⊆ IRn là một đơn hình có các đỉnh là v0 , ..., vn và f : S → IR là một hàm lõm. Khi đó hàm bao lồi của f trên S là một hàm a-phin l ( x ) = aT x + b, trong đó a ∈ IRn và b ∈ IR là nghiệm của hệ phương trình tuyến tính aT v j + b = f (v j ), j = 0, 1, ..., n. Chứng minh. Lấy mỗi phương trình của hệ aT v j + b = f (v j ), j = 0, 1, ..., n trừ cho phương trình đầu tiên, ta được

(v0 − v j )T a = f (v0 ) − f (v j ), j = 1, ..., n. Do các véc-tơ v0 − v j (j = 1, ..., n) độc lập tuyến tính, nên nghiệm a của hệ trên được xác định duy nhất, và từ đó b cũng được xác định duy nhất. Ta thấy rằng hàm l là hàm non của f , vì mọi x ∈ S đều biểu diễn được dưới dạng x = ∑nj=0 λ j v j . Do f lõm trên S, nên n

f (x) = f [ ∑ λ j v j ] ≥ j =0

n

n

∑ λ j f (v j ) =

∑ λ j l ( v j ) = l ( x ).

j =0

j =0

Hơn nữa, nếu F là một hàm lồi non của f trên S, thì n

F( x) = F( ∑ λ j v j ) ≤ j =0

n

∑ λ j F (v j ) j =0

n

n

j =0

j =0

∑ λ j f j ( v j ) = ∑ λ j l ( v j ) = l ( x ).

Chứng tỏ l là hàm lồi non lớn nhất trong các hàm lồi non của f trên S. 

124

Nhập môn giải tích lồi ứng dụng

8.4. Bài tập I 8.1. Hàm số f : IR2 → IR cho bởi f ( x, y) := xy có lồi không? I 8.2. Chứng tỏ rằng hàm | x p | với p ≥ 1 lồi trên IR và hàm p ∑in=1 | xi | lồi trên IRn . I 8.3. Chứng minh rằng nếu f : C → IR ∪ {+∞} là một hàm lồi trên tập lồi C ⊆ IR2 , thì hàm f (., y) lồi trên tập D := { x | ( x, y) ∈ C}. Điều khẳng định ngược lại rằng nếu f lồi theo từng biến (khi biến khác cố định) thì sẽ lồi theo cả hai biến có đúng không? Nếu sai, cho phản ví dụ. I 8.4. Cho C là một tập lồi và f : C → IR có tính chất 1 1 1 1 ∀ x, y ∈ C ⇒ f ( x + y) ≤ f ( x ) + f (y). 2 2 2 2 Hàm này có lồi trên C không?

I 8.5. Cho C là một tập lồi và f : C → IR ∪ {+∞}. Chứng minh rằng f lồi trên C khi và chỉ khi với mọi x và y thuộc C, hàm một biến ϕ(t) := f (tx + (1 − t)y) lồi trên đoạn [0, 1]. I 8.6. Chứng minh rằng một hàm lồi mạnh với hệ số lồi η khi và η chỉ khi hàm ϕ(.) := f (.) − 2 ||.||2 lồi. I 8.7. Cho một ví dụ về hàm tổng chập của hai hàm lồi hữu hạn trên toàn không gian lại là hàm đồng nhất −∞. I 8.8. Cho δ( x ) :=



0 nếu 0 ≤ x ≤ 1 +∞ nếu trái lại.

Hàm δ này có nửa liên tục trên trên tập D = [0, 1] = domδ không?

I 8.9. Hãy cho một hàm mặt cầu f không nửa liên tục dưới và tính hàm bao đóng f của f .

125

8.4 Bài tập

I 8.10. Cho hàm tách biến f ( x1 , ...xn ) := ∑in=1 f i ( xi ) xác định trên siêu hộp C := { x ∈ IRn |l ≤ x ≤ u}. Chứng minh rằng hàm bao lồi của hàm tổng trên một siêu hộp bằng tổng hàm bao lồi của các hàm thành phần trên mỗi cạnh của siêu hộp. Tức là: co f ( x ) =

n

∑ co fi (xi ), i =1

trong đó co f i ( xi ) là hàm bao lồi của f i trên cạnh thứ i của siêu hộp C. Nếu thay C bằng đơn hình chuẩn trong IRn , thì điều khẳng định trên có còn đúng không?

I 8.11. Cho f ( x, y) := xy. Tính hàm bao lồi co f của f trên hình hộp C := {( x, y) ∈ IR2 | α ≤ x ≤ β, ξ ≤ y ≤ µ}. Chỉ dẫn. Hàm bao lồi này là max của hai hàm aphin. Một hàm được xác định theo các cận dưới α và ξ; hàm kia được xác định theo các cận trên β và µ.

126

Nhập môn giải tích lồi ứng dụng

Chương 9 TÍNH CHẤT CỰC TRỊ, BẤT ĐẲNG THỨC LỒI VÀ ĐỊNH LÝ HELLEY

9.1. Cực đại và cực tiểu của hàm lồi . . . . . . . . . . . . . .

128

9.2. Hạng của hàm lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . .

135

9.3. Bất đẳng thức lồi. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

139

9.4. Định lý Helley . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

143

9.5. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

148

Cực trị (cực đại, cực tiểu) của một hàm lồi trên một tập lồi có những tính chất riêng, lý thú. Sự nghiên cứu về tính chất cực trị của một hàm lồi trên một tập lồi là một đề tài quan trọng của lý thuyết tối ưu. Chương này trước hết giới thiệu một số tính chất chung về cực tiểu và cực đại của một hàm lồi trên một tập lồi. Tiếp theo trình bày về hạng của hàm lồi, đại lượng đo "mức độ phi tuyến" của nó. Tính chất cực trị của hàm lồi có liên quan chặt chẽ với các bất đẳng thức lồi sẽ được đề cập trong phần tiếp theo. Cuối chương là các định lý Helley về sự tương giao của các tập lồi.

128

Nhập môn giải tích lồi ứng dụng

9.1. Cực đại và cực tiểu của hàm lồi Trong nhiều vấn đề ứng dụng ta thường gặp bài toán tìm cực tiểu hoặc cực đại của một hàm lồi trên một tập lồi. Hai bài toán này có những tính chất cơ bản rất khác nhau. Tuy nhiên tính chất lồi kéo theo những đặc thù riêng cho mỗi bài toán. Lợi dụng các tính chất này, người ta đã đưa ra được những phương pháp giải quyết khác nhau cho mỗi bài toán kể trên. Định nghĩa 9.1. Cho C ⊆ IRn khác rỗng và f : IRn → IR. Một điểm x ∗ ∈ C được gọi là cực tiểu địa phương của f trên C nếu tồn tại một lân cận U của x ∗ sao cho f ( x ∗ ) ≤ f ( x ) ∀ x ∈ U ∩ C. Điểm x ∗ ∈ C được gọi là cực đại địa phương nếu f ( x ) ≤ f ( x ∗ ) ∀ x ∈ U ∩ C. Nếu f ( x ) ≥ f ( x ∗ ) ∀ x ∈ C, thì x ∗ được gọi là cực tiểu toàn cục hay cực tiểu tuyệt đối của f trên C, và nếu f ( x ) ≤ f ( x ∗ ) ∀ x ∈ C, thì x ∗ được gọi là cực đại toàn cục hay cực đại tuyệt đối của f trên C. Cực tiểu hàm lồi. Mệnh đề dưới đây cho thấy mọi điểm cực tiểu địa phương của một hàm lồi trên một tập lồi cũng chính là điểm cực tiểu tuyệt đối. Điều này rất quan trọng vì nó cho phép sử dụng các công cụ mang tính địa phương như phép tính vi phân trong việc xây dựng lý thuyết và các phương pháp giải cho bài toán này.

9.1 Cực đại và cực tiểu của hàm lồi

129

Mệnh đề 9.1. Cho f : IRn → IR ∪ {+∞} lồi. Khi đó mọi điểm cực tiểu địa phương của f trên một tập lồi đều là cực tiểu toàn cục. Hơn nữa tập hợp các điểm cực tiểu của f là một tập lồi. Nếu f lồi chặt, thì điểm cực tiểu, nếu tồn tại, sẽ duy nhất. Chứng minh. Cho C ⊆ IRn . Giả sử x ∗ là điểm cực tiểu địa phương của f trên C. Khi đó tồn tại lân cận U của x ∗ sao cho f ( x ) ≥ f ( x ∗ ) ∀ x ∈ U ∩ C. Với mọi x ∈ C, và 0 < λ < 1, do C lồi và U là lân cận của ∈ C, nên điểm xλ := (1 − λ) x ∗ + λx ∈ C ∩ U khi λ đủ nhỏ. Do f ( x ∗ ) ≤ f ( xλ ) và f lồi, ta có x∗

f ( x ∗ ) ≤ f ( x λ ) ≤ (1 − λ ) f ( x ∗ ) + λ f ( x ). Từ đây suy ra f ( x ∗ ) ≤ f ( x ). Chứng tỏ x ∗ là cực tiểu toàn cục của f trên C. Giả sử x ∗ , y∗ ∈ C là các điểm cực tiểu của f trên C. Vậy f ( x ∗ ) = f (y∗ ) ≤ f ( x ) với mọi x ∈ C. Lấy z∗ := λx ∗ + (1 − λ)y∗ , với 0 < λ < 1. Do C lồi, nên z∗ ∈ C và do f lồi, nên f ( z ∗ ) ≤ λ f ( x ∗ ) + (1 − λ ) f ( y ∗ ) ≤ f ( x ). Suy ra z∗ cũng là điểm cực tiểu của f trên C. Chứng tỏ tập các điểm cực tiểu của f trên C là lồi. Dễ thấy rằng tập hợp này chỉ gồm nhiều nhất một điểm khi f lồi chặt.  Mệnh đề trên mang tính chất định tính. Mệnh đề dưới đây mang nhiều tính chất định lượng. Ta hãy xét bài toán tìm cực tiểu một hàm lồi trên một tập lồi có dạng sau:

(OP)



min f ( x ) với các điều kiện gi ( x ) ≤ 0, i = 1, ..., m, h j ( x ) = 0, j = 1, ..., k x∈X

130

Nhập môn giải tích lồi ứng dụng

trong đó X ⊆ IRn là một tập lồi đóng khác trống và f , gi (i = 1, ..., m) là các hàm lồi hữu hạn trên X, còn h j ( j = 1, ..., k) là các hàm a-phin hữu hạn trên tập a-phin của X. Ta sẽ luôn giả sử rằng X có điểm trong và các hàm a-phin h j ( j = 1, ..., k) độc lập tuyến tính trên X, theo nghĩa, nếu ∑kj=1 µ j h j ( x ) = 0 với mọi x ∈ X, thì µ j = 0 với mọi j. Bài toán (OP) này được gọi là một quy hoạch lồi. Hàm f được gọi là hàm mục tiêu. Các điều kiện x ∈ X, gi ( x ) ≤ 0 (i = 1, ...m), h j ( x ) = 0, ( j = 1, ..., k) được gọi là các ràng buộc. Tập D := { x ∈ X | gi ( x ) ≤ 0 i = 1, ..., m, h j ( x ) = 0, j = 1, ..., k} được gọi là miền chấp nhận được. Một điểm x ∈ D được gọi là điểm chấp nhận được của bài toán (OP). Do X là tập lồi, các hàm gi (i = 1, ..., m) lồi trên X và h j (j = 1, ..., k) a-phin, nên D là một tập lồi. Điểm cực tiểu của f trên D cũng được gọi là nghiệm tối ưu của bài toán (OP). Ta xây dựng hàm sau, được gọi là hàm Lagrange, cho bài toán (OP): m

k

i =1

j =1

L( x, λ, µ) := λ0 f ( x ) + ∑ λi gi ( x ) + ∑ µ j h j ( x ). Dựa vào hàm Lagrange, ta có kết quả sau: Định lý 9.1 (Karush-Kuhn-Tucker). Nếu x ∗ là nghiệm của bài toán quy hoạch lồi (OP), thì tồn tại λi∗ ≥ 0 (i = 0, 1, ..., m) và µ∗j (j = 1, ..., k) không đồng thời bằng 0 sao cho L( x ∗ , λ∗ , µ∗ ) = min L( x, λ∗ , µ∗ ) (điều kiện đạo hàm triệt tiêu) x∈X

λi∗ gi ( x ∗ ) = 0 (i = 1, .., m) (điều kiện độ lệch bù) Hơn nữa nếu intX 6= ∅ và điều kiện Slater sau thoả mãn

∃ x0 ∈ D : gi ( x0 ) < 0 (i = 1, ..., m)

131

9.1 Cực đại và cực tiểu của hàm lồi

thì λ0∗ > 0 và hai điều kiện đạo hàm triệt tiêu và độ lệch bù ở trên, cũng là điều kiện đủ để điểm chấp nhận được x ∗ là nghiệm tối ưu của bài toán (OP). Chứng minh. Giả sử x ∗ là nghiệm của (OP). Đặt C := {(λ0 , λ1 , ..., λm , µ1 , ..., µk )| (∃ x ∈ X ) : f ( x ) − f ( x ∗ ) < λ0 , gi ( x ) ≤ λi , i = 1, ..., m, h j ( x ) = µ j j = 1, ..., k} Do X 6= ∅ lồi, f , gi lồi và h j a-phin hữu hạn trên X, nên C là một tâp lồi, khác trống trong IRm+k+1 . Hơn nữa 0 6∈ C. Thật vậy, vì nếu trái lại 0 ∈ C, thì tồn tại một điểm chấp nhận được x thoả mãn f ( x ) < f ( x ∗ ). điều này mâu thuẫn với việc x ∗ là nghiệm tối ưu của (OP). Khi đó theo định lý tách 1, tồn tại λi∗ (i = 0, 1, ..., m), µ∗j ( j = 1, ..., k) không đồng thời bằng 0 sao cho m

k

∑ λi∗ λi + ∑ µ∗j µ j ≥ 0 ∀(λ0 , ..., λm , µ1, ..., µk ) ∈ C. i =0

(9.1)

j =1

Chú ý rằng với mọi λ0 , ..., λm > 0, thì (λ0 , ..., λm , 0, ..., 0) ∈ C, vì theo định nghĩa của C ta chỉ lấy x = x ∗ . Từ chú ý này, ta suy ra ngay tất cả λ0∗ , λ1∗ , ..., λ∗m ≥ 0. Hơn nữa, với mọi e > 0 và x ∈ X, ta lấy λ0 = f ( x ) − f ( x ∗ ) + e, λi = gi ( x ) (i = 1, ..., m), µ j = h j ( x ) (i = 1, ..., k) rồi thay vào (9.1) và cho e → 0, sẽ được m

k

i =1

i =1

λ0∗ f ( x ) + ∑ λi∗ gi ( x ) + ∑ µi∗ hi ( x ) ≥ λ0∗ f ( x ∗ ) +

m

∑ i =1

λi∗ gi ( x ∗ ) +

k

∑ µi∗ hi (x∗ ) ∀ x ∈ X.

i =1

Hay L( x ∗ , λ∗ , µ∗ ) ≤ L( x, λ∗ , µ∗ ) ∀ x ∈ X.

132

Nhập môn giải tích lồi ứng dụng

Đây chính là điều kiện đạo hàm triệt tiêu. Để chứng minh điều kiện độ lệch bù, ta chú ý rằng do x ∗ chấp nhận được, nên gi ( x ∗ ) ≤ 0 với mọi i. Nếu như tồn tại một i nào đó mà gi ( x ∗ ) = ξ < 0, thì với mọi e > 0, ta có

(e, ..., ξ, e, ...., e, 0, ..., 0) ∈ C ( ξ ở vị trí thứ i + 1) Thay vào (9.1) và cho e → 0, ta thấy λi∗ ξ ≥ 0. Nhưng ξ < 0, nên λi∗ ≤ 0. Suy ra λi∗ = 0. Điều kiện độ lệch bù do đó cũng được thoả mãn. Để chứng minh điều kiện đủ, ta giả sử điều kiện Slater thoả mãn. Ta có λ0∗ > 0. Thật vậy, vì nếu λ0∗ = 0, thì do điều kiện đạo hàm triệt tiêu và điều kiện độ lệch bù, ta có m

0=

∑ i =1

λi∗ gi ( x ∗ ) +

k

∑ j =1

µ∗j h j ( x ∗ )

m

∑ i =1

λi∗ gi ( x ) +

k

∑ µ∗j h j (x) ∀ x ∈ X.

j =1

Thế nhưng do λ0∗ = 0, nên phải có hoặc λi∗ > 0 với một i nào đó, hoặc nếu λi∗ = 0 với mọi i, thì sẽ có µ∗j > 0 với một j nào đó. Trong trường hợp đầu, thay x0 vào bất đẳng thức trên, sẽ được m

0=

∑ λi∗ gi (x∗ ) +

k

∑ µ∗j h j (x∗ ) ≤

m

∑ λi∗ gi (x0 ) + ∑ µ∗j h j (x0 ) < 0.

k

i =1

j =1

i =1

j =1

Mâu thuẫn. Trong trường hợp sau, ta có k

0=

∑ j =0

µ∗j h j ( x ∗ )

k

∑ µ∗j h j (x) ∀ x ∈ X. j =0

Do intX 6= ∅ và h j a-phin với mọi j, nên từ đây suy ra ∑kj=0 µ∗j h j ( x ) = 0 ∀ x ∈ X. Từ đây và do các hàm h j độc lập tuyến tính trên X, ta có µ∗j = 0 với mọi j. Điều này mâu thuẫn với việc tất cả các nhân tử λi∗ và µ∗j không đồng thời bằng 0. Vậy λ0∗ > 0.

133

9.1 Cực đại và cực tiểu của hàm lồi

Do λ0∗ > 0, nên bằng cách chia cho λ0∗ > 0, ta có thể coi hàm Lagrange là m

k

L( x, λ, µ) = f ( x ) + ∑ λi gi ( x ) + ∑ µ j h j ( x ) i =1

j =1

Do điều kiện đạo hàm triệt tiêu và độ lệch bù, nên với mọi x chấp nhận được, ta có: m

k

i =1

j =1

f ( x ∗ ) = f 0 ( x ∗ ) + ∑ λ i gi ( x ∗ ) + ∑ µ j h j ( x ∗ ) m

k

i =1

j =1

≤ f ( x ) + ∑ λ i gi ( x ) + ∑ µ j h j ( x ) ≤ f ( x ) Chứng tỏ x ∗ là lời giải tối ưu của (OP).

.

Chú ý. Khi X là tập mở (nói riêng là toàn không gian) và mọi hàm đều khả vi, thì điều kiện đạo hàm triệt tiêu sẽ là m

k

j =1

i =1

0 = λ0∗ ∇ f 0 ( x ∗ ) + ∑ λ∗j ∇ g j ( x ∗ ) + ∑ µi∗ ∇hi ( x ∗ ). Cực đại hàm lồi Các tính chất cực đại của một hàm lồi khác hẳn các tính chất về cực tiểu của nó. Cụ thể ta thấy rằng cực đại địa phương của một hàm lồi không nhất thiết là cực đại tuyệt đối. Ví dụ hàm f ( x ) = x2 có điểm cực đại địa phương trên đoạn [−1, 2] là x = −1, nhưng điểm cực đại tuyệt đối lại là x = 2. Nếu xét hàm này trên đoạn [−2, 2] ta thấy tập các điểm cực đại tuyệt đối của nó trên đoạn này là không lồi vì nó chỉ gồm hai điểm −2 và 2. Dưới đây, nếu không nói gì thêm, ta luôn hiểu cực đại là cực đại tuyệt đối. Từ định nghĩa hàm lồi, ta thấy rằng, nếu f lồi chính thường trên một tập lồi C và a, b ∈ C, thì với mọi x thuộc đoạn (a, b), tức là x = λa + (1 − λ)b, 0 < λ < 1, ta có f ( x ) ≤ λ f (a) + (1 − λ) f (b) ≤ max{ f (a), f (b)}.

134

Nhập môn giải tích lồi ứng dụng

Từ đây suy ra rằng cực đại của một hàm lồi f trên một đoạn [ a, b] đạt tại đầu mút của đoạn đó. Một cách tổng quát ta có: Mệnh đề 9.2. (i) Giả sử f là một hàm lồi chính thường trên IRn và C ⊆ IRn là một tập lồi. Khi đó nếu f đạt cực đại trên C tại một điểm trong tương đối của C, thì f là hằng số trên C. (ii) Nếu f là một hàm lồi, chính thường trên IRn và bị chặn trên trong một tập a-phin, thì nó là hằng số trên tập này. Chứng minh. (i) Giả sử a ∈ riC là điểm tại đó f đạt cực đại của nó trên C. Theo tính chất của điểm trong tương đối, nên với mọi x ∈ C, đều tồn tại y ∈ C sao cho a ∈ ( x, y). Do f ( x ) ≤ f (a) , f (y) ≤ f (a), và f lồi, theo nhận xét ở trên, ta suy ra f ( x ) = f (a). (ii) Nếu f không là hằng số trên tập a-phin M, có nghĩa là tồn tại a, b ∈ M sao cho f (a) < f (b). Mọi điểm x thuộc nửa đường thẳng xuất phát từ a và có hướng b − a đều có dạng x = a + λ(b − a) với λ > 0. Khi đó b=

λ−1 1 x+ a. λ λ

Với mọi λ > 1, theo tính lồi của f ta có f (b) ≤

λ−1 1 f (x) + f ( a ). λ λ

Từ đây và do giả thiết f ( x ) ≤ m < ∞ với mọi x ∈ M, ta suy ra f (b) − f ( a) ≤

1 1 1 f ( x ) − f (a) ≤ [m − f (a)]. λ λ λ

Điều này đúng với mọi λ > 1, nên khi cho λ → +∞ ở vế phải, do f (a) hữu hạn, nên vế phải tiến tới 0, trong khi đó theo giả thiết, vế trái f (b) − f (a) > 0. Mâu thuẫn. Vậy f phải là hằng số trên tập a-phin M. 

9.2 Hạng của hàm lồi

135

Hệ quả 9.1. Nếu một hàm lồi đạt cực đại trên một tập lồi có điểm cực biên, thì cực đại sẽ đạt tại một điểm cực biên của tập lồi đó. Chứng minh. Giả sử x ∗ là điểm cực đại của f trên tập lồi C. Nếu x ∗ không phải điểm cực biên của C, thì tồn tại a, b ∈ C và λ ∈ (0, 1) sao cho x ∗ = λa + (1 − λ)b. Theo (i) của Mệnh đề 9.2, ta có: f ( x ∗ ) = f ( x ) với mọi x ∈ [ a, b].  Hệ quả 9.2. Cho Γ := {λd|λ ≥ 0} và Γa := a + Γ với a, d ∈ IRn . Giả sử f là một hàm lồi chính thường trên IRn và f bị chặn trên trên nửa đường thẳng Γa . Khi đó f bị chặn trên trên mọi nửa đường thẳng song song với Γa . Ngoài ra cực đại của f trên nửa đường thẳng Γa đạt tại đầu mút của nó. Chứng minh. Do f bị chặn trên trên tia Γa , nên Γa ⊂ dom f . Nếu Γb //Γa , thì Γb ⊂ dom f .  Theo Hệ quả 9.2 tính bị chặn trên của một hàm lồi trên một nửa đường thẳng không phụ thuộc vào đầu mút của nửa đường thẳng mà chỉ phụ thuộc vào hướng của nó.

9.2. Hạng của hàm lồi Từ định nghĩa, ta đã thấy rằng một hàm a-phin là một hàm vừa lồi vừa lõm. Trong trường hợp này bài toán cực đại hay cực tiểu hàm tuyến tính đều có tất cả các tính chất về cực tiểu và cực đại hàm lồi, nêu ở mục trên. Điều này gợi ý đến việc xem xét "mức độ tuyến tính" của một hàm lồi. Một câu hỏi được đặt ra là: nếu một hàm lồi không là hàm aphin, thì "mức độ phi tuyến "của nó như thế nào. Hạng của một hàm lồi chính là đại lượng đo mức độ phi tuyến của nó. Giả sử f là một hàm lồi chính thường trên IRn . Khi đó với mỗi

136

Nhập môn giải tích lồi ứng dụng

α ∈ IR, tập L f (α ) := { x : f ( x ) ≤ α } là lồi. Tập này thường được gọi là tập mức dưới. Tập U f (α ) := { x : f ( x ) ≥ α } được gọi là tập mức trên. Dĩ nhiên khi α càng lớn, thì tập mức dưới ứng với nó càng rộng. Tuy nhiên tất cả các tập mức dưới đều có chung một nón lùi xa và một không gian thẳng. Cụ thể ta có mệnh đề sau: Mệnh đề 9.3. Cho f là một hàm lồi, chính thường, nửa liên tục dưới trên IRn . Khi đó tất cả các tập mức dưới L f (α) (nếu khác rỗng) đều có chung một nón lùi xa và một không gian thẳng. Nón lùi xa là tập hợp hướng của các nửa đường thẳng, theo đó hàm f bị chặn trên, còn không gian thẳng là không gian con song song với không gian a-phin trên đó f là hằng số. Chứng minh. Giả sử Γa là một hướng xuất phát từ a, theo đó f bị chặn trên. Với bất kỳ α ∈ IR và a ∈ L f (α), do f lồi và bị chặn trên trên Γa , nên cực đại của f trên Γa đạt tại đầu mút a. Tức là f ( x ) ≤ f (a) với mọi x ∈ Γa . Suy ra Γa ⊆ L f ( f (a)). Ngược lại, nếu Γa là một hướng thuộc nón lùi xa của tập mức dưới L f (α), thì Γa ⊂ L f (α) với mọi a ∈ L f (α). Vậy f ( x ) ≤ α với mọi x ∈ Γa . Chứng tỏ f bị chặn trên trên nửa đường thẳng Γa . Phần khẳng định về không gian thẳng của tập mức dưới nêu trong mệnh đề được suy ra từ định nghĩa của không gian thẳng và tính chất là một hàm lồi bị chặn trên trong một tập a-phin, sẽ là hằng số trên tập đó.  Theo Mệnh đề 9.3 mọi tập mức dưới của một hàm lồi, chính thường, nửa liên tục dưới đều có chung một nón lùi xa và một không gian thẳng. Nón này được gọi là nón lùi xa , còn không gian này được gọi là không gian hằng của hàm số.

9.2 Hạng của hàm lồi

137

Với tư cách là một tập lồi trong không gian IRn+1 , trên đồ thị của một hàm lồi f cũng có một không gian thẳng. Hình chiếu của không gian thẳng của epi f trên IRn được gọi là không gian thẳng của f . Ta sẽ ký hiệu L( f ) là không gian thẳng của f . Như vậy L( f ) = {y ∈ IRn |∃t ∈ IR : (t, y) ∈ L(epi f )}. Mệnh đề dưới đây cho thấy cấu trúc của không gian thẳng của f . Mệnh đề 9.4. Giả sử f là một hàm lồi chính thường trên IRn . Khi đó y ∈ L( f ) khi và chỉ khi tồn tại t ∈ IR thỏa mãn f ( x + λy) = f ( x ) + λt ∀ x ∈ dom f , ∀λ ∈ IR. Nếu f đóng, thì trong công thức trên có thể thay với mọi x ∈ dom f bởi với một x ∈ dom f . Chứng minh. Theo định nghĩa, (y, t) thuộc không gian thẳng của epi f khi và chỉ khi

( x, f ( x )) + λ(y, t) ∈ epi f , ∀ x ∈ dom f , ∀λ ∈ IR. Tức là f ( x + λy) − λt ≤ f ( x ) ∀λ ∈ IR. Vậy hàm lồi một biến ϕ(λ) := f ( x + λy) − λt bị chặn trên trong IR. Theo Mệnh đề 9.2,ϕ là hằng số trên IR, và do đó f ( x + λy) − λt = f ( x ) ∀λ. Trong trường hợp f đóng, tức là epi f đóng, thì điều khẳng định sau của mệnh đề được suy ra từ sự kiện (Mệnh đề 1.7) là một véc-tơ y thuộc nón các phương vô hạn của một tập lồi đóng C khi và chỉ khi x + λy ∈ C, ∀λ ≥ 0

138

Nhập môn giải tích lồi ứng dụng

với một x ∈ C.



Theo công thức (9.1) hàm φ(λ) := f ( x + λy) là một hàm aphin khi y ∈ L( f ). Như vậy L( f ) là tập hợp các hướng y trên đó hàm f a-phin. Ký hiệu lin f là thứ nguyên (số chiều) của không gian thẳng L( f ). Như vậy lin f chính là đại lượng đo "mức độ tuyến tính" của f và do đó rank f := dim f − lin f sẽ là đại lượng đo "mức độ phi tuyến" của f và nó được gọi là hạng của f . Nhớ rằng dim f là số chiều của tập hữu dụng của f . Khái niệm về hạng của một hàm lồi có vai trò rất quan trọng trong vấn đề phân rã các bài toán phi tuyến. Nói chung trong hầu hết các lĩnh vực của toán học tính toán, các bài toán phi tuyến thường khó giải hơn nhiều so với các bài toán tuyến tính cùng loại. Ngay với các thế hệ máy tính hiện nay, khi đã có thể giải các bài toán tuyến tính với số biến khá lớn thì việc giải các bài toán phi tuyến cùng loại chỉ mới thực hiện được trên các bài toán có số biến khá nhỏ so với các bài toán tuyến tính. Trong tình huống này một câu hỏi tự nhiên được đặt ra là phải phân loại các "biến phi tuyến" tức là các biến làm cho bài toán trở nên phi tuyến và các "biến tuyến tính" để xử lý một cách riêng biệt. Từ đó có thể phân rã bài toán đang xét thành các bài toán phi tuyến và tuyến tính, theo đó trong các bài toán phi tuyến chỉ có sự tham gia của các biến phi tuyến hoặc ít ra là các biến phi tuyến chỉ tham gia trong các phép toán gây nên tính khó giải của bài toán. Để minh hoạ ta hãy xét bài toán tối ưu max{ f ( x ) : x ∈ D ⊆ IRn },

(9.2)

trong đó f là một hàm toàn phương lồi cho bởi k

f ( x ) := f ( x1 , ..., xn ) =

∑ λ j x2j +

j =1

n

∑ j = k+1

λj xj

(9.3)

139

9.3 Bất đẳng thức lồi

với λ j > 0 ( j = 1, ..., k) và D là một tập lồi đa diện, ví dụ D được cho bởi D := { x = ( x1 , ..., xn ) ≥ 0 : Ax = b}, với A là một ma trận thực cấp m × n, b ∈ IRm . Dễ dàng kiểm tra rằng dim f = n và rank f = k. Bài toán (9.2) là một bài toán quan trọng của tối ưu toàn cục vì rất hay gặp nó trong nhiều ứng dụng như kinh tế, sinh học v.v... Chú ý rằng khi k = 0, thì f là hàm tuyến tính, và do đó (9.2) trở thành một quy hoạch tuyến tính. Các thuật toán đã có hiện nay có thể giải bài toán qui hoạch tuyến tính này với số biến lên đến hàng triệu. Tuy nhiên vấn đề trở nên phức tạp khi k > 0. Người ta đã chứng minh rằng khi k dù chỉ bằng 1, thì (9.2) đã thuộc lớp bài toán khó giải, gọi là lớp NP-khó, trong khi k = 0 bài toán (9.2) là một quy hoạch tuyến tính, có thể giải được bằng các thuật toán có thời gian đa thức. Về mặt lý thuyết, đã có nhiều phương pháp giải bài toán (9.2). Tuy nhiên các thuật toán không sử dụng đến rank f chỉ có thể giải được bài toán trên với số chiều n khá nhỏ (khoảng 20) ngay cả với các thế hệ máy tính hiện nay. Thế nhưng nếu để ý rằng do rank f = k, nên có một không gian với số chiều là n − k mà trên đó hàm f tuyến tính và vì vậy tính phi tuyến của f chỉ còn hạn chế trên một không gian k chiều. Điều này rất có ý nghĩa khi k rất nhỏ so với n. Dựa vào nhận xét này người ta đã xây dựng được các thuật toán giải bài toán (9.2) với số chiều n khá lớn, miễn là rank f vừa nhỏ.

9.3. Bất đẳng thức lồi Cho D ⊆ IRn là một tập lồi và f 1 , ... f m là các hàm lồi trên IRn . Hệ bất đẳng thức x ∈ D, f i ( x ) 0, ta có

( f 0 ( x ) + e, ..., f m ( x ) + e) ∈ C.

141

9.3 Bất đẳng thức lồi Vậy m

∑ λi ( fi (x) + e) ≥ 0 ∀ x ∈ D.

(9.5)

i =0

Điều này đúng với mọi e > 0, nên suy ra m

∑ λi fi (x) ≥ 0 ∀ x ∈ D.

(9.6)

i =0

Ta sẽ chứng tỏ λi ≥ 0 với mọi i. Thật vậy, nếu trái lại có λ j < 0 với một j nào đó, thì do với mọi x ∈ D, mọi yi > f i ( x ), ta có (y0 , ..., ym ) ∈ C, nên m

∑ λi yi ≥ 0. i =0

Cho y j → +∞ còn mọi yi khác cố định, ta thấy vế trái của bất đẳng thức trên tiến đến −∞. Mâu thuẫn vì vế phải bằng 0. Vậy λi ≥ 0 với mọi i. Cuối cùng giả sử điều kiện Slater thoả mãn. Nếu như λ0 = 0, thì theo (9.6), có m

∑ λi fi (x) ≥ 0 ∀ x ∈ D. i =1

Lấy x =

x0

∈ D, theo điều kiện chính qui Slater thì m

∑ λi fi (x0 ) < 0. i =1

Ta có mâu thuẫn và do đó mệnh đề được chứng minh.



Trong nhiều ứng dụng, trong một hệ bất đẳng thức lồi thường có sự tham gia của các đẳng thức tuyến tính. Khi đó ta có mệnh đề sau. Mệnh đề 9.6. Cho f 1 , ..., f m là các hàm lồi hữu hạn trên một tập lồi D 6= ∅ và A là một ma trận thực cấp k × n. Giả sử b ∈ intA( D ). Khi đó hệ x ∈ D, Ax = b, f i ( x ) < 0 i = 1, ..., m

142

Nhập môn giải tích lồi ứng dụng

không có nghiệm, khi và chỉ khi tồn tại t ∈ IRk và λi ≥ 0, i = 1, ..., m sao cho ∑im=1 λi = 1 và m

ht, Ax − bi + ∑ λi f i ( x ) ≥ 0 ∀ x ∈ D. i =1

Chứng minh. Cũng như trên, dễ thấy rằng điều kiện đủ là hiển nhiên. Để chứng minh điều kiện cần, lấy tập E := { x ∈ D | Ax = b}. Do D lồi, nên E lồi và theo giả thiết hệ x ∈ E, f i ( x ) < 0, i = 1, ..., m không có nghiệm. Vậy áp dụng mệnh đề trên, sẽ tồn tại λi , i = 1, ..., m thoả mãn ∑in=1 λi > 0 và m

∑ λi fi (x) ≥ 0 ∀ x ∈ E. i =1

Bằng cách chia cho ∑in=1 λi > 0, ta có thể coi ∑in=1 λi = 1. Với mỗi x ∈ D, lấy f ( x ) := ∑in=1 λi f i ( x ). Khi đó f lồi và hữu hạn trên D. Lấy C := {(y, y0 ) ∈ IRk × IR| ∃ x ∈ D, Ax − b = y, f ( x ) < y0 }. Do D và f lồi, nên C lồi và, theo giả thiết, suy ra 0 6∈ C. Theo Mệnh đề 6.1 có thể tách đúng C và 0. Tức là tồn tại (t, t0 ) ∈ IRk × IR và (y, y0 ) ∈ C sao cho

ht, yi + t0 y0 ≥ 0 ∀(y, y0 ) ∈ C, và

ht, y i + t0 y0 > 0.

(9.7)

143

9.4 Định lý Helley

Dựa vào định nghĩa của C, lập luận tương tự như mệnh đề trước, ta có t0 ≥ 0. Nhưng t0 không thể bằng 0, vì nếu t0 = 0, thì

ht, yi ≥ 0 ∀y ∈ A( D ) − b.

(9.8)

Thế nhưng theo giả thiết b ∈ intA( D ), tức là 0 ∈ int( A( D ) − b). Từ đây và (9.8) suy ra

ht, yi = 0 ∀y ∈ A( D ). Do t0 = 0, nên

ht, yi + t0 y0 = 0 ∀(y, y0 ) ∈ C. Mâu thuẫn với (9.7), vì y ∈ A( D ). Vậy t0 > 0. Nhớ lại định nghĩa của C ta có ( Ax − b, f ( x ) + e) ∈ C ∀e > 0, ∀ x ∈ D. Vậy

ht, Ax − bi + t0 ( f ( x ) + e) ≥ 0 ∀ x ∈ D. Điều này đúng với mọi e > 0, nên

ht, Ax − bi + t0 f ( x ) ≥ 0 ∀ x ∈ D. Thay f ( x ) = ∑im=1 λi f i ( x ) và chia hai vế cho t0 > 0, ta có điều cần chứng minh.  Chú ý. Dễ thấy rằng mệnh đề vẫn còn đúng khi thay hệ Ax = b bởi hệ Ax ≤ b.

9.4. Định lý Helley Định lý Helly, đôi khi còn gọi là định lý về sự tương giao của các tập lồi. Đây là một trong các định lý cơ bản trong lý thuyết tổ hợp các tập lồi. Định lý này do G. Helley, một nhà toán học người

144

Nhập môn giải tích lồi ứng dụng

Uc phát hiện ra từ giữa thế kỷ 19. Phạm vi ứng dụng của định lý này khá rộng rãi, đặc biệt là trong việc chứng minh về sự tồn tại (điểm bất động, nghiệm của hệ phương tình, bất đẳng thức biến phân, bài toán tối ưu, điểm cân bằng v.v...). Định lý đã được mở rộng theo nhiều hướng khác nhau. Dưới đây sẽ trình bày một dạng cơ bản của định lý này. Ta chọn một chứng minh quy nạp sơ cấp dựa vào mệnh đề sau. Mệnh đề 9.7. Mọi tập hợp của các điểm khác nhau, phụ thuộc a-phin trong IRn , đều có thể biểu diễn như là hợp của hai tập rời nhau nhưng bao lồi của chúng lại có điểm chung. Chứng minh. Giả sử các điểm x1 , ..., x k phụ thuộc a-phin. Khi đó tồn tại các số α1 , ..., αk không đồng thời bằng 0, sao cho k

k

∑ α j x j = 0,

∑ α j = 0.

j =1

j =1

Bằng cách đánh lại chỉ số, nếu cần, ta có thể giả sử, rằng α j > 0 với j = 1, ..., p. Vậy 1 ≤ p < k. Khi đó do k

∑ α j = 0, j =1

nên

p

α :=

k

∑ αj = − j =1

α j > 0.

j = p+1

Từ đây và do k

∑ α j x j = 0, j =1

nên

p

αj ∑ α xj = j =1

k

∑ j = p+1

αj j x. α

145

9.4 Định lý Helley Đặt

p

x := Do và

αj α

αj j x α j =1

α

\> 0 với mọi j = 1, ..., p và − αj > 0 với mọi j = p + 1, ..., k p

αj ∑α= j =1

k

∑ j = p+1

αj = 1, α

nên x ∈ co{ x1 , ..., x p } ∩ co{ x p+1 , ..., x k }.

 Mệnh đề 9.8 (Định lý Helley). Cho C1 , ..., Ck là các tập lồi trong IRn . Giả sử rằng bất cứ (n + 1) tập trong các tập này đếu có điểm chung. Khi đó toàn bộ tập này cũng có điểm chung. Chứng minh. Ta chứng minh bằng qui nạp theo k. Nếu k ≤ n + 1 thì không có gì cần phải chứng minh. Cho k > n + 1 và giả sử rằng định lý đúng với k − 1. Khi đó với mọi j ∈ {1, ..., k}, theo giả thiết quy nạp có x j ∈ C1 ∩ ... ∩ Cj−1 ∩ Cj+1... ∩ Ck .

(9.9)

Như vậy ta có k điểm x1 , ..., x k trong IRn phụ thuộc a-phin (vì k > n + 1). Theo định lý Radon, bằng cách đánh số lại các chỉ số, nếu cần thiết, ta có một điểm x thoả mãn x ∈ co{ x1 , ..., x p } ∩ co{ x p+1 , ..., x k }

(9.10)

với một chỉ số p nào đó thuộc {1, ..., k − 1}. Thế nhưng từ (9.9) ta có xi ∈ ∩kj= p+1 Cj ∀i = 1, ..., p. Từ đây và từ (9.10) và do Cj lồi, ta suy ra x ∈ co{ x1 , ..., x p } ⊂ ∩kj= p+1 Cj .

146

Nhập môn giải tích lồi ứng dụng

Một cách tương tự, ta có p

x ∈ co{ x p+1 , ..., x k } ⊂ ∩ j=1 Cj . Vậy x ∈ ∩kj=1 Cj .



Chú ý. Trong trường hợp có vô hạn tập, thì Định lý Helley nêu trên không còn đúng. Ví dụ trong trục số thực lấy họ tập {Cj } ( j = 0, 1, 2...) với Cj = [ j, +∞). Trong ví dụ này các tập không compắc. Trong trường hợp có ít nhất một tập compắc, thì định lý Helley vẫn còn đúng trong trường hợp có vô số tập. Cụ thể ta có mệnh đề sau: Mệnh đề 9.9 (Định lý Helley khi có vô hạn tập). Cho Γ là một họ vô hạn các tập lồi, đóng, khác rỗng trong không gian IRn . Giả sử rằng trong họ này có một tập compắc và bất cứ n + 1 tập của nó đều có giao khác rỗng. Khi đó toàn bộ các tập của họ này cũng có giao khác rỗng. Có thể chứng minh định lý này theo nhiều cách khác nhau. Cách chứng minh của Radon dựa vào tính toán đại số, như đã trình bày trong chứng minh ở Mệnh đề 9.8. Còn có thể chứng minh định lý này bằng cách dùng nón đối ngẫu, rất ngắn gọn, và cũng có thể chứng minh dựa vào định lý tách các tập lồi. Dưới đây ta sẽ giới thiệu vắn tắt hai cách chứng minh sau này. Chứng minh (dùng định lý tách) Ta sẽ chứng minh theo qui nạp. Giả sử mọi s phần tử, với s ≥ n + 1 của họ Γ đều có điểm chung. Ta cần chứng tỏ điều này đúng với (s + 1) phần tử của họ này. Giả sử trái lại, ta có C1 ∩ C2 ∩ ... ∩ Cs+1 = ∅. Do tập C := C1 ∩ C2 ∩ ... ∩ Cs và Cs+1 là hai tập lồi, đóng, khác rỗng và không giao nhau, nên tồn tại một siêu phẳng H tách đúng hai tập này thoả mãn C ∩ H = ∅. Theo giả thiết, với mọi bộ gồm (s − 1) tập Ci1 , ..., Cis−1 ta đều có Ci1 ∩ ... ∩ Cis−1 ∩ Cs+1 6= ∅.

147

9.4 Định lý Helley

Do các Cj lồi, hơn nữa C và Cs+1 , mỗi tập ở về một phía của H, nên Ci1 ∩ ... ∩ Cis−1 ∩ H 6= ∅. Tuy nhiên do dimH = n − 1, áp dụng giả thiết quy nạp cho các tập lồi đóng Ci ∩ H (i = 1, ..., s) ta được C1 ∩ C2 ∩ ... ∩ Cs ∩ H 6= ∅. Điều này mâu thuẫn với việc H tách đúng hai tập C := C1 ∩ C2 ∩ ... ∩ Cs và Cs+1 . Đến đây ta đã chứng minh được mọi họ hữn hạn của họ tập Γ đều có giao khác rỗng (cho đến đây chưa dùng đến tính compắc). Từ đây có thể suy ra mệnh đề bằng cách dùng định lý tương giao hữu hạn quen thuộc trong giải tích hàm. Tuy nhiên cũng có thể chứng minh trực tiếp như sau: Lấy một tập compắc C1 ∈ Γ. Giả sử trái lại giao của tất cả các tập trong họ Γ bằng rỗng. Khi đó với mọi x ∈ C1 , tồn tại một tập Cx ∈ Γ sao cho x 6∈ Cx . Do Cx đóng, nên tồn tại một lân cận N ( x ) của x sao cho N ( x ) ∩ Cx = ∅. Do điều này đúng cho mọi x ∈ C1 và do C1 compắc, nên tồn tại một số hữn hạn các lân cận N ( x1 ), ..., N ( x k ) phủ tập C1 . Vậy ta có C1 ∩ Cx1 ... ∩ Cxk = ∅. Điều này mâu thuẫn với điều ta mới chứng minh ở phần đầu là mọi họ hữu hạn các tập của họ Γ đều có điểm chung.  Định nghĩa 9.2. Cho C là một tập lồi, đóng, khác rỗng trong IRn với s là hàm tựa của C. Khi đó tập D := {(t, x ) |s( x ) ≤ t, x ∈ doms, t ∈ IR} được gọi là nón đối ngẫu của C.

148

Nhập môn giải tích lồi ứng dụng

Ta có thể chứng minh định lý Helley ở trên dựa vào nón đối ngẫu như sau: Giả sử Γ = {Ci |i ∈ I } và ∩i ∈ I Ci = ∅. Khi đó co∪i ∈ I intDi = ( IR, IRn ), trong đó Di là nón đối ngẫu của Ci . Do v = (1, 0) ∈ intDi với mọi i ∈ I, nên gốc toạ độ (0, 0) bị chứa trong một đơn hình ∆ có các đỉnh là v, x1 , ..., x s+1 với s ≤ n + 1 sao cho xi ∈ ∪i ∈ I intDi . Giả sử Dni là nón sao cho xi ∈ intDni . Khi đó mọi siêu phẳng H đi qua gốc toạ độ (0, 0) ∈ ( IR, IRn ) cắt +1 ít nhất nón mở intDni . Vậy ∩is= 1 Cn i = ∅. Do s ≤ n, nên điều này mâu thuẫn với giả thiết rằng mọi n + 1-phần tử của họ Γ đều có giao khác rỗng.  Từ định lý Helley có thể suy ra nhiều sự kiện lý thú. Sau đây là một hệ quả thường được sử dụng. Hệ quả 9.3. Cho C1 , ..., Ck là các tập lồi trong IRn và C ⊆ IRn là một tập lồi bất kỳ. Giả sử giao của bất kỳ một họ gồm (n + 1) phần tử của họ C1 , ..., Ck đều có điểm chung với C. Khi đó ta có x ∈ C ∩ Cj với mọi j = 1, ..., k. Chứng minh. Theo giả thiết, giao của họ gồm (n + 1) phần tử trong họ tập C1 , ..., Ck đều có điểm chung với C, tức là

(∩in=+11 Ci ) ∩ C 6= ∅. Theo định lý Helley, ta có

∩kj=1 (C ∩ Cj ) 6= ∅. 

9.5. Bài tập I 9.1. Cho C ⊆ IRn là một tập lồi. Một hàm f : C → IR được gọi là tựa lồi trên C, nếu với mọi α ∈ IR, tập mức dưới { x ∈ C| f ( x ) ≤ α} lồi.

149

9.5 Bài tập a. Hãy cho ví dụ về hàm tựa lồi, nhưng không lồi.

  1. Chứng minh rằng một hàm f tựa lồi trên tập lồi C khi và chỉ khi với mọi x, y ∈ C và mọi λ ∈ [0, 1], ta có f (λx + (1 − λ)y) ≤ max{ f ( x ), f (y)}. c. Chứng tỏ một hàm lồi hữu hạn trên C, thì sẽ tựa lồi trên C. d. Tìm ví dụ cho thấy cực tiểu địa phương của một hàm tựa lồi trên một tập lồi không nhất thiết là cực tiểu tuyệt đối.

I 9.2. Cho hàm phân thức a-phin f ( x ) := IRn , α, β ∈ IR.

at x + α , bT x+ β

trong đó a, b ∈

  1. Chứng tỏ rằng hàm phân thức a-phin là tựa lồi trên mọi tập lồi trên đó mẫu số không triệt tiêu. b. Cho g := IRn → IR là một hàm lõm. Chứng minh rằng hàm f ( x ) := g(1x) lồi trên tập C := { x | g( x ) > 0}.

I 9.3. Chứng minh rằng một hàm tựa lồi trên một tập lồi, nếu đạt cực đại trên tập lồi đó, thì sẽ đạt tại một điểm cực biên. I 9.4. Cho g là một hàm lồi hữu hạn trên IRn và R := { x ∈ Rn | g( x ) ≥ 0}. Cho ví dụ chứng tỏ rằng cực tiểu địa phương của một hàm tuyến tính trên tập R không phải là cực tiểu toàn cục. I 9.5. Cho A := {( x, y)| x < 0, x2 + y2 ≤ 1}, B := {( x, y)| x ≥ 0, −1 ≤ y ≤ 1}. Tính hàm tựa của tập E := A ∪ B.

I 9.6. Xét hàm ϕ được cho bởi ϕ(u, v) := min{ x (1 − u) + y(1 − v)} với điều kiện x2 + y2 ≤ 1.

150

Nhập môn giải tích lồi ứng dụng

  1. Chứng tỏ rằng ϕ lõm. b. Tính hàm ϕ tại điểm (1, 1).

I 9.7. Cho f : IRn → IR là hàm lồi và A là ma trận thực cấp m × n. Giả sử h được cho bởi h(y) := inf{ f ( x ) | Ax = y}. Chứng minh rằng h lồi.

I 9.8. Cho M là một ma trận thực cấp p × n và D là môt tập lồi đa diện bị chặn. Cho hàm số r ( x ) := max{e T ( My − Mx )| My ≥ Mx, y ∈ D }. a. Chứng minh rằng hàm r lõm ( −r lồi) trên D. b. Tính dom(−r ), c. Tính rank(−r ),

I 9.9. Cho dạng toàn phương f ( x ) := 12 x T Qx + qT x, trong đó Q là ma trận thực đối xứng nửa xác định dương, cấp n × n, q ∈ IRn . Giả sử rankQ = k. a. Chứng minh f lồi. b. Tính rank f . c. Tính không gian hằng và nón lùi xa của f .

I 9.10. Chứng tỏ rằng, với mọi hàm lồi trên IRn , ta có f ∗ ( x ∗ ) = sup{h x ∗ , x i − f ( x )| x ∈ ri(dom f )}.

I 9.11. Cho f và g là hai hàm lồi hữu hạn trên IRn . Giả sử f ( x ) ≥ 0 với mọi x thoả mãn g( x ) ≥ 0. Chứng tỏ rằng tồn tại λ > 0 sao cho f ( x ) + λg( x ) ≥ 0 với mọi x.

151

9.5 Bài tập

I 9.12. Cho x ∗ là cực tiểu của hàm lồi khả vi f trên tập C := { x | Ax = b} trong đó A là ma trận cấp m × n, b ∈ IRm . Chứng minh rằng tồn tại λ = (λ1 , ..., λm ) ≥ 0 sao cho

∇ f ( x ∗ ) + λT A = 0.

152

Nhập môn giải tích lồi ứng dụng

Chương 10 HÀM LIÊN HỢP VÀ XẤP XỈ TUYẾN TÍNH

10.1. Định nghĩa và minh hoạ hàm liên hợp . . . . .

154

10.2. Các tính chất và phép tính cơ bản . . . . . . . . . . .

156

10.3. Xấp xỉ tuyến tính của hàm lồi . . . . . . . . . . . . . . .

159

10.4. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

163

Hàm liên hợp có một vai trò quan trọng trong lý thuyết tối ưu, đặc biệt là trong đối ngẫu. Trong giải tích lồi, phép biến đổi dựa trên hàm liên hợp cho phép nghiên cứu mối quan hệ giữa hàm lồi với các phiếm hàm non a-phin của nó. Trong chương này trước hết chúng ta sẽ giới thiệu định nghĩa và minh hoạ cho hàm liên hợp. Tiếp đến sẽ khảo sát một số tính chất và quy tắc cơ bản cho việc tính toán với hàm liên hợp. Mục cuối của chương nói về việc xấp xỉ tuyến tính hàm lồi, trên cơ sở hàm liên hợp.

154

Nhập môn giải tích lồi ứng dụng

10.1. Định nghĩa và minh hoạ hàm liên hợp Trong lý thuyết vi phân và tích phân, có hai bài toán quan trọng là: cho một hàm f và một điểm u tại đó hàm khả vi. Hãy tìm đạo hàm f 0 (u) tại điểm u. Bài toán ngược lại là cho hàm f và đạo hàm của nó tại một diểm u, hãy tính chính điểm u, tức là cho f và x ∗ , hãy tìm u sao cho x ∗ = f 0 (u). Để phân tích bài toán sau, hãy để ý là từ x ∗ = f 0 (u), ta có 0 = f 0 (u) − x ∗ . Giả sử f là một hàm lồi trên IRn . Khi đó từ 0 = f 0 (u) − x ∗ , suy ra u là nghiệm của bài toán min{ f ( x ) − h x ∗ , x i} = − max{h x ∗ , x i − f ( x )}. x

x

Tuy nhiên bài toán này có thể không có nghiệm, và do đó người ta viết sup{h x ∗ , x i − f ( x )}. x

Giá trị tối ưu của bài toán này dĩ nhiên phụ thuộc vào x ∗ , do đó nó là một hàm số của x ∗ . Ta gọi hàm này là f ∗ ( x ∗ ). Vậy ta có f ∗ ( x ∗ ) := sup{h x ∗ , x i − f ( x )}. x

Đây là một minh hoạ cho thấy một xuất xứ của hàm liên hợp. Một cách tổng quát, hàm liên hợp được định nghĩa như sau: Định nghĩa 10.1. Cho f : IRn → [−∞, +∞] là một hàm bất kỳ. Hàm f ∗ ( x ∗ ) := sup{h x ∗ , x i − f ( x )| x ∈ IRn } được gọi là hàm liên hợp của f . Phép biến đổi f → f ∗ thường được gọi là phép biến đổi Legendre-Fenchel. Như thường lệ, trong định nghĩa trên ta qui ước cận trên đúng trên một tập rỗng là −∞. Như vậy nếu f ≡ +∞,

10.1 Định nghĩa và minh hoạ hàm liên hợp

155

thì f ∗ ≡ −∞. Ngoài ra nếu f có nhận giá trị −∞, thì f ∗ ≡ +∞. Hơn nữa để ý rằng f ∗ ≡ +∞ khi và chỉ khi với mọi x ∗ , với mọi số thực µ đều tồn tại x ∈ IRn sao cho

h x ∗ , x i − f ( x ) > −µ. Điều này tương đương với

∀ x ∗ ∈ IRn , ∀µ ∈ IR, ∃ x ∈ IRn : h x ∗ , x i + µ > f ( x ). Chứng tỏ không thể tồn tại một hàm a-phin non của f trên IRn . Từ những nhận xét trên đây, trong chương này, để khỏi phải làm việc với hàm liên hợp đồng nhất bằng +∞, hoặc đồng nhất bằng −∞, ta sẽ hạn chế việc xét hàm liên hợp trong lớp hàm có tính chất sau: f 6≡ +∞ và tồn tại một hàm non a-phin của f .

(10.1)

Ta sẽ ký hiệu lớp hàm thoả mãn (10.1) là AM( IRn ). Dễ kiểm tra được rằng các hàm lồi, chính thường trên IRn thuộc lớp hàm AM( IRn ). Hàm liên hợp là một công cụ rất sắc bén trong nhiều lĩnh vực của toán học ứng dụng, như tối ưu hóa, phương trình vi phân thường và đạo hàm riêng. Ta hãy xét ý nghĩa kinh tế và hình học để hiểu rõ thêm bản chất của hàm liên hợp. Ý nghĩa kinh tế. Giả sử f ( x ) là chi phí khi ta chọn phương án sản xuất là x = ( x1 , ..., xn ), trong đó xi là số lượng sản phẩm thứ i (i = 1, ..., n). Gọi x ∗ là véc-tơ giá. Vậy lợi nhuận sẽ là

h x ∗ , x i − f ( x ). Hiển nhiên với véc-tơ giá x ∗ đã cho, nhà sản xuất sẽ chọn một phương án sản xuất sao cho lợi nhuận là lớn nhất, tức là tìm sup{h x ∗ , x i − f ( x )| x ∈ IRn }. x

156

Nhập môn giải tích lồi ứng dụng

Vậy lợi nhuận lớn nhất ứng với giá x ∗ chính là f ∗ ( x ∗ ). Ý nghĩa hình học. Ta hãy xét trên đồ thị của f ∗ . Đặt F∗ := {( x ∗ , µ∗ )|h x ∗ , x i − µ∗ ≤ f ( x ) ∀ x }. Khi đó µ∗ ≥ sup{h x ∗ , x i − f ( x )| x ∈ IRn } = f ∗ ( x ∗ ). x

Vậy ( x ∗ , µ∗ ) ∈ epi f ∗ . Do đó F∗ = epi f ∗ . Như vậy trên đồ thị của hàm liên hợp của một hàm f , chính là tập hợp các hàm non a-phin của f . Ví dụ. 1. Hàm lồi toàn phương. Cho Q là ma trận đối xứng xác định dương cấp n × n và q ∈ IRn . Cho f ( x ) = 12 x T Qx + qT x. Dùng định nghĩa ta có f ∗ ( x ∗ ) = 12 ( x ∗ − q)T Q−1 ( x ∗ − q) với mọi x ∗ . Như vậy hàm liên hợp của một dạng toàn phương, đối xứng, xác định dương cũng là một dạng toàn phương, đối xứng, xác định dương. Trong trường hợp đặc biệt ta có hàm liên hợp của hàm chuẩn 21 || x ||2 chính là nó. 2. Hàm chỉ. Hàm liên hợp của hàm chỉ của một tập lồi, đóng chính là hàm tựa của tập đó, tức là δC∗ ( x ∗ ) = sC ( x ∗ ) = suph x ∗ , x i. x∈C

Tính toán hàm liên hợp nói chung là phức tạp. Dưới đây là một số tính chất và quy tắc rất tiện lợi cho việc tính hàm liên hợp.

10.2. Các tính chất và phép tính cơ bản Mệnh đề 10.1. Với mọi hàm số f , hàm liên hợp f ∗ là một hàm lồi đóng thoả mãn bất đẳng thức Fenchel sau: f ∗ ( x ∗ ) ≥ h x ∗ , x i − f ( x ) ∀ x, ∀ x ∗ .

(10.2)

10.2 Các tính chất và phép tính cơ bản

157

Ngoài ra nếu f ∈ AM( IRn ), thì f ∗ là chính thưòng. Nói riêng, nếu f lồi, chính thường, thì f ∗ chính thường. Chứng minh. Hàm f ∗ lồi đóng vì nó là hàm bao trên của một họ các hàm a-phin (do đó liên tục). Bất đẳng thức nêu trong mệnh đề suy ra ngay từ định nghĩa, với chú ý rằng cận trên đúng lấy trên tập rỗng là −∞. Do f ∈ AM( IRn ), nên tồn tại x ∗ và số thực µ sao cho f ( x ) > h x ∗ , x i + µ. Do đó f ∗ ( x ∗ ) = sup{h x ∗ , x i − f ( x )}

≤ sup{h x ∗ , x i − h x ∗ , x i − µ} = −µ. Hơn nữa do f 6≡ +∞, nên f ∗ ( x ∗ ) > −∞ với mọi x ∗ . Vậy f ∗ chính thường.  Mệnh đề 10.2. Giả sử f , f 1 , f 2 là các hàm chính thường trên IRn . Khi đó ta có: (i) Nếu g( x ) := f ( x ) + α, thì g∗ ( x ∗ ) = f ∗ ( x ∗ ) − α (ii) Nếu α > 0 và g( x ) := α f ( x ), thì g∗ ( x ∗ ) = α f ∗ ( x ∗ /α), (iii) Nếu α 6= 0 và g( x ) := f (αx ), thì g∗ ( x ∗ ) = f ∗ ( x ∗ /α), (iv) Nếu A là toán tử tuyến tính khả nghịch, thì ( f oA)∗ = f ∗ ( A −1 )∗ , (v) Nếu g( x ) := f ( x − x0 ), thì g∗ ( x ∗ ) = f ∗ ( x ∗ ) + h x ∗ , x0 i, (vi) Nếu g( x ) := f ( x ) + hv0 , x i, thì g∗ ( x ∗ ) = f ∗ ( x ∗ − v0 ), (vii) Nếu f 1 ≤ f 2 , thì f 1∗ ≥ f 2∗ . (viii) Giả sử dom f 1 ∩ dom f 2 6= ∅ và 0 < α < 1. Khi đó

[α f 1 + (1 − α) f 2 ]∗ ≤ α f 1∗ + (1 − α) f 2∗ .

158

Nhập môn giải tích lồi ứng dụng

Chứng minh. Bằng các tính toán đơn giản dựa trực tiếp vào định nghĩa.  Trong nhiều trường hợp, ta quan tâm đến hàm liên hợp thứ hai f ∗∗ . Theo định nghĩa hàm liên hợp thì f ∗∗ ( x ) := ( f ∗ )∗ ( x ) = sup{h x, si − f ∗ (s)|s ∈ IRn }. Hàm liên hợp thứ hai tất nhiên luôn là một hàm lồi đóng, và nếu f thuộc lớp hàm AM( IRn ), thì theo Mệnh đề 10.1, hàm f ∗∗ là chính thường. Mệnh đề 10.3. Giả sử f ∈ AM( IRn ). Khi đó trên đồ thị của f ∗∗ chính là bao lồi đóng của trên đồ thị của f , tức là epi f ∗∗ = co(epi f ). Chứng minh. Đặt S là tập hợp các hàm non a-phin của f trên IRn , tức là: S := {(s, µ) ∈ IRn × IR|hs, x i − µ ≤ f ( x ) ∀ x }. Như vậy

(s, µ) ∈ S ⇐⇒ hs, x i − µ ≤ f ( x ) ∀ x ∈ IRn ⇐⇒ µ ≥ sup{hs, x i − f ( x ) ⇐⇒ µ ≥ f ∗ (s) ⇐⇒ s ∈ dom f ∗ . Do đó f ∗∗ ( x ) = sup{h x, si − f ∗ (s)|s ∈ dom f ∗ }

\= sup{h x, si − µ| − µ ≤ − f ∗ (s), s ∈ dom f ∗ } = sup{h x, si − µ|(s, µ) ∈ S}.

(10.3)

Từ đây suy ra epi f ∗∗ chính là giao của các nửa không gian đóng được xác định bởi các hàm non a-phin của f , và đó chính là bao lồi đóng của trên đồ thị của f .  Từ mệnh đề trên ta suy ra hệ quả quan trọng sau đây:

10.3 Xấp xỉ tuyến tính của hàm lồi

159

Hệ quả 10.1. (i) Hàm bao lồi đóng của f chính là hàm liên hợp thứ hai của nó, tức là: co f = f ∗∗ . (ii) f ≡ f ∗∗ khi và chỉ khi f là hàm lồi đóng trên f . Chứng minh. Theo định nghĩa thì hàm bao lồi đóng của hàm f chính là một hàm có trên đồ thị là bao lồi đóng của trên đồ thị của f . Do đó điều khẳng định (i ) được suy ra ngay từ Mệnh đề 10.3. Hơn nữa nếu f là hàm lồi đóng thì hàm bao lồi đóng của nó chính là nó. Vậy ta có (ii). 

10.3. Xấp xỉ tuyến tính của hàm lồi Trong phần trước ta đã biết một tập lồi, với những gỉa thiết khá rộng rãi, đều có thể xấp xỉ với độ chính xác tùy ý bởi các tập lồi đa diện, được xác định bằng các nửa không gian tựa của tập lồi. Một cách tương ứng, dưới đây ta sẽ chỉ ra rằng một hàm lồi, với các giả thiết thông thường, đều có thể xấp xỉ với độ chính xác tùy ý bằng các hàm a-phin non của nó. Kết quả này là cơ sở cho việc xấp xỉ các bài toán có cấu trúc lồi bởi các bài toán tuyến tính. IRn

Nhắc lại rằng hàm l là hàm non a-phin của một hàm f trên nếu l là hàm a-phin trên IRn và l ( x ) ≤ f ( x ) với mọi x ∈ IRn .

Tất nhiên hàm đồng nhất bằng −∞ là hàm non a-phin của mọi hàm. Theo định nghĩa, nếu f ∗ là hàm liên hợp của f , thì

h x ∗ , x i − f ∗ ( x ∗ ) ≤ f ( x ) ∀ x. Từ đây thấy rằng, mỗi x ∗ xác định một hàm a-phin l ( x ) := h x ∗ , x i − f ∗ ( x ∗ )

160

Nhập môn giải tích lồi ứng dụng

là hàm non của f trên toàn không gian. Tuy nhiên, về mặt tính toán, hàm non a-phin này khó xác định vì việc tính f ∗ ( x ∗ ) nói chung khó. Để chứng minh định lý về sự xấp xỉ một hàm lồi bởi các hàm a-phin, ta cần đến bổ đề sau, là một kết quả thường còn được dùng trong nhiều trường hợp khác. Bổ đề 10.1. Cho f là một hàm lồi đóng, chính thường trên IRn . Khi đó với mọi điểm ( x0 , t0 ) 6∈ epi f , đều tồn tại w ∈ IRn , α ∈ IR sao cho w T x − f ( x ) < α < w T x0 − t0 ∀ x ∈ dom f .

(10.4)

Chứng minh. Theo giả thiết f là hàm lồi đóng chính thường, nên epi f là một tập lồi, đóng và khác rỗng. Do điểm ( x0 , t0 ) 6∈ epi f , nên áp dụng định lý tách mạnh cho hai tập lồi, đóng C := {( x0 , t0 )} và D := epi f , sẽ tồn tại (a, µ) 6= 0, a ∈ IRn , µ ∈ IR và một số α ∈ IR sao cho aT x + µt < α < aT x0 + µt0 ∀( x, t) ∈ epi f .

(10.5)

Trước hết ta thấy rằng µ ≤ 0, vì nếu µ > 0, thì sẽ có mâu thuẫn khi ở bất đẳng thức đầu của (10.5) ta cho t tiến đến +∞. Lúc đó vế trái tiến đến +∞, trong khi đó ở vế phải α là một số hữu hạn cố định. Hơn nữa nếu x0 ∈ dom f , thì µ 6= 0, vì nếu µ = 0, thì từ bất đẳng thức (10.5), lấy x = x0 , ta có aT x0 < α < aT x0 . Vô lý. Vậy trong trường hợp này, chia hai vế (10.5) cho −µ > 0, ta có điều phải chứng minh. Bây giờ chỉ cần xét trường hợp x0 6∈ dom f và µ = 0. Từ (10.5) có aT x < α < aT x0 ∀ x ∈ dom f .

(10.6)

Lấy x1 ∈ dom f vả t1 < f ( x1 ). Khi đó ( x1 , t1 ) 6∈ epi f . Lại áp dụng định lý tách mạnh cho tập gồm duy nhất một điểm {( x1 , t1 } và

10.3 Xấp xỉ tuyến tính của hàm lồi

161

tập epi f . Khi đó, chú ý rằng x1 ∈ dom f , tương tự như trên, tồn tại (b, β) 6= 0, b ∈ IRn β ∈ IR sao cho bT x − t < β < aT x1 − t1 ∀( x, t) ∈ epi f . Từ đây và (10.5), thấy rằng với mọi η > 0 và mọi ( x, t) ∈ epi f , ta có

(b + ηa)T x − t = bT x − t + ηaT x < β + η α.

(10.7)

Chú ý rằng, do aT x0 > α, nên

(b + ηa)T x0 − t = bT x0 − t + ηaT x0 > β + ηα

(10.8)

với mọi η đủ lớn. Vậy với η đủ lớn, bằng cách lấy w = b + ηa, α0 = β + ηα, thì từ (10.7) và (10. 8) suy ra w T x − t < α0 < w T x0 − t0 ∀( x, t) ∈ epi f . Nói riêng lấy t = f ( x ), ta có w T x − f ( x ) < α0 < w T x0 − t0 ∀ x ∈ dom f . Như vậy trong trường hợp này ta cũng có (10.4).



Định lý dưới đây nói rằng một hàm lồi có thể xấp xỉ với độ chính xác tuỳ ý bởi các hàm non a-phin của nó. Định lý này là cơ sở của các phương pháp xấp xỉ tuyến tính các bài toán tối ưu lồi. Định lý 10.1. Mọi hàm lồi đóng chính thường f trên IRn đều là bao trên của các hàm non a-phin của nó. Tức là f ( x ) = sup{lν ( x ) | lν ∈ A}, ν

trong đó A là tập hợp tất cả các hàm non a-phin của f .

162

Nhập môn giải tích lồi ứng dụng

Chứng minh. Gọi g là hàm bao trên của các hàm non a-phin của f . Tức là: g( x ) := sup{lν ( x ) | lν ∈ A}. ν

Do lν ( x ) ≤ f ( x ) với mọi x và mọi lν ∈ A, nên ta chỉ cần chứng minh f ( x ) ≤ g( x ) với mọi x. Giả sử trái lại rằng điều này không đúng, tức là tồn tại x0 sao cho f ( x0 ) > g( x0 ). Khi đó điểm ( x0 , g( x0 )) 6∈ epi f . Đặt t0 := g( x0 ) và áp dụng bổ đề trên, ta có aT x − f ( x ) < α < aT x0 − g( x0 ) ∀ x ∈ dom f .

(10.9)

Từ đây suy ra aT x − α < f ( x ) với mọi x. Như vậy aT x − α là hàm non a-phin của f . Trong khi đó từ vế phải của (10.9) ta lại có aT x0 − α > g( x0 ). Điều này mâu thuẫn với định nghĩa của g là hàm bao trên của tất cả các hàm non a-phin của f . 

epi f

Hình 10.1: Xấp xỉ tuyến tính hàm lồi Chú ý. Có thể chứng minh định lý xấp xỉ tuyến tính hàm lồi bằng cách sử dụng hàm liên hợp. Thật vậy, do f lồi đóng, chính thường, nên f ∗∗ = f . Khi đó áp dụng công thức (10.3) ta suy ra điều cần chứng minh.

163

10.4 Bài tập

10.4. Bài tập I 10.1. Tính hàm liên hợp của các hàm sau đây: f ( x ) = e x , x ∈ IR, f ( x ) = ( 1p )| x | p , 1 < p < +∞,

I 10.2. Chứng minh rằng nếu g là một hàm thoả mãn co f ≤ g ≤ f , thì g∗ = f ∗ . I 10.3. Chứng minh rằng nếu C là một tập lồi đóng và s là hàm tựa của C, thì |s(u/||u||) chính là khoảng cách từ gốc toạ độ đến siêu phẳng { x | ut x = s(u)}, nếu u 6= 0. I 10.4. Cho C là lồi compắc. Chứng tỏ rằng nón đối ngẫu của C là một nón lồi đóng có đỉnh tại gốc. Tìm một tia nằm trong intC. I 10.5. Cho C0 , ..., Cn là (n + 1) tập lồi đóng, khác rỗng trong IRn và có hợp của chúng là một tập lồi. Giả sử rằng bất kỳ n-tập trong số (n + 1) tập này đều có giao khác rỗng. Chứng minh rằng giao của (n + 1) tập này khác rỗng. Hướng dẫn. Thay bằng các tập compắc Cj ∩ B với B là một hình cầu đóng thích hợp.

I 10.6. Cho hàm một biến f ( x ) := max{ x, 1 − x }. a. Hàm này không khả vi ở đâu? Tính đạo hàm theo hướng d = 1 và d = −1 và dưới vi phân của f tại điểm hàm không khả vi. b. Lấy g ≡ − f . Tính g( x0 + λd) − g( x0 ) , λ λ &0 lim

164

Nhập môn giải tích lồi ứng dụng g( x + λd) − g( x ) λ x → x0 ,λ&0 lim sup

trong đó x0 là điểm tại đó g không khả vi, d = 1 và d = −1. c. Cho f ( x ) = x2 sin x1 tính f 0 (0, d) := lim sup x →0,λ&0

f ( x + λd) − f ( x ) . λ

Chứng tỏ tập ∂0 f (0) := {w ∈ IRn | f 0 ( x, d) ≤ hw, di ∀d} = [−1, 1]

I 10.7. Cho hàm một biến  −2x1/2 nếu x ≥ 0, f (x) = . +∞ nếu x < 0. Tính đạo hàm theo hướng f 0 ( x, d) với x = 1, d = 1 và d = −1. Hàm f 0 (1, .) có phải là hàm chính thường không?

I 10.8. Cho f ( x ) := 12 x T Qx + qT x, trong đó Q là ma trận thực đối xứng cấp n × n và q ∈ IRn ) a. Chứng minh rằng nếu Q nửa xác định dương, thì f là hàm lồi; còn nếu Q xác định dương, thì f lồi mạnh. b. Tính hệ số lồi của f . Chỉ dẫn. Xét giá trị riêng của Q.

I 10.9. Một hàm f được gọi là lồi địa phương tại điểm x, nếu đạo hàm theo mọi hướng tại x tồn tại và hữu hạn. Tìm một hàm lồi địa phương nhưng không lồi. I 10.10. Một hàm khả vi f : IRn → IR được gọi là giả lồi (pseudo convex) tại x trên tập C, nếu với mọi x ∈ C thoả mãn h f 0 ( x ), x − x i ≥ 0, thì f ( x ) − f ( x ) ≥ 0.

165

10.4 Bài tập a. Tìm hàm giả lồi, nhưng không lồi.

  1. Cho f là hàm phân thức a-phin liên tục trên miền lồi C. Chứng minh rằng cả f và − f đều giả lồi.

I 10.11. Cho C ⊆ IRn lồi. Một hàm f : C → IR được gọi là tựa lồi (quasi convex) trên C, nếu với mọi α ∈ IR, tập mức dưới { x ∈ C| f ( x ) ≤ α} lồi. a. Tìm ví dụ về hàm tựa lồi. b. Chứng minh rằng mọi hàm lồi hữu hạn trên C đều tựa lồi trên C, nhưng điều ngược lại không đúng. c. Chứng tỏ rằng hàm phân thức a-phin

aT x+α bT x+ β

tựa lồi trên mọi

tập lồi, tại đó mẫu số không triệt tiêu. d. Cho ví dụ tổng của hai hàm tựa lồi không phải là hàm tựa lồi. e. Cho ví dụ về hàm tựa lồi có cực tiểu địa phương trên một tập lồi đóng, không phải là cực tiểu toàn cục trên tập đó.

I 10.12. Một hàm f : IRn → IR khả vi được gọi là lồi bất biến (invex) trên IRn , nếu tồn tại hàm h : IRn × IRn → IRn sao cho f ( x ) − f (u) ≥ h f 0 (u), h( x, u)i ∀ x, u ∈ IRn . a. Chứng minh rằng mọi hàm lồi f : IRn → IR đều lồi bất biến, nhưng điều ngược lại không đúng. b. Chứng tỏ rằng lớp các hàm tựa lồi và lồi bất biến không bao nhau.

166

Nhập môn giải tích lồi ứng dụng

  1. Các hàm sau, hàm nào là lồi bất biến, hàm nào tựa lồi. f ( x, y) := 3x5 + 4x − 100y7 − 6y,

f ( x ) := x3 − 3x2 + 3x + 1 trong đó x, y ∈ IR.

I 10.13. Một hàm f : IRn → IR được gọi là lồi tại x0 , nếu f (λx0 + (1 − λ) x ) ≤ λ f ( x0 ) + (1 − λ) f ( x ) ∀ x, ∀λ ∈ (0, 1). a. Tìm một hàm lồi tại một điểm x0 , nhưng không lồi. b. Chứng minh f lồi tại mọi điểm khi và chỉ khi f lồi trên IRn .

Chương 11 ĐẠO HÀM THEO HƯỚNG VÀ DƯỚI VI PHÂN

11.1. Đạo hàm theo hướng . . . . . . . . . . . . . . . . . . . . . . . 11.2. Dưới vi phân . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.3. Tính khả vi của hàm lồi . . . . . . . . . . . . . . . . . . . . 11.4. Tính đơn điệu và liên tục của dưới vi phân . 11.5. Phép tính với dưới đạo hàm. . . . . . . . . . . . . . . . 11.6. Dưới vi phân xấp xỉ . . . . . . . . . . . . . . . . . . . . . . . . 11.7. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

168 173 180 184 190 198 202

Phép tính vi phân là một trong những đề tài cơ bản nhất của giải tích cổ điển. Trong giải tích lồi, lý thuyết này lại càng trở nên phong phú nhờ những tính chất đặc biệt của tập lồi và hàm lồi. Mục đầu tiên của chương này sẽ xét đến đạo hàm theo hướng của một hàm lồi. Tiếp đến ở mục 2, sẽ đưa ra định nghĩa về dưới vi phân, chứng minh sự tồn tại và trình bày các tính chất cơ bản nhất của nó. Trong mục 3, sẽ xét tính khả vi của hàm lồi. Mục 4 khảo sát tính chất đơn điệu và tính liên tục của ánh xạ dưới vi phân. Mục 5 nêu một số phép toán tính dưới vi phân cho hàm tổng, hàm hợp, hàm bao trên. Mục cuối của chương sẽ giành để

168

Nhập môn giải tích lồi ứng dụng

giới thiệu về dưới vi phân xấp xỉ. Các chứng minh về sự tồn tại của dưới vi phân cũng như dưới vi phân xấp xỉ được dựa trên các định lý tách, qua đó gợi ý cho việc tính dưới đạo hàm và dưới đạo hàm xấp xỉ.

11.1. Đạo hàm theo hướng Cho một hàm n biến. Khi cố định một hướng và xét hàm nhiều biến trên hướng đó, thì ta có một hàm một biến. Giả sử y 6= 0 là một hướng cho trước xuất phát từ điểm x0 . Khi đó mọi điểm x thuộc đường thẳng đi qua x0 và có hướng y đều có dạng x = x0 + λy với λ ∈ IR. Nếu đặt ξ (λ) := f ( x0 + λy), thì như ta đã biết, ξ lồi trên IR khi và chỉ khi f lồi trên IRn . Định nghĩa 11.1. Cho f : IRn → IR ∪ {+∞} và x0 ∈ IRn sao cho f ( x0 ) < +∞. Nếu với một véc-tơ y ∈ IRn mà giới hạn lim λ ↓0

f ( x0 + λy) − f ( x0 ) λ

tồn tại (hữu hạn hay vô hạn), thì ta nói f có đạo hàm theo hướng y tại điểm x0 . Ta sẽ ký hiệu giới hạn này là f 0 ( x0 , y). Ví dụ sau đây cho thấy hàm f 0 ( x, .) có thể không phải là hàm chính thường mặc dù f là hàm chính thường và x ∈ dom f . Cho f (x) =



0 nếu x < 0, 1 nếu x = 0. +∞ nếu x > 0.

169

11.1 Đạo hàm theo hướng

Ta thấy f là hàm lồi, chính thường, dom f = (−∞, 0]. Dễ thấy rằng f 0 (0, −1) = −∞, f 0 (0, 0) = 0, f 0 (0, 1) = +∞. Từ định nghĩa của hàm ξ ở trên, ta có f 0 ( x0 , y) = lim λ ↓0

ξ ( λ ) − ξ (0 ) . λ

Vậy f 0 ( x0 , y) chính là đạo hàm phải của ξ tại 0 nếu f 0 ( x0 , y) hữu hạn. Ta nhắc lại rằng một hàm f là thuần nhất dương (bậc 1), nếu f (tx ) = t f ( x ) với mọi t > 0 và mọi x trên miền xác định của f . Hàm f được gọi là dưới cộng tính, nếu f ( x + y) ≤ f ( x ) + f (y) với mọi x, y trên miền xác định của f . Hàm dưới tuyến tính là một hàm vừa thuần nhất dương, vừa dưới cộng tính. Đặt ϕ (λ) :=

f ( x + λy) − f ( x ) . λ

Mệnh đề 11.1. Cho f : IRn → IR ∪ {+∞} lồi. Khi đó với mọi x ∈ dom f và mọi y ∈ IRn , ta có: (i) ϕ là hàm đơn điệu không giảm trên (0, +∞); f 0 ( x, y) tồn tại với mọi y ∈ IRn và f 0 ( x, y) := inf

λ>0

f ( x + λy) − f ( x ) . λ

(ii) Hàm f 0 ( x, .) thuần nhất dương bậc 1. Ngoài ra nếu f 0 ( x, .) > −∞ thì: a) Hàm f 0 ( x, .) là dưới tuyến tính trên IRn (do đo nó là hàm lồi chính thường trên IRn ). b) − f 0 ( x, −y) ≤ f 0 ( x, y) ∀y ∈ IRn .

170

Nhập môn giải tích lồi ứng dụng c) Hàm f 0 ( x, .) nhận giá trị hữu hạn trên F khi và chỉ khi x ∈ ri(dom f ), trong đó F là không gian con của dom f .

Chứng minh. (i) Ta chứng minh hàm ϕ đơn điệu không giảm trên miền (0, +∞). Cho x ∈ dom f và định nghĩa hàm h : IR → IR ∪ {+∞} bởi h(λ) := f ( x + λy) − f ( x ). Khi đó h(0) = 0. Giả sử 0 < λ0 ≤ λ. Khi đó, do h là hàm lồi không nhận giá trị −∞, nên ta có h(λ0 ) = h(

λ0 λ0 λ + (1 − )0 ) λ λ

λ0 λ0 λ0 h ( λ ) + (1 − ) h (0 ) ≤ h ( λ ) λ λ λ

Do

f ( x + λy) − f ( x ) h(λ) = , λ λ nên ϕ(λ0 ) ≤ ϕ(λ). Vậy ϕ là hàm không giảm trên miền (0, +∞). Suy ra f 0 ( x, y) = limλ↓0 ϕ(λ) tồn tại và ϕ (λ) :=

lim ϕ(λ) = inf ϕ(λ). λ ↓0

λ>0

(ii) Theo định nghĩa, hiển nhiên ta có f 0 ( x, 0) = 0. Giả sử hàm f 0 ( x, .) > −∞. Để chứng tỏ tính thuần nhất dương, với t > 0, ta viết f ( x + λty) − f ( x ) f 0 ( x, ty) = lim λ λ ↓0 Đặt λ0 = λt, ta có tiếp f ( x + λ0 y) − f ( x ) = t f 0 ( x, y). f ( x, ty) = t lim 0 0 λ λ ↓0 0

Vậy f 0 ( x, .) thuần nhất dương.

171

11.1 Đạo hàm theo hướng

Bây giờ ta sẽ chỉ ra tính chất dưới cộng tính. Với mọi u và v, ta có f 0 ( x, u + v) = lim λ ↓0

\= lim

f ( 2x + λ2 u +

λ ↓0

x 2

f ( x + λ2 (u + v)) − f ( x ) λ/2

+ λ2 v) − 21 f ( x ) − 12 f ( x ) . λ/2

Do f là hàm lồi không nhận giá trị −∞, nên x λ x λ 1 1 f ( + u + + v) − f ( x ) − f ( x ) 2 2 2 2 2 2 1 1 ≤ [ f ( x + λu) − f ( x )] + [ f ( x + λv) − f ( x )]. 2 2 Do đó f 0 ( x, u + v) ≤ lim λ ↓0

f ( x + λv) − f ( x ) f ( x + λu) − f ( x ) + lim λ λ λ ↓0

\= f 0 ( x, u) + f 0 ( x, v). (Chú ý f 0 ( x, u) + f 0 ( x, v) có nghĩa vì f 0 ( x, .) > −∞). Vậy f 0 ( x, .) dưới cộng tính. Kết hợp lại ta có f 0 ( x, .) là dưới tuyến tính trên IRn . Vì f 0 ( x, .) > −∞, f 0 ( x, 0) = 0 và f 0 ( x, .) là dưới tuyến tính trên IRn , nên nó là hàm lồi, chính thường trên toàn không gian. b) Do f 0 ( x, 0) = 0 và theo tính chất dưới cộng tính, ta có 0 = f 0 ( x, 0) = f 0 ( x, y − y) ≤ f 0 ( x, y) + f 0 ( x, −y) ∀y. Từ đây suy ra b). c) Giả sử x ∈ ri(dom f ). Ta cần chứng tỏ f ( x, .) hữu hạn trên F. Theo gỉa thiết, f 0 ( x, .) > −∞. Vậy chỉ cần chỉ ra f 0 ( x, y) < +∞ với mọi y ∈ F. Do x ∈ ri(dom f ), nên với mọi y ∈ F có x + λy ∈ dom f với mọi λ > 0 đủ nhỏ. Do đó f 0 ( x, y) = inf

λ>0

f ( x + λy) − f ( x ) < +∞. λ

172

Nhập môn giải tích lồi ứng dụng

Ngược lại giả sử f 0 ( x, y) hữu hạn với mọi y ∈ F. Ta cần chứng tỏ x ∈ ri(dom f ). Thật vậy, nếu trái lại sẽ tồn tại y ∈ F và một dãy {λk } các số dương hội tụ đến 0 và x + λk y 6∈ dom f với mọi k đủ lớn. Trong trường hợp này f ( x + λk y) − f ( x ) = +∞ với mọi k đủ lớn. Do đó f 0 ( x, y) = +∞. Mâu thuẫn với giả thiết. Vậy x ∈ ri(dom f ).



Từ mệnh đề trên suy ra hệ quả sau, rất thường dùng trong nhiều ứng dụng. Hệ quả 11.1. Cho f là hàm lồi chính thường trên IRn . Giả sử int(dom f ) 6= ∅. Khi đó (i) Hàm f 0 ( x, .) hữu hạn, dưới tuyến tính (do đó lồi trên toàn IRn ) khi và chỉ khi x ∈ int(dom f ) . (ii) Nếu x ∈ int(dom f ) (nói riêng, nếu f lồi, hữu hạn trên toàn IRn ), thì hàm f 0 ( x, .) Lipschitz địa phương trên IRn . Hệ quả 11.2. Một hàm thực f khả vi liên tục hai lần trên một tập mở chứa tập lồi C là hàm lồi trên C khi và chỉ khi với mọi x ∈ C, ma trận Hessian Q( x ) của f tại x là nửa xác định dương. Chứng minh. Giả sử 0 6= u ∈ IRn bất kỳ và a ∈ C. Hàm số thực 1 biến ξ (λ) := f (a + λu) lồi trên khoảng I := {λ| a + λu ∈ C} khi và chỉ khi f lồi trên C. Giả sử x = a + λu ∈ C. Ta có ξ”(λ) = uT Q( x )u. Từ đây ta có ξ 00 (λ) ≥ 0 với mọi λ ∈ I khi và chỉ khi uT Q( x )u ≥ 0 với mọi u; nói cách khác f lồi trên C khi và chỉ khi với mọi x ∈ C, ma trận Q( x ) nửa xác định dương.  T T Một trường hợp riêng quan trọng là khi f ( x ) = x Qx + q x với Q là ma trận thực đối xứng, cấp n × n. Ma trận Hessian của f là Q. Như vậy dạng toàn phương f ( x ) = x T Qx + qT x là lồi trên IRn khi và chỉ khi Q nửa xác định dương.

173

11.2 Dưới vi phân

11.2. Dưới vi phân Trong chương trình giải tích ở phổ thông, ta đã biết rằng hàm lồi khả vi tại một điểm nào đó, thì phương trình tiếp tuyến tại điểm đó nằm dưới đồ thị. Tuy nhiên một hàm lồi có thể không khả vi, ví dụ hàm lồi một biến f ( x ) = | x | không khả vi tại x = 0. Trong trường hợp này, người ta mở rộng khái niệm đạo hàm bằng dưới đạo hàm, sao cho vẫn có được tính chất cơ bản trên của đạo hàm của hàm lồi khả vi. Định nghĩa 11.2. Cho f : IRn → IR ∪ {+∞}. Ta nói x ∗ ∈ IRn là dưới đạo hàm của f tại x nếu

h x ∗ , z − x i + f ( x ) ≤ f (z) ∀z. Tương tự như đối với hàm lồi khả vi thông thường, biểu thức này có nghĩa là phương trình tiếp tuyến nằm dưới đồ thị của hàm số. Tuy nhiên khác với trường hợp khả vi, tiếp tuyến ở đây có thể không tồn tại duy nhất. Ký hiệu tập hợp tất cả các dưới đạo hàm của f tại x là ∂ f ( x ). Nói chung đây là một tập (có thể bằng rỗng) trong IRn . Khi ∂ f ( x ) 6= ∅, thì ta nói hàm f khả dưới vi phân tại x. Theo định nghĩa, một điểm x ∗ ∈ ∂ f ( x ) khi và chỉ khi nó thỏa mãn một hệ vô hạn các bất đẳng thức tuyến tính. Như vậy ∂ f ( x ) là giao của các nửa không gian đóng. Vậy ∂ f ( x ) luôn là một tập lồi đóng (có thể rỗng). Như trong lý thuyết toán tử đa trị, ta sẽ ký hiệu dom(∂ f ) := { x | ∂ f ( x ) 6= ∅}. Ví dụ. 1. f ( x ) = || x ||, x ∈ IRn . Tại điểm x = 0 hàm này không khả vi, nhưng nó khả dưới vi phân và ∂ f (0) = { x ∗ |h x ∗ , x i ≤ || x || ∀ x }.

174

Nhập môn giải tích lồi ứng dụng

2. f = δC là hàm chỉ của một tập lồi C 6= ∅. Khi đó với x0 ∈ C, ∂δC ( x0 ) = { x ∗ | h x ∗ , x − x0 i ≤ δC ( x ) ∀ x }. Với x 6∈ C, thì δC ( x ) = +∞, nên bất đẳng thức này luôn đúng. Vậy ∂δC ( x0 ) = { x ∗ | h x ∗ , x − x0 i ≤ 0 ∀ x ∈ C} = NC ( x0 ). Vậy dưới vi phân của hàm chỉ của một tập lồi C khác rỗng tại một điểm x0 ∈ C chính là nón pháp tuyến ngoài của C tại x0 . Mệnh đề dưới đây cho một định nghĩa khác tương đương của dưới vi phân. Mệnh đề 11.2. Cho f : IRn → IR ∪ {+∞} lồi, chính thường. (i) x ∗ ∈ ∂ f ( x ) khi và chỉ khi f 0 ( x, y) ≥ h x ∗ , yi ∀y. Nếu x ∈ ri (dom f ), thì f 0 ( x, y) = supx∗ ∈∂ f (x) h x ∗ , yi với mọi y. (ii) Nếu f là hàm lồi chính thường trên IRn , thì với mọi x ∈ dom(∂ f ), ta có: f ( x ) = f ( x ) và ∂ f ( x ) = ∂ f ( x ). Chứng minh. (i) Theo định nghĩa x ∗ ∈ ∂ f ( x ) ⇐⇒ h x ∗ , z − x i + f ( x ) ≤ f (z) ∀z. Với bất kỳ y, lấy z = x + λy, λ > 0, ta có

h x ∗ , λyi + f ( x ) ≤ f ( x + λy). Từ đây suy ra

h x ∗ , yi ≤

f ( x + λy) − f ( x ) ∀λ > 0. λ

175

11.2 Dưới vi phân Theo định nghĩa của f 0 ( x, y), từ đây suy ra ngay

h x ∗ , yi ≤ f 0 ( x, y) ∀y.

(11.1)

Ngược lại giả sử (11.1) thoả mãn. Lấy z bất kỳ và áp dụng (11.1) với y = z − x và λ = 1. ta có f ( x + y) − f ( x ) ≥ f 0 ( x, y) = f 0 ( x, z − x ) ≥ h x ∗ , z − x i ∀z. Vậy x ∗ ∈ ∂ f ( x ). Chú ý rằng do f 0 ( x, .) là hàm lồi, thuần nhất dương, nên mọi hàm non a-phin của f 0 ( x, .) đều tuyến tính, tức là có dạng h p, .i. Vậy nếu h p, .i là hàm non a-phin của f 0 ( x, .) trên IRn , thì

h p, yi ≤ f 0 ( x, y) ∀y. Theo Mệnh đề 11.2 ta có p ∈ ∂ f ( x ). Hơn nữa, do f 0 ( x, .) là một hàm lồi đóng, nên theo định lý xấp xỉ tập lồi nó là bao trên của các hàm non của nó. Vậy f 0 ( x, y) = sup h p, yi. p∈ ∂ f ( x )

(ii) Cho x ∈ dom(∂ f ) và x ∗ ∈ ∂ f ( x ) . Theo định nghĩa của f , của hàm liên hợp và do x ∗ ∈ ∂ f ( x ) ta có: f ( x ) ≥ f ( x ) = f ∗∗ ( x ) ≥ h x ∗ , x i − f ∗ ( x ∗ ) = f ( x ). Từ đây suy ra f ( x ) = f ( x ). Nếu y∗ ∈ ∂ f ( x ), thì với mọi z có: f ( z ) ≥ f ( z ) ≥ f ( x ) + h y ∗ , z − x i = f ( x ) + h y ∗ , z − x i. Suy ra ∂ f ( x ) ⊆ ∂ f ( x ).

176

Nhập môn giải tích lồi ứng dụng

Để chứng minh điều ngược lại, lấy z0 ∈ ri(dom f ). Với mọi z ta có f (z) = lim f [(1 − t)z + tz0 ]. t &0

Vậy, theo định nghĩa của dưới vi phân ta có: f [(1 − t)z + tz0 ] ≥ f ( x ) + h x ∗ , (1 − t)z + tz0 − x i. Cho t & 0 ta được: f ( x ) ≥ f ( x ) + h x ∗ , z − x i = f ( x ) + h x ∗ , z − x i. Chứng tỏ x ∗ ∈ ∂ f ( x ).



Mệnh đề 11.3. Cho f : IRn → IR ∪ {+∞} lồi, chính thường. Khi đó: (i) Nếu x 6∈ dom f , thì ∂ f ( x ) = ∅. (ii) Nếu x ∈ int(dom f ), thì ∂ f ( x ) 6= ∅ và com-pắc. Ngược lại, nếu ∂ f ( x ) 6= ∅, com-pắc, thì x ∈ ri(dom f ). Chứng minh. (i) Cho z ∈ dom f , thì f (z) < +∞. Vậy nếu x 6∈ dom f , thì f ( x ) = +∞ và do đó không thể tồn tại x ∗ thoả mãn

h x ∗ , z − x i + f ( x ) ≤ f (z) < +∞. Vậy ∂ f ( x ) = ∅. (ii) Trước hết giả sử x ∈ int(dom f ). Ta có điểm ( x, f ( x )) nằm trên biên của epi f . Do f lồi, chính thường, nên tồn tại siêu phẳng tựa của bao đóng của epi f đi qua ( x, f ( x )), tức là tồn tại p ∈ IRn , t ∈ IR không đồng thời bằng 0 thoả mãn

h p, x i + t f ( x ) ≤ h p, yi + tµ ∀(y, µ) ∈ epi f . Ta có t 6= 0, vì nếu t = 0 thì

h p, x i ≤ h p, yi ∀y ∈ dom f .

(11.2)

177

11.2 Dưới vi phân

Nhưng do x ∈ int(dom f ), nên điều này kéo theo p = 0. Vậy t 6= 0. Hơn nữa t > 0, vì nếu t < 0 thì trong bất đẳng thức (11.2), khi cho µ → ∞ ta suy ra mâu thuẫn vì vế trái cố định. Chia hai vế của (11.2) cho t > 0, đồng thời thay µ = f (y) và p đặt x ∗ = − t , ta được

h x ∗ , x i + f ( x ) ≤ h x ∗ , yi + f (y) ∀y ∈ dom f . Hay là

h x ∗ , y − x i + f ( x ) ≤ f (y) ∀y ∈ dom f . Nếu y 6∈ dom f . thì f (y) = ∞, do đó

h x ∗ , y − x i + f ( x ) ≤ f (y) ∀y. Chứng tỏ x ∗ ∈ ∂ f ( x ). Cách chứng minh trên cho thấy dưới đạo hàm của f tại x chính là véc-tơ pháp tuyến của siêu phẳng tựa của bao đóng của epi f tại ( x, f ( x )). Thực ra f khả dưới vi phân tại mọi điểm x ∈ ri(dom f ), Điều này có thể chứng minh ngắn gọn như sau: Do x ∈ ri(dom f ), nên theo Mệnh đề 11.2 có, f 0 ( x, y) = maxx∗ ∈∂ f (x) h x ∗ , yi và f 0 ( x, y) hữu hạn, nên ∂ f ( x ) 6= ∅. Bây giờ ta chỉ ra tập ∂ f ( x ) com-pắc. Do x ∈ dom f , theo Mệnh đề 11.2, x ∗ ∈ ∂ f ( x ) khi và chỉ khi f 0 ( x, d) ≥ h x ∗ , di ∀d.

(11.3)

Lấy ei véc-tơ đơn vị thứ i (i = 1, ..., n) của IRn (toạ độ thứ i của ei bằng 1 và mọi toạ độ khác là 0). Ap dụng (11.3) lần lượt với d = ei với i = 1, ..., n, ta có xi∗ ≤ f 0 ( x, ei ). Tương tự, áp dụng với d = −ei với i = 1, ..., k, ta có − xi∗ ≤ f 0 ( x, −ei ). Hay xi∗ ≥ − f 0 ( x, −ei ). Tóm lại

− f 0 ( x, −ei ) ≤ xi∗ ≤ f 0 ( x, +ei ) ∀i = 1, ..., n.

178

Nhập môn giải tích lồi ứng dụng

Theo Mệnh đề 11.1, do x ∈ ri(dom f ), nên f 0 ( x, y) hữu hạn với mọi y. Nói riêng f 0 ( x, −ei ) và f 0 ( x, ei ) hữu hạn với mọi i = 1, ..., n. Vậy ∂ f ( x ) bị chặn, và do tính đóng, nên nó com-pắc. Ngược lại giả sử rằng ∂ f ( x ) khác rỗng và com-pắc. Ta chỉ ra rằng x ∈ ri(dom f ). Do ∂ f ( x ) 6= ∅, nên x ∈ dom f . Nếu trái lại x 6∈ ri(dom f ), thì x ở trên biên tương đối của dom f . Do dom f lồi, theo mệnh đề về siêu phẳng tựa, tồn tại một siêu phẳng tựa của bao đóng của dom f tại x, tức là tồn tại véc-tơ p ∈ IRn , p 6= 0 sao cho p T x ≥ p T z ∀z ∈ dom f . Lấy x ∗ ∈ ∂ f ( x ) . Từ đây và theo định nghĩa dưới vi phân ta có: f (z) − f ( x ) ≥ h x ∗ , z − x i ≥ h x ∗ + λp, z − x i ∀λ ≥ 0, ∀z. Chứng tỏ x ∗ + λp ∈ ∂ f ( x ) với mọi λ ≥ 0 . Điều này mâu thuẫn với tính bị chặn của ∂ f ( x ). Vậy x ∈ ri (dom f ).  Ví dụ sau đây cho thấy nếu x 6∈ int(dom f ) thì tập ∂ f ( x ) có thể bằng rỗng. Cho hàm một biến f (x) =



−2x1/2 nếu x ≥ 0, +∞ nếu x < 0.

Khi đó ∂ f (0) = ∅. Mệnh đề 11.4. Cho f là một hàm lồi chính thường trên IRn . Khi đó (i) Với mọi tập bị chặn C ⊂ ri(dom f ), tập ∪x∈C ∂ f ( x ) bị chặn. (ii) Nếu có thêm f đóng, thì có đẳng thức Fenchel sau: f ∗ ( x ∗ ) + f ( x ) = h x ∗ , x i ⇐⇒ x ∗ ∈ ∂ f ( x ), x ∈ ∂ f ∗ ( x ∗ ).

179

11.2 Dưới vi phân Chứng minh. (i) Giả sử C ⊂ ri(dom f ). Đặt ξ :=

sup

|| x ∗ || := sup sup || x ∗ ||.

x ∗ ∈∂ f (C )

(11.4)

x∈C x∗ ∈∂ f ( x)

Xét ánh xạ tuyến tính h x ∗ , zi. Chuẩn của ánh xạ tuyến tính này là

|| x ∗ || = sup h x ∗ , zi. || z||=1

Thay vào (11.4) ta có: sup h x ∗ , zi.

ξ = sup sup

x ∈C x ∗ ∈∂ f ( x ) || z||=1

Do f 0 ( x, z) =

sup h x ∗ , zi, x∗ ∈∂ f ( x)

nên ta có tiếp ξ = sup sup f 0 ( x, z). || z||=1 x ∈C

Đặt g(z) := sup f 0 ( x, z). x∈C

Do x ∈ C ⊆ ri(dom f ), nên hàm f 0 ( x, .) lồi trên không gian con F của dom f . Suy ra hàm g vì là bao trên của một họ hàm lồi liên tục trên F. Vậy ξ = sup g(z) = max g(z) < +∞. || z||=1

|| z||=1

Chứng tỏ ∂ f (C) bị chặn. (ii) Theo định nghĩa hàm liên hợp, ta có f ∗ ( x ∗ ) = sup{h x ∗ , x i − f ( x )}. x

180

Nhập môn giải tích lồi ứng dụng

Điều này tương đương với f ∗ ( x ∗ ) ≥ h x ∗ , yi − f (y) ∀y. Do đó f ∗ ( x ∗ ) + f ( x ) = h x ∗ , x i, khi và chỉ khi

h x ∗ , yi − f (y) + f ( x ) ≤ h x ∗ , x i ∀y, tương đương với x ∗ ∈ ∂ f ( x ). Do f đóng, nên f ∗∗ = f , và do đó x ∈ ∂ f ∗ ( x ∗ ). 

11.3. Tính khả vi của hàm lồi Cho một hàm f xác định trên một lân cận của x ∈ IRn . Theo định nghĩa, hàm f được gọi là khả vi tại x, nếu tồn tại x ∗ sao cho lim

z→ x

f (z) − f ( x ) − h x ∗ , z − x i =0 ||z − x ||

Một điểm x ∗ như thế này, nếu tồn tại sẽ duy nhất và được gọi là đạo hàm của f tại x. Thông thường đạo hàm này được ký hiệu là O f ( x ) hoặc f 0 ( x ). Giả sử f : IRn → IR ∪ {+∞} chính thường và x ∈ dom f . Nếu f khả vi tại x, thì với mọi y 6= 0, ta có: lim

λ &0

f ( x + λy) − f ( x ) − hO f ( x ), λyi = 0, λ||y||

hay là f 0 ( x, y) − hO f ( x ), yi = 0. ||y||

181

11.3 Tính khả vi của hàm lồi

Suy ra f 0 ( x, y) = hO f ( x ), yi với mọi y. Lấy y = ei (i = 1, ..., n) là véc-tơ đơn vị thứ i của IRn , ta có:

hO f ( x ), ei i = (∂ f /∂xi )( x ) (i = 1, ..., n). Vậy f 0 ( x, y) =

n

∑ yi (∂ f /∂xi )(x). i =1

Từ đây ta có mệnh đề sau: Mệnh đề 11.5. Giả sử f : IRn → IR ∪ {+∞} lồi, chính thường và x ∈ dom f . Khi đó f khả vi tại x khi và chỉ khi tồn tại x ∗ ∈ IRn sao cho f 0 ( x, y) = h x ∗ , yi với mọi y. Ngoài ra x ∈ int(dom f ) và O f ( x ) = x ∗ . Chứng minh. Nếu f khả vi tại x thì, như ở trên, ta đã chỉ ra rằng f 0 ( x, y) = hO f ( x ), yi với mọi y. Vậy f 0 ( x, y) hữu hạn trên toàn IRn , nên x ∈ int(dom f ). Giả sử ngược lại f 0 ( x, y) = h x ∗ , yi với mọi y. Trước hết ta có x ∈ int(dom f ) vì f 0 ( x, .) hữu hạn trên toàn IRn . Để chứng minh tính khả vi của f tại x, ta lấy g ( y ) : = f ( x + y ) − f ( x ) − h x ∗ , y i. Do f lồi, chính thường và f hữu hạn, nên g cũng là một hàm lồi, g(y) chính thường trên IRn . Ta cần chứng tỏ limy→0 ||y|| = 0. Trước hết để ý là từ f 0 ( x, y) = h x ∗ , yi, theo định nghĩa của f 0 ( x, y), ta có g(y) ≥ 0 với mọi y và g(0) = 0. Nếu y 6= 0 thì véc-tơ y/||y|| thuộc siêu hộp H := [−1, 1]n . Vậy theo định lý Krein-Milman điểm y/||y|| biểu điễn được bởi một tổ hợp lồi của các đỉnh của H, tức là tồn tại các số thực β i (phụ thuộc y) sao cho β i ≥ 0, ∑i ∈ I β i = 1 và y/||y|| = ∑ β i vi , i∈ I

182

Nhập môn giải tích lồi ứng dụng

trong đó vi (i ∈ I ) là các đỉnh của H. Ta có g(y) = g(||y||

y ) = g(||y|| ∑ βi vi ). ||y|| i∈ I

Theo tính lồi của g thì g(y) = g(∑ β i ||y||vi ) ≤

∑ βi g(||y||vi ). i∈ I

i∈ I

Chia hai vế cho ||y|| > 0, có g(y) g(||y||vi ) 0≤ ≤ ∑ βi . ||y|| ||y|| i∈ I Theo định nghĩa của g ta lại có g(y) || y||

g(|| y|| vi ) || y||

→ 0 khi y → 0. Vậy

→ 0. Chứng tỏ f khả vi tại x, và do đó O f ( x ) = x ∗ .



Việc kiểm tra một hàm có phải lồi hay không, thường không đơn giản. Trong trường hợp khả vi, ta có các kết quả sau về điều kiện cần/ đủ để một hàm là lồi. Mệnh đề 11.6. Cho f : Rn → IR ∪ {+∞} khả vi và C ⊂ IRn . Ba điều kiện sau là tương đương: (a) η là hệ số lồi của f trên C, η

(b) f (y) ≥ f ( x ) + h f 0 ( x ), y − x i + 2 || x − y||2 , η

(c) h f 0 (y) − f 0 ( x ), y − x i ≥ 2 || x − y||2 . Chứng minh. (a) → (b). Do η là hệ số lồi của f trên C, nên với mọi t ∈ (0, 1) và mọi x, y thuộc C ta có: η f (ty + (1 − t) x ) + t(1 − t)|| x − y||2 ≤ (1 − t) f ( x ) + t f (y). 2

11.3 Tính khả vi của hàm lồi

183

Suy ra f (y) − f ( x ) ≥

f ( x + t(y − x )) − f ( x ) η + (1 − t)|| x − y||2 . t 2

Cho t & 0, do f khả vi, ta được η f (y) − f ( x ) ≥ h f 0 ( x ), y − x i + || x − y||2 . 2 (b) → (a) . Cho t ∈ (0, 1) và w = (1 − t) x + ty. Khi đó y = w + (1 − t)(y − x ) x = w + (−t)(y − x ) Áp dụng (b) ta được: η f (y) ≥ f (w) + h f 0 (w), (1 − t)(y − x )i + (1 − t)2 || x − y||2 . 2

η f ( x ) ≥ f (w) + h f 0 (w), (−t)(y − x )i + (−t)2 || x − y||2 . 2 Nhân bất đẳng thức trên với t > 0 và bất đẳng thức dưới với 1 − t > 0, rồi cộng lại và chuyển vế ta có: η t(1 − t)|| x − y||2 ≤ (1 − t) f ( x ) + t f (y) − f [(1 − t) x + ty]. 2 Chứng tỏ η là hệ số lồi của f trên C. (b) → (c). Do (b), nên với mọi x, y ∈ C, có: η f (y) − f ( x ) ≥ h f 0 ( x ), y − x i + || x − y||2 , 2 η f ( x ) − f (y) ≥ h f 0 (y), x − yi + || x − y||2 . 2 Cộng hai bất đẳng thức lại ta được (c).

184

Nhập môn giải tích lồi ứng dụng

(c) → (b). Để chứng minh phần này ta đặt γ(t) := f [ x + t(y − x )]. Khi đó γ0 (t) = h f 0 [ x + t(y − x )], y − x i và f ( y ) − f ( x ) = γ (1 ) − γ (0 ) =

Z 1 0

γ0 (t)dt

Bây giờ giả sử có (c). Với x, y ∈ C, đặt h := y − x. Khi đó f (y) − f ( x ) =

Z 1 0

0

0

h f ( x + th), hidt = h f ( x ), hi +

Z 1 0

[h f 0 ( x + th) − f 0 ( x )], hidt.

Theo (c) , có

h f 0 ( x + th) − f 0 ( x ), thi ≥

η 2 t ||y − x ||2 . 2 η

Suy ra f (y) − f ( x ) ≥ h f 0 ( x ), y − x i + 2 || x − y||2 .



Chú ý. Trong chứng minh trên không đòi hỏi η ≥ 0, tức là không đòi hỏi f lồi.

11.4. Tính đơn điệu và liên tục của dưới vi phân Trong chương trình toán giải tich cổ điển, ta đã thấy hàm lồi một biến khả vi, thì đạo hàm của nó là một hàm đơn điệu không giảm. Tính chất này có thể mở rộng cho hàm lồi nhiều biến, không nhất thiết phải khả vi. Khi đó ánh xạ (toán tử ) x → ∂ f (.) sẽ là một ánh xạ đa trị, Như thường lệ ta ký hiệu tập hợp tất cả n các tập con của IRn là 2 IR . Cho T là một toán tử đa trị trên IRn , tức là với mỗi x ∈ IRn , thì T ( x ) là một tập (có thể bằng rỗng). Ký hiệu miền xác định của T là domT := { x ∈ IRn | T ( x ) 6= ∅},

185

11.4 Tính đơn điệu và liên tục của dưới vi phân và đồ thị của T là G (T ) := {( x, y) ∈ IRn × IRn | y ∈ T ( x )}.

Định nghĩa 11.3. Cho T : IRn → 2 IR và C ⊆ domT. Ta nói T là đơn điệu tuần hoàn trên C, nếu với mọi số nguyên, dương m và mọi cặp ( xi , yi ) ∈ G (T ), xi ∈ C (i = 0, ...m) ta có n

h x1 − x0 , y0 i + h x2 − x1 , y1 i + ... + h x0 − x m , ym i ≤ 0.

(11.5)

Nếu (11.5) chỉ đúng với m = 1, thì ta nói T đơn điệu trên C, tức là

hy − y0 , x − x 0 i ≥ 0 ∀ x, x 0 ∈ C, ∀y ∈ T ( x ), ∀y0 ∈ T ( x 0 ). Nếu T đơn điệu (hoặc đơn điệu tuần hoàn) trên toàn domT, thì ta nói ngắn gọn là T đơn điệu (đơn điệu tuần hoàn). Dùng định nghĩa của dưới vi phân, thấy ngay rằng nếu T ≡ ∂ f , thì T đơn điệu tuần hoàn trên dom(∂ f ). Một câu hỏi được đặt ra là điều ngược lại có đúng không? Trả lời câu hỏi này ta có mệnh đề sau: Mệnh đề 11.7. Giả sử S là một toán tử đa trị từ IRn → IRn . Điều kiện cần và đủ để tồn tại một hàm lồi, đóng, chính thường f trên IRn sao cho S( x ) ⊆ ∂ f ( x ) với mọi x ∈ dom(∂ f ), là toán tử S đơn điệu tuần hoàn. Chứng minh. Điều kiện cần là hiển nhiên vì bản thân ∂ f là toán tử đơn điệu tuần hoàn. Để chứng minh điều kiện đủ, hãy giả sử S là một toán tử đơn điệu tuần hoàn và ( x0 , y0 ) ∈ G (S). Định nghĩa hàm f bằng cách lấy f ( x ) := sup{h x − x m , ym i + ... + h x1 − x0 , y0 i} trong đó cận trên đúng được lấy trên tất cả các cặp ( xi , yi ) ∈ G (S) và các số nguyên dương m. Do f là bao trên của một họ các hàm

186

Nhập môn giải tích lồi ứng dụng

a-phin, nên f là một hàm lồi đóng. Do tính đơn điệu tuần hoàn của S, nên f ( x0 ) = 0. Vậy f là hàm lồi, chính thường. Với bất kỳ cặp ( x, x ∗ ) ∈ G (S), ta sẽ chỉ ra x ∗ ∈ ∂ f ( x ). Muốn thế chỉ cần chỉ ra rằng với mọi α < f ( x ) và y ∈ IRn , ta có f (y) > α + hy − x, x ∗ i. Thật vậy, do α < f ( x ), nên theo tính chất của cận trên đúng, sẽ tồn tại các cặp ( xi , yi ) ∈ G (S) và số nguyên dương m (i = 1, ..., m) thoả mãn α < h x − x m , ym i + ... + h x1 − x0 , y0 i. Theo định nghĩa của f (y), ta được: f (y) ≥ hy − x m+1 , ym+1 i + h x m+1 − x m , ym i + ... + h x1 − x0 , y0 i. Thay x m+1 = x và ym+1 = x ∗ , ta có: f (y) ≥ hy − x, x ∗ i + h x m+1 − x m , ym i + ... + h x1 − x0 , y0 i

\> hy − x, x ∗ i + α. Điều này đúng với mọi ( x, x ∗ ) ∈ G (S), nên S ⊆ ∂ f .



Định nghĩa 11.4. Ta nói một toán tử T : IRn → 2 IR là đơn điệu cực đại, nếu nó là đơn điệu và đồ thị của nó không phải là tập con thực sự của đồ thị của một toán tử đơn điệu nào khác. Toán tử T được gọi là đơn điệu tuần hoàn cực đại, nếu nó là đơn điệu tuần hoàn và đồ thị của nó không là tập con thực sự của đồ thị của một toán tử đơn điệu tuần hoàn khác. n

Từ mệnh đề trên ta suy ra ngay hệ quả sau: Hệ quả 11.3. Mọi toán tử đơn điệu tuần hoàn cực đại trong IRn đều là dưới vi phân của một hàm lồi, đóng chính thường trên IRn .

11.4 Tính đơn điệu và liên tục của dưới vi phân

187

Trong phần tiếp theo dưới đây, ta sẽ chứng minh rằng dưới vi phân của một hàm lồi, đóng chính thường là một toán tử đơn điệu tuần hoàn cực đại. Do đó trên thực tế, lớp các toán tử đơn điệu tuần hoàn cực đại trùng với lớp các toán tử dưới vi phân của hàm lồi, đóng, chính thường. Bên cạnh tính chất đơn điệu tuần hoàn vừa nêu, ánh xạ dưới vi phân của một hàm lồi còn có các tính chất liên tục. Định nghĩa 11.5. Một ánh xạ T : IRn → 2 IR được gọi là đóng tại x, nếu với mọi dãy x k → x, mọi yk ∈ T ( x k ) và yk → y, thì y ∈ T ( x ). n

Dễ thấy ánh xạ T là đóng khi và chỉ khi đồ thị của T là một tập đóng. Định nghĩa 11.6. Anh xạ T : IRn → 2 IR được gọi là nửa liên tục trên tại x, nếu với mọi tập mở G chứa T ( x ), tồn tại một lân cận mở U của x sao cho n

T (z) ⊆ G ∀z ∈ U. Ta sẽ nói ánh xạ T là đóng (nửa liên tục trên) trên tập C, nếu nó đóng (nửa liên tục trên) tại mọi điểm thuộc C. Do một hàm lồi liên tục trên tập int(dom f ), nên từ định nghĩa của dưới vi phân và do tính liên tục của tích vô hướng, dễ dàng suy ra ngay rằng ánh xạ dưới vi phân x → ∂ f ( x ) là đóng trên tập C = int(dom f ). Nói một cách khái quát, bổ đề dưới đây chỉ ra rằng một dãy hàm lồi nếu bị chặn trên bởi một hàm lồi theo từng điểm ở trên một tập lồi mở, thì sẽ bị chặn trên đều bởi chính hàm lồi đó trên mọi tập com-pắc thuộc tập mở này. Bổ đề 11.1. Cho một tập lồi, mở G ⊆ IRn và f là một hàm lồi nhận giá trị hữu hạn trên G. Giả sử { f i }i ∈ I là một dãy các hàm lồi hữu hạn

188

Nhập môn giải tích lồi ứng dụng

trên G. Giả sử limsup f i ( x ) ≤ f ( x ) với mọi x ∈ G. Khi đó với mọi tập com-pắc K ⊆ G, với mọi e > 0, tồn tại chỉ số ie sao cho f i ( x ) ≤ f ( x ) + e ∀i ≥ ie , ∀ x ∈ K. Chứng minh. Với mọi x ∈ G, mọi i ∈ IN , định nghĩa gi ( x ) := max{ f i ( x ), f ( x )}. Hàm gi lồi, hữu hạn trên G, vì nó là hàm bao trên của hai hàm lồi hữu hạn trên G. Do G mở, nên gi liên tục trên G. Do K ⊆ G com-pắc, nên dãy { gi ( x )}i ∈ I bị chặn. Không giảm tổng quát, bằng cách qua dãy con, ta có thể coi gi ( x ) → l ( x ) khi i → +∞. Theo định nghĩa của gi ( x ) và do limsup f i ( x ) ≤ f ( x ) với mọi x ∈ K, ta suy ra l ( x ) = f ( x ). Vậy dãy hàm { gi } hội tụ theo từng điểm đến f trên tập com-pắc K, nên nó hội tụ đều đến f trên K. Nhưng do gi ( x ) := max{ f i ( x ), f ( x )}, nên ta suy ra điều cần chứng minh.  Từ mệnh đề sau, suy ra tính nửa liên tục trên của ánh xạ ∂ f . Cụ thể là: Mệnh đề 11.8. Cho một tập lồi, mở U ⊆ IRn và f là một hàm lồi nhận giá trị hữu hạn trên U. Giả sử { f i }i ∈ I là một dãy các hàm lồi hữu hạn trên U và hội tụ theo từng điểm trên U đến f . Khi đó, nếu dãy { xi } ⊂ U hội tụ đến x ∈ U, thì với mọi e > 0, tồn tại chỉ số ie sao cho ∂ f i ( xi ) ⊂ ∂ f ( x ) + eB(0, 1) ∀i ≥ ie , trong đó B(0, 1) là hình cầu đơn vị, đóng tâm ở 0. Chứng minh. Cho α > 0, y ∈ IRn . Với mỗi x ∈ U đặt µ := f 0 ( x, y) + α. Do f lồi, hữu hạn trên tập U mở và x ∈ U, nên x ∈ int(dom f ), do đó µ hữu hạn. Do x ∈ int(dom f ), nên với mọi y tồn tại δ > 0 sao cho x + λy ∈ int(dom f ), với mọi 0 < λ < δ. Do α > 0 và định nghĩa của f 0 ( x, y), ta có f ( x + λy) − f ( x ) < µ ∀λ ∈ (0, δ) λ

(11.6)

11.4 Tính đơn điệu và liên tục của dưới vi phân

189

Do f i ( x + λy) → f ( x + λy) và f i ( xi ) → f ( x ), nên từ (11.6), tồn tại i1 sao cho f i ( xi + λy) − f i ( xi ) < µ ∀i ≥ i1 ∀λ ∈ (0, δ). λ Do

f i ( xi + λy) − f i ( xi ) λ 0 i nên f i ( x , y) ≤ µ với mọi i ≥ i1 . Vậy f i0 ( xi , y) ≤

limsup f i0 ( xi , y) ≤ µ = f 0 ( x, y) + α. Do điều này đúng với mọi α > 0, ta suy ra limsup f i0 ( xi , y) ≤ f 0 ( x, y). Vì f i0 ( x, .) và f 0 ( x, .) lồi, hữu hạn trên toàn không gian (do x ∈ U ⊂ int(dom f )), nên áp dụng bổ đề trên cho các hàm lồi f i0 ( xi , .) và f ( x, .) với G = IRn , K = B(0, 1), ta có:

∀e ∃ie : f i0 ( xi , y) ≤ f 0 ( x, y) + e ∀i ≥ ie , ∀y ∈ B(0, 1). Từ đây, với mọi y 6= 0, theo tính chất thuần nhất dương của f 0 ( x, .), ta có: 1 0 i f ( x , y) = f i0 ( xi , y/||y||) ≤ f 0 ( x, y/||y||) + e. ||y|| i Hay f i0 ( xi , y) ≤ f 0 ( x, y) + e||y|| ∀i ≥ ie , ∀y. Do f i0 ( xi , y) là hàm tựa của ∂ f i ( xi ) và f 0 ( x, y) là hàm tựa của ∂ f ( x ), nên từ đây ta suy ra điều phải chứng minh.  Mệnh đề 11.9. Cho f là một hàm lồi trên IRn . Khi đó ánh xạ dưới vi phân x → ∂ f ( x ) nửa liên tục trên tại mọi điểm x ∈ int(dom f ). Chứng minh. Ta có f lồi nên nó hữu hạn trên tập int(dom f ). Vậy áp dụng Mệnh đề 11.8 với U là một lân cận đủ nhỏ của x ∈ int(dom f ) và f i ≡ f với mọi i, ta suy ra rằng ánh xạ dưới vi phân nửa liên tục trên tại điểm x . 

190

Nhập môn giải tích lồi ứng dụng

Mệnh đề 11.10. Cho f là một hàm lồi trên IRn . Nếu f khả vi trên tập int(dom f ) thì nó khả vi liên tục trên tập này. Chứng minh. Cho x ∈ int(dom f ) và dãy { xi } ⊂ int(dom f ) hội tụ đến x. Khi đó với mọi e > 0, theo Mệnh đề 11.8, tồn tại ie sao cho ||O f ( xi ) − O f ( x )|| ≤ e ∀i ≥ ie . Chứng tỏ O f (.) liên tục tại x.



11.5. Phép tính với dưới đạo hàm. Qua chứng minh mệnh đề về sự tồn tại dưới đạo hàm, ta thấy rằng để xác định một dưới đạo hàm của một hàm lồi f tại x, cần xác định được siêu phẳng tựa của epi f tại điểm ( x, f ( x )). Trong trường hợp tổng quát việc xác định siêu phẳng tựa này không đơn giản. Các kết quả dưới đây liên quan đến việc tính dưới đạo hàm của hàm tổng, hàm hợp, hàm bao lồi là những hàm thường xuất hiện trong nhiều ứng dụng. Tương tự như giải tích cổ điển, nếu f là một hàm lồi chính thường trong IRn , thì dễ dàng chỉ ra rằng ∂(λ f )( x ) = λ∂ f ( x ) ∀λ > 0, ∀ x. Đối với dưới vi phân của tổng các hàm lồi, ta có định lý sau: Mệnh đề 11.11 (Moreau-Rockafellar). Cho f i , i = 1, ..., m là các hàm lồi chính thường trên IRn . Khi đó m

m

i =1

i =1

∑ ∂ fi (x) ⊆ ∂( ∑ fi (x)) ∀ x. Nếu ∩ri(dom f i ) 6= ∅, thì m

m

i =1

i =1

∑ ∂ fi (x) = ∂( ∑ fi (x)) ∀ x.

191

11.5 Phép tính với dưới đạo hàm.

Chứng minh. Ta chỉ cần chứng minh cho m = 2. Với m > 2 dùng quy nạp. Điều khẳng định n

n

i =1

i =1

∑ ∂ fi (x) ⊆ ∂( ∑ fi (x)) ∀ x có thể dễ dàng kiểm tra dựa vào định nghĩa dưới vi phân. Để chứng minh bao hàm thức ngược lại, ta lấy x0 ∈ IRn và x ∗ ∈ ∂( f 1 + f 2 )( x0 ). Theo định nghĩa của dưới vi phân thì hệ f 1 ( x ) + f 2 (y) − f 1 ( x0 ) − f 2 ( x0 ) − h x ∗ , x − x0 i < 0 x−y =0 không có nghiệm. Lấy D = dom f 1 × dom f 2 và A( x, y) = x − y. Theo giả thiết f 1 liên tục tại một điểm a ∈ dom f 1 ∩ dom f 2 , nên tồn tại một lân cận U của gốc sao cho U = (a + U ) − a ⊂ dom f 1 − dom f 2 = A( D ). Vậy 0 ∈ intA( D ). Ap dụng Mệnh đề 9.6 với f ( x, y) = f 1 ( x ) + f 2 (y) − f 1 ( x0 ) − f 2 ( x0 ) − h x ∗ , x − x0 i và A( x, y) = x − y, ta có

ht, x − yi + [ f 1 ( x ) + f 2 (y) − f 1 ( x0 ) − f 2 ( x0 ) − h x ∗ , x − x0 i] ≥ 0 với mọi x ∈ dom f 1 , y ∈ dom f 2 . Đối với x 6∈ dom f 1 và y 6∈ dom f 2 , thì bất đẳng thức trên là hiển nhiên. Vậy

ht, x − yi + [ f 1 ( x ) + f 2 (y) − f 1 ( x0 ) − f 2 ( x0 ) − h x ∗ , x − x0 i] ≥ 0 ∀ x, y. Lấy y = x0 , ta có

ht, x − x0 i + [ f 1 ( x ) + f 2 ( x0 ) − h x ∗ , x − x0 i] ≥ 0 ∀ x Suy ra x ∗ ∈ t + ∂ f 1 ( x0 ).

192

Nhập môn giải tích lồi ứng dụng

Bây giờ lại lấy x = x0 , thì

ht, x0 − yi + [ f 2 (y) − f 2 ( x0 ) ≥ 0 ∀ x Suy ra t ∈ ∂ f 2 ( x0 ). Vậy x ∗ ∈ ∂ f 1 ( x0 ) + ∂ f 2 ( x0 ).



Trong chương trình giải tích cổ điển, ta đã thấy điều kiện cần và đủ để một hàm lồi khả vi đạt cực tiểu tại một điểm là đạo hàm của nó triệt tiêu tại điểm đó. Dựa vào dưới vi phân của hàm lồi, kết quả này có thể mở rộng cho hàm lồi nhiều biến, không nhất thiết khả vi. Giả sử f là một hàm lồi trên IRn . Hãy xét bài toán cực tiểu của f trên toàn không gian IRn . Nếu f f ≡ +∞, thì cực tiểu bằng +∞, nếu f nhận giá trị −∞, thì cực tiểu bằng −∞. Vậy không giảm tổng quát, ta giả sử f là hàm lồi chính thường. Từ định nghĩa dưới vi phân, ta thấy ngay rằng x là nghiệm của bài toán min{ f ( x ) | x ∈ IRn } khi và chỉ khi 0 ∈ ∂ f ( x ). Bây giờ xét bài toán có điều kiện min{ f ( x ) | x ∈ C}, trong đó C ⊆ IRn là một tập lồi và f là hàm lồi trên IRn . Gọi δC là hàm chỉ của C. Đặt h( x ) := f ( x ) + δC ( x ). Khi đó bài toán có điều kiện được chuyển về bài toán không điều kiện với hàm mục tiêu là h. Khi đó điều kiện cần và đủ để x là điểm cực tiểu của h trên IRn là 0 ∈ ∂h( x ) = ∂( f ( x ) + δC ( x )). Từ đây có mệnh đề sau cho một điều kiện cần và đủ về cực tiểu của một hàm lồi trên một tập lồi bất kỳ. Mệnh đề 11.12. Cho C ⊆ IRn lồi, khác rỗng và f : IRn → IR ∪ {+∞}. Giả sử ri(dom f ) ∩ riC 6= ∅,

11.5 Phép tính với dưới đạo hàm.

193

Khi đó điều kiện cần và đủ để x ∈ C là cực tiểu của f trên C là 0 ∈ ∂ f ( x ) + NC ( x ), trong đó NC ( x ) := {w|hw, x − x i ≤ 0 ∀ x ∈ C}. là nón pháp tuyến ngoài của C tại x. Chứng minh. Gọi δC (.) là hàm chỉ của tập C. Khi đó x là điểm cực tiểu của f trên C khi và chi khi nó là cực tiểu của hàm h( x ) := f ( x ) + δC ( x ) trên toàn không gian. Điều kiện cần và đủ để x là cực tiểu của h trên IRn là 0 ∈ ∂h( x ). Do ri(dom f ) ∩ riC 6= ∅, theo Định lý Moreau-Rockafellar có: ∂h( x ) = ∂ f ( x ) + ∂δC ( x ). Vì x ∈ C, nên ∂δC ( x ) = NC ( x ). Vậy 0 ∈ ∂ f ( x ) + NC ( x ).

 Trong nhiều ứng dụng ta thường gặp một hàm là hợp của một hàm lồi với một toán tử tuyến tính. Mệnh đề dưới đây cho công thức tính dưới vi phân của hàm hợp này. Mệnh đề 11.13. Cho A : IRn → IRm là một toán tử tuyến tính và g là một hàm lồi chính thường trên IRm . Khi đó với mọi x ∈ IRn , ta có: A T ∂g( Ax ) ⊆ ∂( goA)( x ). Ngoài ra nếu g lồi và liên tục tại một điểm nào đó trong miền ảnh của A thì A T ∂g( Ax ) = ∂( goA)( x ) ∀ x

194

Nhập môn giải tích lồi ứng dụng

Chứng minh. Khẳng định A T ∂g( Ax ) ⊆ ∂( goA)( x ) được dễ dàng suy ra từ định nghĩa. Ta chỉ cần chứng minh chiều ngược lại. Lấy p ∈ ∂( goA)( x0 ). Khi đó hệ Ax − y = 0, g(y) − g( Ax0 ) − h p, x − x0 i < 0, x ∈ IRn , y ∈ IRm không có nghiệm. Đặt D := IRn × domg, B( x, y) := Ax − y. Theo giả thiết, tồn tại b ∈ ImA ∩ int(domg), nên b ∈ intB( D ). Theo Mệnh đề 9.6, tồn tại t ∈ IRn sao cho với mọi x ∈ IRn , y ∈ IRm , ta có: ht, Ax − yi + g(y) − g( Ax0 ) − h p, x − x0 i ≥ 0. Từ đây lấy y = Ax0 , được

ht, Ax − Ax0 i − h p, x − x0 i ≥ 0 ∀ x. Hay

h AT t − p, x − Ax0 i ≥ 0 ∀ x. Suy ra p = A T t. Bây giờ lấy x = x0 , ta được

ht, y − Ax0 i ≤ g(y) − g( Ax0 ) ∀y. Chứng tỏ t ∈ ∂g( Ax0 ) , và do p = A T t, nên p ∈ A T ∂g( Ax0 ).



Như thường lệ, ta nói một hàm véc-tơ g : IRn → IRm là lồi, nếu mọi thành phần của g là một hàm lồi. Một hàm số ϕ trên IRn được gọi là đơn điệu không giảm nếu x ≥ y, thì ϕ( x ) ≥ ϕ(y). Mệnh đề dưới đây cho công thức tính dưới vi phân của hàm hợp của các hàm lồi. Mệnh đề 11.14. Cho g( x ) = ( g1 ( x ), ..., gm ( x )) sao cho với mỗi gi : IRn → IR lồi. Giả sử ϕ : IRm → IR lồi, đơn điệu không giảm trên IRn . Khi đó hàm hợp f := ϕog lồi trên IRn và m

∂ f ( x ) = { ∑ λ j p j | p j ∈ ∂g j ( x ), (λ1 , ..., λm ) ∈ ∂ϕ( g( x ))}. j =1

195

11.5 Phép tính với dưới đạo hàm.

Chứng minh. Tính lồi của f được dễ dàng suy ra từ tính lồi của g, của ϕ và tính đơn điệu của ϕ. j j 0 Lấy p = ∑m j=1 λ j p với p ∈ ∂g j ( x ), λ = (λ1 , ..., λm ) ∈ ∂ϕ( g( x0 )).

Vậy

hλ, y − g( x0 )i ≤ ϕ(y) − ϕ( g( x0 )) ∀y. Lấy y = g( x0 ) + u với u ≤ 0. Khi đó do ϕ đơn điệu không giảm, nên hλ, ui ≤ ϕ( g( x0 ) + u) − ϕ( g( x0 )) ≤ 0. Do u ≤ 0, nên λ ≥ 0. Ta có

h p, x − x0 i =

m

∑ λ j h p j , x − x0 i j =1

m

∑ λ j [ gj (x) − gj (x0 )] = hλ, g(x) − g(x0 )i j =1

≤ ϕ( g( x )) − ϕ( g( x0 )) = f ( x ) − f ( x0 ) Điều này đúng với mọi x, nên suy ra p ∈ ∂ f ( x0 ). Để chứng minh chiều ngược lại, lấy p ∈ ∂ f ( x0 ). Theo định nghĩa của dưới vi phân, hệ x ∈ IRn , y ∈ IRm , g j ( x ) < y j , j = 1, ..., m, ϕ(y) − ϕ( g( x0 )) − h p, x − x0 i < 0 không có nghiệm, trong khi đó do các hàm g j lồi có nhận giá trị hữu hạn, nên hệ thứ nhất là một hệ lồi có nghiệm. Ap dụng Mệnh đề 9.5 đối với hệ bất đẳng thức lồi, tồn tại λ ∈ IRm + thoả mãn ϕ(y) − ϕ( g( x0 )) − h p, x − x0 i + hλ, g( x ) − yi ≥ 0 với mọi x ∈ IRn , y ∈ IRm . Lấy x = x0 , ta được ϕ(y) − ϕ( g( x0 )) ≥ hλ, y − g( x0 )i ∀y.

196

Nhập môn giải tích lồi ứng dụng

Suy ra λ ∈ ∂ϕ( g( x0 )). Mặt khác nếu lấy y = g( x0 ), ta được

h p, x − x0 i ≤

m

∑ λ j [ gj (x) − gj (x0 )] ∀ x. j =1

0 Chứng tỏ p ∈ ∂(∑ m j=1 λ j g j ( x )). Theo định lý Moreau-Rockafellar j j 0  p = ∑m j=1 λ j p , với p ∈ ∂g j ( x ).

Theo mệnh đề, khi hàm ϕ khả vi, ta có m

∂( ϕog)( x ) =

∂ϕ

∑ ∂y j (gj (x))∂gj (x).

j =1

Trong trường hợp f là hàm bao trên của một họ các hàm lồi f i (i ∈ I ), thì dưới đạo hàm của f sẽ được tính thông qua các dưới đạo hàm của các hàm thành phần f i dựa theo mệnh đề dưới đây. Mệnh đề 11.15. Cho f = max{ f 1 , ..., f m }, trong đó f i : IRn → IR. Đặt J ( x ) := { j| 1 ≤ j ≤ m : f ( x ) = f j ( x )}. Khi đó ∂ f ( x ) = co{∂ f j ( x ) | j ∈ J ( x )}. Chứng minh. Giả sử p ∈ ∂ f ( x0 ). Khi đó f ( x ) − f ( x0 ) − h p, x − x0 i < 0 không có nghiệm. Từ dây và chú ý rằng với bất kỳ x nào cũng tồn tại một chỉ số j (phụ thuộc x) để f ( x ) = f j ( x ) , ta suy ra hệ f j ( x ) − f ( x0 ) − h p, x − x0 i < 0, j = 1, ..., m không có nghiệm. Theo Mệnh đề 9.5, tồn tại các λ j ≥ 0, ∑m j =1 λ j = 1 sao cho m

∑ λ j [ f j (x) − f (x0 ) − h p, x − x0 i] ≥ 0 ∀ x. j =1

197

11.5 Phép tính với dưới đạo hàm. Lấy x = x0 và chú ý là f ( x0 ) = f j ( x0 ) với j ∈ J ( x0 ), ta được

λ j [ f j ( x0 ) − f ( x0 )] ≥ 0.

j 6∈ J ( x0 )

Từ đây và do f j ( x0 ) < f ( x0 ) với mọi j 6∈ J ( x0 ), ta suy ra λ j = 0 với mọi j 6∈ J ( x0 ). Vậy λ j [ f j ( x ) − f ( x0 ) − h p, x − x0 i] ≥ 0 ∀ x.

∑ j ∈ J ( x0 )

Do ∑ j∈ J (x0 ) λ j = 1, ta suy ra p ∈ ∂(

λ j f j ( x0 )).

j ∈ J ( x0 )

Theo Định lý Moreau-Rockaffellar ta có p = ∑ j∈ J (x0 ) λ j p j với p j ∈ ∂ f j ( x0 ). Vậy ∂ f ( x0 ) ⊆ co{∪∂ f j ( x0 )| j ∈ J ( x0 )}. Chiều ngược lại được dễ dàng suy ra từ định nghĩa của dưới vi phân.  Mệnh đề 11.16 (Định lý Minty). Dưới vi phân của một hàm lồi đóng chính thường trên IRn là một toán tử đơn điệu tuần hoàn cực đại. Chứng minh định lý này sẽ dùng đến bổ đề sau nói rằng một hàm lồi đóng chính thường không thể tiến tới vô cực âm nhanh hơn hàm −|| x ||2 . Bổ đề 11.2. Cho f là một hàm lồi đóng chính thường. Khi đó với mọi d ∈ IRn hàm số 1 hd ( x ) := f ( x ) + || x ||2 − hd, x i 2 thoả mãn điều kiện bức, theo nghĩa hd ( x ) → +∞ khi || x || → ∞.

198

Nhập môn giải tích lồi ứng dụng

Chứng minh. Do dom f 6= ∅, nên có c ∈ ∂ f (y). Vậy y ∈ dom f . Theo định nghĩa của dưới vi phân, ta suy ra 1 hd ( x ) ≥ f (y) + || x ||2 − hd, x i + hc, x − yi 2 1 = f (y) − hc, yi + || x ||2 + hc − d, x i. 2 Vì 1 1 || x ||2 + hc − d, x i ≥ || x ||2 − ||c − d|||| x || → ∞ khi || x || → ∞. 2 2 Vậy hd ( x ) → +∞ khi || x || → ∞.



Chứng minh định lý Minty. Tính đơn điệu tuần hoàn suy ra ngay từ định nghĩa. Ta chỉ cần chứng minh tính cực đại. Để chứng minh điều này ta chỉ ra rằng toán tử ∂ f + I với I là toán tử đồng nhất sẽ là toán tử tràn. Theo bổ đề trên, bài toán min{hd ( x ) | x ∈ IRn } có duy nhất nghiệm (do hd bức và lồi mạnh). Gọi x ∗ là nghiệm này. Khi đó 0 ∈ ∂hd ( x ∗ ). Dùng định lý MoreauRockafellar, ta có 0 ∈ ∂hd ( x ∗ ) = ∂ f ( x ∗ ) + x ∗ − d. Suy ra d ∈ x ∗ + ∂ f ( x ∗ ). Do d là bất kỳ, nên I + ∂ f là toán tử tràn. Từ đây theo định nghĩa của toán tử đơn điệu cực đại, ta suy ra ∂ f là toán tử đơn điệu cực đại. 

11.6. Dưới vi phân xấp xỉ Dưới vi phân xấp xỉ, hay còn được gọi là e-dưới vi phân, thường được sử dụng trong thực tế bởi hai lý do chính sau đây. Một là hàm lồi có thể không khả dưới vi phân tại những điểm thuộc biên của miền hữu dụng của nó, trong khi đó, như sẽ thấy dưới đây, trong miền này, dưới vi phân xấp xỉ luôn tồn tại. Lý do

199

11.6 Dưới vi phân xấp xỉ

thứ hai quan trọng hơn là trong ứng dụng, thường người ta chỉ cần, và nhiều khi chỉ tính được dưới vi phân một cách xấp xỉ. Định nghĩa 11.7. Cho e ≥ 0. Một véctơ x ∗ được gọi là e-dưới đạo hàm của f tại x, nếu

h x ∗ , y − x i + f ( x ) ≤ f (y) + e ∀y. Ký hiệu tập hợp tất cả e-dưới đạo hàm của f tại x là ∂e f ( x ). Tập này được gọi là e-dưới vi phân. Hiển nhiên ∂0 f ( x ) = ∂ f ( x ). Vậy dưới đạo hàm xấp xỉ là một khái niệm tổng quát hoá của dưới đạo hàm chính xác. Theo định nghĩa, x ∗ ∈ ∂e f ( x ) khi và chỉ khi

h x ∗ , z − x i + f ( x ) ≤ f (z) + e ∀z. Thay z = y + x, ta được

h x ∗ , yi + f ( x ) ≤ f ( x + y) + e ∀y. Từ đây, nếu đặt h(y) = f ( x + y) − f ( x ), ta có

h x ∗ , yi − h(y) ≤ e ∀y. Vậy theo định nghĩa hàm liên hợp ta có ∂ e f ( x ) = { x ∗ | h ∗ ( x ∗ ) ≤ e }.

(11.7)

Do h∗ là một hàm lồi, đóng, nên từ đây thấy rằng ∂e f ( x ) luôn là một tập lồi, đóng. Hiển nhiên ∂e f ( x ) ⊆ ∂e0 f ( x ) nếu e ≤ e0 . Hơn nữa ∩e>0 ∂e f ( x ) nếu khác rỗng thì sẽ bằng ∂ f ( x ). Ví dụ sau đây cho thấy rằng ∂e f ( x ) 6= ∅ với mọi e > 0, tuy nhiên ∂ f ( x ) = ∅. Cho hàm một biến f (x) =



−2x1/2 nếu x ≥ 0, +∞ nếu x < 0.

200

Nhập môn giải tích lồi ứng dụng

Khi đó ∂e f (0) 6= ∅ với e > 0, nhưng bằng rỗng khi e = 0. Mệnh đề sau đây nói rằng mọi hàm lồi đóng đều khả e-dưới vi phân với mọi e > 0 và tại mọi điểm thuộc miền hữu dụng của nó. Mệnh đề 11.17. Cho f là một hàm lồi đóng chính thường trên IRn . Khi đó với mọi e > 0 và mọi x0 ∈ dom f , tập ∂e f ( x0 ) 6= ∅. Hơn nữa với mọi tập bị chặn C ⊂ int(dom f ), tập ∂e f (C) bị chặn. Chứng minh. Do f lồi, đóng, chính thường, nên epi f lồi, đóng khác rỗng. Do epi f đóng, nên điểm ( x0 , f ( x0 ) − e) 6∈ epi f với mọi e > 0. Ap dụng định lý tách mạnh cho hai tập C := epi f và D := {( x0 , f ( x0 ) − e)}, sẽ tồn tại ( p, t) 6= 0, p ∈ IRn , t ∈ IR và số thực η (phụ thuộc e ) sao cho

h p, x i − tν < η < h p, x0 i − t( f ( x0 ) − e) ∀( x, ν) ∈ epi f . (11.8) Từ đây ta có t 6= 0, vì nếu t = 0, thì

h p, x i < η < h p, x0 i ∀ x ∈ dom f , và do đó ta có mâu thuẫn, nếu lấy x = x0 . Hơn nữa t > 0 vì nếu t < 0, ta sẽ có mâu thuẫn từ (11.8) khi cho ν đủ lớn. Thay ν = f ( x ) và chia hai vế của (11.8) cho t > 0, ta sẽ có 1t p ∈ ∂e f ( x0 ). Tương tự như trường hợp dưới vi phân chính xác, ta chứng minh được ∂e f (C) compact nếu C ⊂ int(dom f ) và C compact.  Cũng như dưới vi phân chính xác, Định lý Moreau-Rockafellar cũng đúng cho dưới vi phân xấp xỉ. Mệnh đề 11.18 (Moreau-Rockafellar). Cho f i , i = 1, ..., m. là các hàm lồi chính thường trên IRn . Khi đó m

m

i =1

i =1

∑ ∂e fi (x) ⊆ ∂e ( ∑ fi (x))

∀ x.

201

11.6 Dưới vi phân xấp xỉ Nếu ∩ri(dom f i ) 6= ∅, thì m

m

∑ ∂e fi (x) = ∂e ( ∑ fi (x)) i =1

∀ x.

i =1

Chứng minh. Hoàn toàn tương tự như trường hợp dưới vi phân chính xác. Mệnh đề 11.19. Cho f : IRn → IR là hàm lồi đóng. Khi đó một véc-tơ x ∗ là e-dưới vi phân của f tại x ∈ dom f khi và chỉ khi f ∗ ( x ∗ ) + f ( x ) − h x ∗ , x i ≤ e.

(11.8)

Chứng minh. Dùng định nghĩa e-dưới đạo hàm ta có: f ( x ) + [h x ∗ , yi − f (y)] − h x ∗ , x i ≤ e ∀y ∈ dom f . Từ đây áp dụng định nghĩa của f ∗ ( x ∗ ), sẽ suy ra điều phải chứng minh.  Dưới đây là một ứng dụng của dưới vi phân xấp xỉ trong tối ưu hoá. Hãy xét bài toán quy hoạch min{ f ( x ) | x ∈ C} trong đó C ⊆ IRn và f là một hàm lồi trên C. Trong nhiều trường hợp bài toán này có thể không có lời giải tối ưu chính xác, tức là không tồn tại một điểm x ∗ ∈ C sao cho f ( x ∗ ) ≤ f ( x ) với mọi x ∈ C. Khi đó ta phải bằng lòng với khái niệm lời giải tối ưu xấp xỉ, hay còn gọi là e-tối ưu. Hơn nữa trong thực tế thường người ta không tính được lời giải tối ưu (chính xác), mà chỉ tính được lời giải xấp xỉ. Định nghĩa 11.8. Cho e ≥ 0. Một điểm xe ∈ C được gọi là điểm e−cực tiểu của f trên C nếu f ( xe ) ≤ f ( x ) + e với mọi x ∈ C.

202

Nhập môn giải tích lồi ứng dụng

Dựa vào dưới đạo hàm xấp xỉ ta cũng xác lập được điều kiện cho e- tối ưu. Cụ thể ta có mệnh đề sau đây. Mệnh đề 11.20. Cho f : IRn → IR lồi. Điểm xe là e-tối ưu của bài toán min{ f ( x ) : x ∈ IRn } khi và chỉ khi 0 ∈ ∂e f ( xe ). Chứng minh. Ta có xe là e-tối ưu của f trên IRn khi và chỉ khi f ( xe ) ≤ f ( x ) + e ∀ x. Điều này tương đương với 0 ∈ ∂e f ( xe ). 

11.7. Bài tập I 11.1. Cho f : IRn → IR khả vi, lồi mạnh với hệ số η > 0. Chứng minh rằng a. Ánh xạ đạo hàm O f đơn điệu mạnh, theo nghĩa

hO f ( x ) − O f (y), x − yi ≥ η || x − y||2 ∀ x, y. b. dom f ∗ = IRn và ánh xạ O f ∗ (.) Lipschitz với hệ số 1/η, tức là 1 ||O f ∗ (u) − O f ∗ (v)|| ≤ ||u − v|| ∀u, v. η c. Mở rộng khẳng định trên cho trường hợp hàm không khả vi với ánh xạ O f được thay bởi ánh xạ đa trị ∂ f .

I 11.2. Chứng minh rằng với mọi e > 0, hai tính chất sau là tương đương: (i) 0 ∈ ∂e f ( x )

203

11.7 Bài tập (ii) f ( x ) ≤ f (y) + e ∀y, e ≥ 0

I 11.3. Cho hàm một biến  −2x1/2 nếu x ≥ 0, f (x) = +∞ nếu x < 0. a. Chứng tỏ rằng f lồi, chính thường b. Chỉ ra rằng ∂ f (0) = ∅. c. Chứng tỏ rằng tập e-dưới vi phân của f tại x = 0 là tập hợp các x ∗ thoả mãn x ∗ y + 2y1/2 − e ≤ 0 ∀y ≥ 0.

I 11.4. Tính e dưới vi phân của hàm một biến f ( x ) = | x |. I 11.5. Cho f là hàm lồi đóng trên IRn . Chứng minh rằng x ∗ ∈ ∂e f ( x ) khi và chỉ khi x ∈ ∂e f ∗ ( x ∗ ) Chỉ dẫn Ap dụng Mệnh đề 11.16 và f = f ∗∗ .

I 11.6. Cho f là hàm lồi đóng trên IRn . Chứng minh rằng với e > 0, ta có: ∂e f ( IRn ) = dom f ∗ . Hãy cho ví dụ nói rằng điều trên là không đúng khi e = 0.

I 11.7. Cho f là hàm lồi đóng trên IRn . Chứng tỏ rằng nếu với một e > 0 và x ∈ dom f mà ∂e f ( x ) chỉ gồm duy nhất một điểm, thì f là hàm a-phin trên IRn . I 11.8. Cho f là hàm lồi đóng trên IRn và thoả mãn điều kiện bức f (x) → +∞ khi || x || → +∞. Chứng minh rằng với mọi x ∈ dom f || x || ta có: 0 ≤ e ≤ e0 ⇒ ∂e f ( x ) ⊆ int(∂e0 f ( x )). Chỉ dẫn. Sử dụng điều kiện bức để thấy rằng hàm f ∗ (.) − h., x i hữu hạn khắp nơi.

204

Nhập môn giải tích lồi ứng dụng

Chương 12 MINIMAX VÀ CÂN BẰNG

12.1. Hàm yên ngựa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.2. Định lý minimax . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.3. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

206 210 225

Ngày nay trong xu hướng hội nhập của thế giới và mối liên quan mật thiết của các đối tác, một phương án tối ưu có thể tốt cho đối tác này, nhưng lại không thoả mãn đối tác khác. Do đó các phương án cân bằng (theo nghĩa của Nash) thường dễ được chấp nhận cho mọi đối tác. Đây cũng là một lý do mà vấn đề cân bằng đang được quan tâm nghiên cứu. Các định lý minimax đối với hàm yên ngựa là những định lý cơ bản trong giải tích lồi và là một công cụ quan trọng trong việc nghiên cứu các bài toán cân bằng. Các định lý này có nhiều ứng dụng trong các lĩnh vực khác nhau đặc biệt là trong tối ưu hoá, lý thuyết trò chơi. Minimax và cân bằng là hai vấn đề liên quan chặt chẽ với nhau. Chương này chủ yếu trình bày các định lý minimax cùng mối liên hệ của nó với bài toán tối ưu và cân bằng.

206

Nhập môn giải tích lồi ứng dụng

12.1. Hàm yên ngựa Trong nhiều vấn đề, ta thường phải làm việc với một song hàm, tức là một hàm số thực của hai nhóm biến có tính chất là tựa lồi theo nhóm biến thứ nhất khi nhóm biến thứ hai cố định và tựa lõm theo nhóm biến thứ hai, khi nhóm biến thứ nhất cố định. Các song hàm này được gọi là hàm yên ngựa. Để định nghĩa hàm yên ngựa, ta nhắc lại rằng một hàm số thực ϕ được gọi là tựa lồi trên một tập lồi C, nếu với mọi số thực γ tập mức dưới

{ x ∈ C | ϕ( x ) ≤ γ} lồi. Tương tự hàm ϕ được gọi là tựa lõm trên C nếu − ϕ là hàm tựa lồi trên C. Dễ thấy rằng nếu ϕ tựa lồi trên C thì với mọi x, y ∈ C và λ ∈ [0, 1] ta có ϕ(λx + (1 − λ)y) ≤ max( ϕ( x ), ϕ(y)). Tương tự nếu ϕ tựa lõm trên C, thì với mọi x, y ∈ C và λ ∈ [0, 1] ta có ϕ(λx + (1 − λ)y) ≥ min( ϕ( x ), ϕ(y)). Từ định nghĩa suy ra ngay là mọi hàm lồi (lõm) trên C, đều tựa lồi (tựa lõm) trên C. Một ví dụ về hàm tựa lồi không phải là hàm lồi là hàm phân thức a-phin có dạng sau ϕ( x ) :=

aT x + α bT x + β

trong đó a, b, x ∈ IRn và α, β ∈ IR. Hàm này vừa tựa lồi vừa tựa lõm trên mọi tập lồi C, mà trên đó mẫu số khác 0.

207

12.1 Hàm yên ngựa

Định nghĩa 12.1. Cho C ⊆ IRn , D ⊆ IRm là các tập lồi khác rỗng và f : C × D → IR. Hàm f được gọi là hàm yên ngựa trên C × D, nếu với mọi y ∈ D cố định, hàm f (., y) tựa lồi trên C và với mọi x ∈ C cố định, hàm f ( x, .) tựa lõm trên D.

điểm yên ngựa

Hình 6. Hàm yên ngựa Một hàm yên ngựa cũng được gọi là hàm tựa - lồi tựa - lõm. Do mọi hàm lồi đều là tựa lồi và mọi hàm lõm đều tựa lõm, nên hàm lồi-lõm (nói riêng hàm song tuyến) là hàm yên ngựa. Định nghĩa 12.2. Một điểm ( x ∗ , y∗ ) ∈ C × D được gọi là điểm yên ngựa của hàm f trên C × D nếu f ( x ∗ , y) ≤ f ( x ∗ , y∗ ) ≤ f ( x, y∗ ) ∀ x ∈ C, ∀y ∈ D. Từ định nghĩa suy ra ngay rằng x ∗ là điểm cực tiểu của hàm f (., y∗ ) trên C và y∗ ∈ D là điểm cực đại của hàm f ( x ∗ , .) trên D. Ví dụ 1. f ( x, y) := x T Ay + aT x + bT y + ξ trong đó A là ma trận thực cấp m × n và a ∈ IRn , b ∈ IRm là hàm yên ngựa trên IRn × IRm , vì đây là hàm song tuyến. Ví dụ 2. Cho f và g j ( j = 1, ..., m) là các hàm lồi trên tập lồi C. Khi đó hàm m

L( x, y) := y0 f ( x ) + ∑ y j g j ( x ) j =1

208

Nhập môn giải tích lồi ứng dụng

+1 là hàm yên ngựa trên C × IRm vì nó là hàm lồi theo x trên C và + m+1 tuyến tính theo y trên IR+ . Hàm L này thường được gọi là hàm Lagrange của bài toán tối ưu

min{ f ( x ) | x ∈ C, g j ( x ) ≤ 0, j = 1, ..., m}. Ví dụ 3. (Trò chơi không hợp tác). Xét một trò chơi không hợp tác gồm hai đấu thủ. Gọi C là tập chiến lược của đấu thủ thứ nhất (đấu thủ 1) và D là tập chiến lược của đấu thủ thứ hai (đấu thủ 2). Như vậy đấu thủ 1 chỉ được phép chọn các phương án chơi trong tập C và đấu thủ 2 chỉ được chọn trong D. Cặp phương án ( x, y) được gọi là chấp nhận được khi ( x, y) ∈ C × D. Giả sử f 1 : C × D → IR là hàm thua thiệt của đấu thủ 1; tương tự f 2 : C × D → IR là hàm thua thiệt của đấu thủ 2: nghĩa là nếu đấu thủ 1 chọn phương án chơi x ∈ C và đấu thủ 2 chọn phương án chơi y ∈ D, thì đấu thủ 1 thua thiệt là f 1 ( x, y) và đấu thủ 2 thua thiệt là f 2 ( x, y). Lẽ tự nhiên là mỗi đấu thủ đều muốn chọn phương án chơi, sao cho thua thiệt của mình là nhỏ nhất. Điều này dẫn đến khái niệm điểm cân bằng được định nghĩa như sau: Ta gọi ( x ∗ , y∗ ) ∈ C × D là điểm cân bằng của trò chơi nếu f 1 ( x ∗ , y∗ ) = min f 1 ( x, y∗ ) x∈C

và f 2 ( x ∗ , y∗ ) = min f 2 ( x ∗ , y). y∈ D

Như vậy điểm cân bằng của trò chơi là một cặp phương án chấp nhận được, tại đó thua thiệt của mỗi đối thủ đều thấp nhất (khi đối thủ kia chọn phương án của mình trong cặp phương án cân bằng). Thông thường người ta giả sử f 1 ( x, y) + f 2 ( x, y) = 0 với mọi x ∈ C, y ∈ D. Giả thiết này có nghĩa rằng phần thua thiệt của

209

12.1 Hàm yên ngựa

đấu thủ này, chính là phần thắng của đấu thủ kia. Vậy ta có thể coi f 1 ( x, y) = f ( x, y), f 2 ( x, y) = − f ( x, y). hàm f được gọi là hàm giá trị của trò chơi. Với giả thiết này, ta thấy rằng ( x ∗ , y∗ ) là điểm cân bằng của trò chơi khi và chỉ khi

( x ∗ , y∗ ) ∈ C × D f ( x ∗ , y) ≤ f ( x ∗ , y∗ ) ≤ f ( x, y∗ ) ∀ x ∈ C, ∀y ∈ D.. Như vậy điểm cân bằng của trò chơi chính là điểm yên ngựa của hàm giá trị trên tập chiến lược C × D. Thật vậy, ta có f 1 ( x ∗ , y∗ ) = f ( x ∗ , y∗ ) = min f ( x, y∗ ) x∈C

  f 2 ( x ∗ , y∗ ) = − f ( x ∗ , y∗ ) = min − f ( x ∗ , y) y∈ D

\= − max f ( x , y). y∈ D

Vậy f ( x ∗ , y∗ ) = max f ( x ∗ , y). y∈ D

Chứng tỏ ( x ∗ , y∗ ) là điểm yên ngựa của hàm f trên C × D. Dĩ nhiên không phải bất kỳ song hàm nào cũng có điểm yên ngựa. Hãy xét ví dụ sau: Cho f ( x, y) = − x2 + y( x − 1), với x, y ∈ IR, Hàm này không có điểm yên ngựa trên tập C × D với C = D = IR+ . Mục tiếp theo trình bày các định lý minimax, từ đó có thể suy ra sự tồn tại điểm yên ngựa.

210

Nhập môn giải tích lồi ứng dụng

12.2. Định lý minimax Cho một song hàm f : C × D → IR. Nhiều vấn đề trong tối ưu hoá, lý thuyết trò chơi và các lĩnh vực khác đưa đến câu hỏi khi nào có đẳng thức γ := sup inf f ( x, y) = inf sup f ( x, y) := η y∈ D x ∈ C

x ∈ C y∈ D

(12.1)

Đẳng thức này nói rằng việc lấy cận trên đúng và cận dưới đúng có thể hoán vị cho nhau. Chú ý rằng, từ định nghĩa của cận trên đúng và cận dưới đúng, ta có ngay sup inf f ( x, y) ≤ inf sup f ( x, y). y∈ D x ∈ C

x ∈ C y∈ D

(12.2)

Tuy nhiên bất đẳng thức ngược lại chỉ đúng với những điều kiện nhất định cho song hàm f và các tập C, D. Các định lý minimax là các định lý nghiên cứu các điều kiện để có đẳng thức (12.1). Trước hết ta xét bổ đề quan trọng sau, là cơ sở để chứng minh các định lý minimax. Bổ đề 12.1. Cho C ⊆ IRn , D ⊆ IRm là các tập lồi, đóng khác rỗng và f : C × D → IR. Giả sử với mọi y ∈ D, hàm f (., y) tựa lồi, nửa liên tục dưới trên C và với mọi x ∈ C, hàm f ( x, .) tựa lõm, nửa liên tục trên trên D. Khi đó ta có: (i) Với mọi γ0 > γ := supy∈ D infx∈C f ( x, y) và mọi tập hữu hạn N ⊂ D, tập C( N ) := { x ∈ C | max f ( x, y) ≤ γ0 } 6= ∅. y∈ N

(ii) Với mọi η 0 < η = infx∈C supy∈ D f ( x, y) và mọi tập hữu hạn M ⊂ C, tập D ( M) := {y ∈ D | min f ( x, y) ≥ η 0 } 6= ∅. x∈ M

12.2 Định lý minimax

211

Chứng minh. Đặt Cγ0 (y) := { x ∈ C | f ( x, y) ≤ γ0 }. Do C lồi, f (., y) tựa lồi và nửa liên tục dưới, nên Cγ0 (y) lồi đóng. Để ý rằng khẳng định (i) có nghĩa là ∩y∈ N Cγ0 (y) 6= ∅. Ta chứng minh (i) bằng quy nạp theo số phần tử của N. Khi N chỉ có duy nhất một phần tử y, tập Cγ0 ( N ) = Cγ0 (y) = { x ∈ C| f ( x, y) ≤ γ0 }. Do γ0 > γ ≥ infx∈C f ( x, y), nên theo định nghĩa của cận dưới đúng, tồn tại x ∈ C thoả mãn f ( x, y) ≤ γ0 . Suy ra Cγ0 ( N ) 6= ∅. Vậy (i) đúng khi N chỉ có một phần tử. Giả sử (i) đúng với N có k phần tử . Ta chứng tỏ nó đúng khi N có k + 1 phần tử. Giả sử N := {y1 , ..., yk , yk+1 }. Đặt Cγ0 0 (yi ) := Cγ0 (yi ) ∩ Cγ0 (yk+1 ) (i = 1, ..., k) Khi đó

∩ik=+11 Cγ0 (yi ) = ∩ik=1 Cγ0 0 (yi ). Theo giả thiết qui nạp ∩ik=1 Cγ0 0 (yi ) 6= ∅, nếu như các tập Cγ0 0 (yi ) = Cγ0 (yi ) ∩ Cγ0 (yk+1 ) 6= ∅ Vậy vấn đề còn lại là chứng minh rằng với hai điểm bất kỳ a, b ∈ D, thì Cγ0 (a) ∩ Cγ0 (b) 6= ∅. Giả sử trái lại. Do tính nửa liên tục dưới theo biến thứ nhất của hàm f , ta chỉ cần chứng minh (i) cho α với bất kỳ α ∈ (γ, γ0 ). Do α > supy∈ D inf∈C f ( x, y), nên Cα (y) 6= ∅ ∀y ∈ D. Để đơn giản, sau đây với mọi y, ta viết C(y) thay cho Cα (y). Lấy yt := ta + (1 − t)b với 0 ≤ t ≤ 1. Do D lồi, nên yt ∈ D. Với mọi x ∈ C(yt ) ta có f ( x, yt ) ≤ α. Do f tựa lõm theo biến thứ hai, nên f ( x, yt ) ≥ min{ f ( x, a), f ( x, b)}. Vậy min{ f ( x, a), f ( x, b)} ≤

212

Nhập môn giải tích lồi ứng dụng

α. Do đó hoặc f ( x, a) ≤ α hoặc f ( x, b) ≤ α. Vì điều này đúng với mọi x ∈ C(yt ), nên C ( y t ) ⊂ C ( a ) ∪ C ( b ).

(12.3)

Do C(a), C(b), C(yt ) lồi và hai tập C(a), C(b) rời nhau, nên từ (12.3) suy ra C(yt ) ⊂ C(a) hoặc C(yt ) ⊂ C(b).

(12.4)

Đặt Ma := {t |0 ≤ t ≤ 1 : C(yt ) ⊂ C(a)}, Mb := {t |0 ≤ t ≤ 1 : C(yt ) ⊂ C(b)}. Hiển nhiên 0 ∈ Ma , 1 ∈ Mb và Ma ∪ Mb = [0, 1]. Một cách hoàn toàn tương tự như trên, ta chứng minh được C(yt ) ⊂ C(yt1 ) ∪ C(yt2 ) ∀t ∈ [t1 , t2 ] ⊂ [0, 1]. Dễ kiểm tra được rằng, t ∈ Ma , kéo theo [0, t] ⊂ Ma và t ∈ Mb kéo theo [t, 1] ⊂ Mb . Đặt s := sup Ma . Giả sử s ∈ Ma (nếu s ∈ Mb , thì cũng lý luận tương tự). Vì α > γ ≥ inf f ( x, ys ), nên tồn tại x¯ ∈ C sao cho ¯ ys ) < α. Do tính nửa liên tục trên của f ( x, ¯ .), nên f ( x, ¯ yt ) < α f ( x, với mọi t > s và đủ gần s. Nói cách khác x¯ ∈ C(yt ) với mọi t đủ gần s. Khi đó C(yt ) ⊂ C(a). Từ đây, theo định nghĩa của Ma , ta có t ∈ Ma . Nhưng t > s = sup Ma : mâu thuẫn. Như vậy C(a) ∩ C(b) 6= ∅. Điều khẳng định (ii) có thể suy ra từ khẳng định (i), với chú ý hàm − f tựa lồi và nửa liên tục dưới theo biến thứ hai và     − min sup f ( x, y) = max inf (− f ( x, y) . x∈ M

y∈ D

x∈ M

y∈ D

213

12.2 Định lý minimax

 Ta sẽ sử dụng bổ đề này để chứng minh định lý minimax sau: Định lý 12.1. Cho C ⊆ IRn , D ⊆ IRm là các tập lồi, đóng khác rỗng và f : C × D → IR. Giả sử với mọi y ∈ D, hàm f (., y) tựa lồi, nửa liên tục dưới trên C và với mọi x ∈ C, hàm f ( x, .) tựa lõm, nửa liên tục trên trên D. Khi đó nếu có một trong hai điều kiện sau: (A) Có một tập hữu hạn N∗ ⊂ D và một số η∗ > γ sao cho tập C( N∗ ) := { x ∈ C | max f ( x, y) ≤ η∗ } y∈ N∗

compact (B) Có một tập hữu hạn M∗ ⊂ C và một số γ∗ < η sao cho tập D ( M∗ ) := {y ∈ D | min f ( x, y) ≥ γ∗ } x ∈ M∗

compact. Khi đó sup inf f ( x, y) = inf sup f ( x, y). y∈ D x ∈ C

x ∈ C y∈ D

Cụ thể hơn, ta có sup min f ( x, y) = inf sup f ( x, y). y∈ D x ∈C ( N∗ )

x ∈ C y∈ D

nếu có (A) và inf sup f ( x, y) = max inf f ( x, y).

x ∈ C y∈ D

nếu có (B).

y∈ D ( M∗ ) x ∈ C

214

Nhập môn giải tích lồi ứng dụng

Chứng minh. Ta giả sử có (A) (trường hợp có (B), chứng minh hoàn toàn tương tự). Khi đó γ < +∞. Do (12.2), nên chỉ cần chứng minh γ ≥ inf sup f ( x, y) x ∈ C y∈ D

Lấy α ∈ (γ, η ) bất kỳ và xét tập C0 (y) := C( N∗ ) ∩ C(y). Ap dụng Bổ đề 12.1 với tập N = N∗ ∪ {y} và γ0 = α, ta có C0 (y) 6= ∅. Cũng theo bổ đề này họ tập {C0 (y) |y ∈ D } có tính chất tương giao hữu hạn. Ngoài ra tất cả các tập này đều nằm trong tập compact C( N∗ ). Do đó theo định lý tương giao hữu hạn (định lý Helley) của các tập lồi đóng, ta có ∩y∈ D C0 (y) 6= ∅. Nhưng theo định nghĩa của C0 (y), thì ∩y∈ D C0 (y) = ∩y∈ D C(y). Lấy x ∗ ∈ ∩y∈ D C(y). Ta có x ∗ ∈ C( N∗ ), f ( x ∗ , y) ≤ α ∀y ∈ D. Suy ra min sup f ( x, y) ≤ sup f ( x ∗ , y) ≤ α.

x ∈C ( N∗ ) y∈ D

y∈ D

Do α là số bất kỳ thoả mãn α ≥ γ, nên ta có điều phải chứng minh là γ ≥ min sup f ( x, y). x ∈C ( N∗ ) y∈ D

 Nhận xét 1. Điều kiện (A) sẽ thoả mãn nếu có điều kiện bức sau; (AC) Có một tập hữu hạn N∗ ⊂ D sao cho max f ( x, y) → +∞ khi x ∈ C, || x || → +∞ y∈ N∗

Điều kiện (B) thoả mãn nếu ta có điều kiện bức sau:

215

12.2 Định lý minimax (BC) Có một tập hữu hạn M∗ ⊂ C sao cho min f ( x, y) → −∞ khi y ∈ D, ||y|| → +∞.

y∈ M∗

Thật vậy, giả sử có (AC). Ta có thể giả thiết γ := sup inf f ( x, y) < +∞, y∈ D x ∈ C

vì nếu trái lại đẳng thức minimax (12.1) luôn đúng. Lấy η¯ > γ, thì tập C( N∗ ) := { x ∈ D | sup f ( x, y) ≤ η¯ } y∈ N∗

bị chặn (và do dó compact), vì nếu có một dãy x ν ∈ C( N∗ ) với || x ν || → +∞, thì theo điều kiện (AC), ta có supy∈ N∗ f ( x ν , y) → +∞. Vậy (AC) kéo theo (A). Tương tự ta chứng minh được (BC) kéo theo (B). Nhận xét 2. Hiển nhiên, nếu C là tập compact, thì (A) thoả mãn và nếu D là tập compact, thì (B) thoả mãn. Bây giờ ta xét một ứng dụng của định lý minimax cho bài toán tối ưu sau, đã được xét ở chương 9: f ∗ := min{ f ( x ) | x ∈ X, g j ( x ) ≤ 0, j = 1, ..., m}

(OP)

Hàm Lagrange của bài toán này được cho bởi m

L( x, y) := f ( x ) + ∑ y j g j ( x ). j =1

Với mỗi y ≥ 0, đặt d(y) := inf L( x, y) x∈X

và xét bài toán d∗ := sup{d(y) : y ≥ 0}.

(OD )

216

Nhập môn giải tích lồi ứng dụng

Ta nói (OD) là bài toán đối ngẫu của (OP), còn (OP) được gọi là bài toán gốc. Từ định nghĩa, suy ra ngay rằng d∗ = sup d(y) ≤ inf sup L( x, y) = f ∗ . x ∈ X y≥0

y≥0

Trong trường hợp f ∗ = d∗ , tức là giá trị tối ưu của bài toán đối ngẫu bằng giá trị tối ưu của bài toán gốc, thì ta sẽ nói hai bài toán này là cặp đối ngẫu chính xác. Khi đó sup inf L( x, y) = inf sup L( x, y). y≥0 x ∈ X

x ∈ X y≥0

Như vậy trong trường hợp có đối ngẫu chính xác, ta sẽ có định lý minimax cho hàm Lagrange trên tâp X × IRm + . Từ định lý minimax 12.1, có thể suy ra mệnh đề sau: Mệnh đề 12.1. Giả sử X 6= ∅ là một tập lồi, đóng trong IRn và f , g j (j = 1, ..., m) là các hàm thực, lồi, nửa liên tục dưới trên X. Ngoài ra điều kiện Slater: tồn tại x0 ∈ X sao cho g j ( x0 ) < 0 với mọi j. Khi đó (OP) và (OD) là cặp đối ngẫu chính xác. Chứng minh. Ap dụng định lý 12.1 cho hàm Lagrange với C := 0 X, D := IRm + . Lấy M∗ := { x }. Theo điều kiện Slater và do y j ≥ 0 với mọi j, suy ra m

L( x0 , y) = f ( x0 ) + ∑ y j g j ( x0 ) → −∞ khi ||y|| → +∞. j =1

Theo nhận xét 1, điều kiện (BC) thoả mãn, do đó ta có sup inf L( x, y) = inf sup L( x, y). y≥0 x ∈ X

x ∈ X y≥0

Vậy (OP) và (OD) là cặp đối ngẫu chính xác. Mệnh đề dưới đây cho mối liên hệ giữa điểm yên ngựa của hàm Lagrange và nghiệm tối ưu của cặp bài toán đối ngẫu.

217

12.2 Định lý minimax

Mệnh đề 12.2. Giả sử X lồi, đóng, khác rỗng, f , g j (j = 1, ..., m) lồi, nửa liên tục dưới trên X và điều kiện Slater được thoả mãn. Khi đó x ∗ là nghiệm tối ưu của (OP) khi và chỉ khi tồn tại y∗ sao cho ( x ∗ , y∗ ) là điểm yên ngựa của hàm Lagrange L trên X × IRm + . Trong trường hợp ∗ này, y sẽ là nghiệm tối ưu của bài toán đối ngẫu (OD) thoả mãn điều kiện độ lệch bù y∗j g j ( x ∗ ) = 0 với mọi j. Chứng minh. Giả sử x ∗ là nghiệm tối ưu của (OP). Theo mệnh đề trên, hai bài toán (OP) và (OQ) là cặp đối ngẫu chính xác. Khi đó, tồn tại y∗ ≥ 0 sao cho f ( x ∗ ) = d(y∗ ) = inf L( x, y∗ ). x∈X

Từ đây có f ( x ∗ ) ≤ L( x, y∗ ) ∀ x ∈ X. Nói riêng, khi x = x ∗ ta được ∗

m

f ( x ) ≤ f ( x ) + ∑ y∗j g j ( x ∗ ). j =1

Từ đây và do y∗j ≥ 0 và g j ( x ∗ ) ≤ 0 với mọi j, nên y∗j g j ( x ∗ ) = 0 ∀ j và do đó f ( x ∗ ) = L( x ∗ , y∗ ) ≤ L( x, y∗ ) ∀ x ∈ X. Chứng tỏ x ∗ là điểm cực tiểu của L(., y∗ ) trên X. có

Ngoài ra, lại từ y∗j g j ( x ∗ ) = 0 ∀ j và định nghĩa của L( x ∗ , y∗ ), ta m

L( x ∗ , y∗ ) = f ( x ∗ ) ≥ f ( x ∗ ) + ∑ y j g j ( x ∗ ) = L( x ∗ , y) ∀y ≥ 0. j =1

Vậy y∗ là điểm cực đại của hàm L( x ∗ , .) trên IRm + . Kết hợp lại, ta ∗ ∗ thấy ( x , y ) là điểm yên ngựa của L trên X × IRm +.

218

Nhập môn giải tích lồi ứng dụng

Bây giờ giả sử ( x ∗ , y∗ ) là điểm yên ngựa của L trên X × IRm +. ∗ Trước hết ta có g j ( x ) ≤ 0 với mọi j. Thật vậy, vì nếu tồn tại i sao cho gi ( x ∗ ) > 0, thì lấy y = ξei , trong đó ξ ≥ 0 và ei là véc-tơ đơn vị thứ i rồi cho ξ → +∞, sẽ được L( x ∗ , ξei ) → +∞ khi ξ → +∞. Điều này mâu thuẫn với L( x ∗ , y) ≤ L( x ∗ , y∗ ). Từ đây ta có ∗

m

L( x , 0) = f ( x ) ≥ f ( x ) + ∑ y∗j g j ( x ∗ ) = L( x ∗ , y∗ ). j =1

Thế nhưng do ( x ∗ , y∗ ) là điểm yên ngựa, nên L( x ∗ , y∗ ) ≥ L( x ∗ , y) với mọi y ≥ 0, nên từ bất đẳng thức trên, ta suy ra y∗j g j ( x ∗ ) = 0 với mọi j. Khi đó, do x ∗ là điểm cực tiểu của hàm L(., y∗ ) trên X, nên ∗

m

f ( x ) = L( x , y ) ≤ f ( x ) +

∑ y j g j (x∗ ) ∀ x ∈ X. j =1

Vậy f ( x ∗ ) ≤ f ( x ) ∀ x ∈ X, g j ( x ) ≤ 0 j = 1, ..., m. Chứng tỏ x ∗ là nghiệm tối ưu của (OP). Để chứng tỏ y∗ là nghiệm tối ưu của bài toán đối ngẫu (OD) ta chú ý rằng d(y) = inf

x∈X



m

f (x) + ∑ y j g j (x) j =1



m

≤ f ( x ∗ ) + ∑ y j g j ( x ∗ ) ≤ f ( x ∗ ) ∀y ≥ 0. j =1

Thế nhưng d(y∗ ) = min L( x, y∗ ) x∈X

m

\= f ( x ∗ ) + ∑ y∗j g j ( x ∗ ) = f ( x ∗ ). j =1

219

12.2 Định lý minimax

Vậy d(y∗ ) ≥ d(y) ∀y ≥ 0. Chứng tỏ y∗ là nghiệm tối ưu của bài toán đối ngẫu (OD). . Bài toán cân bằng Phần trên ta đã có dịp xét mô hình cân bằng cho trò chơi không hợp tác hai đối thủ. Bây giờ ta xét một mô hình có nhiều đối tác (đối thủ) tham gia, trong đó mỗi đối tác đều có một hàm lợi ích riêng. Giả sử mỗi quyết định của đối tác này lại phụ thuộc vào chiến lược của các đối tác khác. Thông thường lợi ích của các đối tác hay mâu thuẫn, thậm chí đối kháng nhau. Trong trường hợp này một phương án tối ưu cho tất cả các đối tác thường là không tồn tại. Khi đó người ta nghĩ đến một phương án mang tính cân bằng để "thu hút’" được mọi đối tác, theo nghĩa nếu bất kỳ một đối tác nào đó ra khỏi điểm cân bằng, trong khi các đối tác còn lại chọn phương án cân bằng, thì đối tác kia sẽ bị thua thiệt. Ta sẽ hiểu rõ thêm về khái niệm cân bằng khi xét bài toán cân bằng Nash trong trò chơi không hợp tác, sẽ được trình bày dưới đây. Một cách hình thức, ta sẽ mô tả bài toán cân bằng như sau: Cho C là một tập lồi đóng trong IRn và φ : C × C → IR. Xét bài toán sau, thường được gọi là bài toán cân bằng hay là bất đẳng thức Ky Fan: Tìm x ∈ C sao cho φ( x, y) ≥ 0 ∀y ∈ C.

(EP)

Về mặt hình thức, bài toán này khá đơn giản, tuy nhiên nó bao hàm được nhiều lớp bài toán quan trọng thuộc nhiều lĩnh vực. Dưới đây là một số ví dụ điển hình. 1. Bài toán tối ưu. Xét bài toán min{ ϕ( x )| x ∈ C}.

220

Nhập môn giải tích lồi ứng dụng

Đặt φ( x, y) := ϕ(y) − ϕ( x ). Hiển nhiên ϕ( x ) ≤ ϕ(y) ∀y ∈ C ⇔ φ( x, y) ≥ 0 ∀y ∈ C. Vậy bài toán tối ưu trên là một trường hợp riêng của bài toán (EP). 2. Bất đẳng thức biến phân. Trong Chương 5 ta đã xét đến bài toán bất đẳng thức biến phân đơn trị và một ứng dụng của phép chiếu vuông góc cho bài toán đó. Dưới đây, ta xét bài toán bất đẳng thức biến phân đa trị sau: n

Cho C là một tập lồi đóng khác rỗng trong IRn và F : C → 2 IR là một ánh xạ đa trị (tức là với mỗi x ∈ C, giá trị F( x ) là một tập khác rỗng trong IRn ). Xét bài toán: Tìm x ∈ C, v ∈ F( x ) sao cho

hv, y − x i ≥ 0 ∀y ∈ C.

(V I )

Giả sử với mỗi x ∈ C, tập F( x ) lồi, compact khác rỗng. Với mỗi x, y ∈ C, đặt φ( x, y) := max hv, y − x i. v∈ F ( x )

Từ đây suy ra ngay rằng, φ( x, y) ≥ 0 với mọi y ∈ C, khi và chỉ khi x là nghiệm của (VI). Một trường hợp riêng quan trọng của bài toán (VI) là khi C = và F đơn trị. Khi đó bài toán (VI) tương đương với bài toán sau, được gọi là bài toán bù: IRn+

Tìm x ≥ 0, sao cho F( x ) ≥ 0, x T F( x ) = 0.

(CP)

221

12.2 Định lý minimax

Ta chỉ ra rằng bài toán (CP) này tương đương với bất đẳng thức biến phân Tìm x ≥ 0, sao cho

h F( x ), y − x i ≥ 0 ∀y ≥ 0. theo nghĩa tập nghiệm của hai bài toán này trùng nhau. Thật vậy, nếu x là nghiệm của bất đẳng thức biến phân thì

h F( x ), y − x i ≥ 0 ∀y ≥ 0. Lần lượt chọn y = x + ei (véc tơ đơn vị thứ i) ta có Fi ( x ) = h F( x ), x + ei − x i = h F( x ), ei ) ≥ 0. Vậy Fi ( x ) ≥ 0 với mọi i. Ngoài ra nếu chọn y = 0 ta có 0 ≤ −h F( x ), x i ≤ 0. Suy ra x T F( x ) = 0. Điều ngược lại mọi nghiệm của bài toán bù đều là nghiệm của bất đẳng thức biến phân là hiển nhiên. 3. Bài toán điểm bất động Kakutani. Cho F : C → 2C . Điểm x được gọi là điểm bất động của F nếu x ∈ F( x ). Giả sử với mọi x ∈ C, F( x ) lồi, compact, khác rỗng. Khi đó bài toán tìm một điểm bất động của F tương đương với bài toán cân bằng (EP) . Thật vậy, với mỗi x, y ∈ C, đặt φ( x, y) := max h x − v, y − x i. v∈ F ( x )

Thật vậy, hiển nhiên là nếu x ∈ F( x ), thì theo định nghĩa của φ( x, y) ta có φ( x, y) ≥ 0 ∀y ∈ C. Ngược lại, giả sử x là nghiệm của bài toán (EP), tức là x ∈ C và φ( x, y) ≥ 0 với mọi y ∈ C. Khi đó lấy y ∈ F( x ) sao cho

h x − y, y − x i = max h x − v, v − x i. v∈ F ( x )

Do F( x ) 6= ∅, compact, nên y tồn tại. Khi đó do x là nghiệm của (EP), nên 0 ≤ φ( x, y) = h x − y, y − x i = −|| x − y||2

222

Nhập môn giải tích lồi ứng dụng

Suy ra x = y ∈ F( x ). Do đó x là điểm bất động của F. 4 . Cân bằng Nash trong trò chơi không hợp tác. Xét một trò chơi có p người chơi (đấu thủ). Gỉa sử Cj ⊂ IRPj là tập phương án mà đấu thủ thứ j có thể lựa chọn trong đó (gọi là tập chiến lược). Đặt C := C1 × C2 × ... × C p và gọi ϕ j : C → IR là hàm lợi ích của đấu thủ j. Gỉa sử ϕ j ( x1 , ...x j , ..., x p ) là lợi ích của đấu thủ j khi đấu thủ này chọn phương án chơi x j ∈ Cj , còn các đấu thủ k khác chọn phương án chơi là xk ∈ Ck với mọi k 6= j. Định nghĩa 12.1 (điểm cân bằng Nash)Ta gọi x ∗ = ( x1∗ , ..., x ∗p ) là điểm cân bằng của ϕ = ( ϕ1 , ...ϕ p ) trên C = C1 × C2 × ... × C p nếu với mọi j và mọi y j ∈ Cj , ta có ϕ j ( x1∗ , ..., x ∗j−1, y j , x ∗j+1, ...x ∗p ) ≤ ϕ j ( x1∗ , ..., x ∗j−1, x ∗j , x ∗j+1, ...x ∗p ). Định nghĩa này cho thấy rằng nếu một đối thủ j nào đó rời khỏi phương án cân bằng, trong khi các đối thủ khác vẫn giữ phương án cân bằng, thì đối thủ j sẽ bị thua thiệt. Đây chính là lý do mà khái niệm cân bằng này được chấp nhận trong thực tế. Điểm cân bằng này được gọi là cân bằng Nash vì khái niệm này do nhà kinh tế học F. Nash đưa ra đầu tiên. Dưới đây bài toán cân bằng Nash sẽ được hiểu là bài toán tìm một điểm cân bằng (Nash) của ϕ trên C. Ta sẽ ký hiệu bài toán này là N(ϕ, C). Bài toán cân bằng Nash có thể mô tả dưới dạng bài toán cân bằng (EP). Thật vậy, hãy xây dựng hàm φ : C × C → IR, bằng cách đặt p

φ( x, y) :=

∑ j =1

h

ϕ j ( x ) − ϕ j ( x1 , ..., x j−1, y j , x j+1, ..., x p )

i

Hiển nhiên nếu x ∗ là một điểm cân bằng Nash, thì φ( x ∗ , y) ≥ 0 ∀y ∈ C. Ngược lại, giả sử x ∗ ∈ C là nghiệm của bài toán (EP), tức là φ( x ∗ , y) ≥ 0 ∀y ∈ C. Ta sẽ chứng tỏ x ∗ = ( x1∗ , ..., x ∗p ) với x ∗j ∈ Cj

223

12.2 Định lý minimax

là một điểm cân bằng Nash. Thật vậy, nếu trái lại, sẽ tồn tại j và một y j ∈ Cj sao cho ϕ j ( x1∗ , ..., x ∗j−1, x ∗j , x ∗j+1, ..., x ∗p ) < ϕ j ( x1∗ , ..., x ∗j−1, y j , x ∗j+1, ..., x ∗p ). Khi đó với phương án y = ( x1∗ , ..., x ∗j−1, y j , x ∗j+1, ...x ∗p ), theo định nghĩa của hàm φ, ta có φ( x ∗ , y) = ϕ j ( x1∗ , ..., x ∗j−1, y j , x ∗j+1, ..., x ∗p ) − ϕ j ( x ∗ ) < 0. Mâu thuẫn với việc x ∗ là nghiệm của (EP). Nhận xét 4. Trong các bài toán vừa kể trên, hàm cân bằng φ có tính chất φ(y, y) = 0 với mọi y ∈ C. Dưới đây ta sẽ chứng minh một kết quả về sự tồn tại nghiệm của bài toán cân bằng (EP) dựa trên Định lý Minimax 12.1 Mệnh đề 12.3. Cho C là một tập lồi đóng khác rỗng và hàm φ có các tính chất: φ( x, .) là hàm tựa lồi, nửa liên tục dưới trên C, φ(., y) là hàm tựa lõm, nửa liên tục trên trên C. Ngoài ra φ(y, y) = 0 với mọi y ∈ C. Giả sử (A1) Có một tập hữu hạn N∗ ⊂ C sao cho tập C( N∗ ) := { x ∈ C | min φ( x, y) ≥ 0} y∈ N∗

compact, hoặc (B1) Có một tập hữu hạn M∗ ⊂ C sao cho tập D ( M∗ ) := {y ∈ C | max φ( x, y) ≤ 0} x ∈ M∗

compact. Khi đó bài toán (EP) có nghiệm. Chứng minh. Đặt f ( x, y) := −φ( x, y) và D ≡ C. Khi đó hàm f thoả mãn mọi điều kiện của Định lý 12.1. Theo Định lý Minimax 12.1, ta có sup inf f ( x, y) = inf sup f ( x, y). (12.5) y∈ C x ∈ C

x ∈ C y∈ C

224

Nhập môn giải tích lồi ứng dụng

Ta sẽ chứng tỏ inf sup f ( x, y) = 0.

x ∈ C y∈ C

(12.6)

Thật vậy, ta có inf sup f ( x, y) ≥ inf f ( x, x ) = 0;

x ∈ C y∈ C

x∈C

đẳng thức cuối là do f ( x, x ) = 0. Mặt khác sup inf f ( x, y) ≤ sup f (y, y) = 0. y∈ C x ∈ C

(12.7)

y∈ C

Từ (12.5), (12.6) và (12.7) suy ra sup inf f ( x, y) = inf sup f ( x, y) = 0. y∈ C x ∈ C

x ∈ C y∈ C

Giả sử điều kiện (A1) thoả mãn, theo Định lý 12.1 tồn tại x ∈ C( N∗ ) ⊂ C sao cho min sup f ( x, y) = 0.

x ∈C ( N∗ ) y∈C

Đặt s( x ) := supy∈C f ( x, y). Do f (., y) nửa liên tục dưới trên C, nên s cũng nửa liên tục dưới trên C. Do C( N∗ ) là tập compact, nên tồn tại x ∗ ∈ C( N∗ ), sao cho s( x ∗ ) = minx∈C ( N∗ ) s( x ) = 0. Hay s( x ∗ ) = supy∈C f ( x ∗ , y) = 0. Suy ra f ( x ∗ , y) ≤ 0 với mọi y ∈ C. Vậy φ( x ∗ , y) = − f ( x ∗ , y) ≥ 0 với mọi y ∈ C. Chứng tỏ x ∗ là nghiệm của bài toán cân bằng (EP).  Nhận xét 6. Cũng tương tự như định lý 2.1. điều kiện (A1) sẽ thoả mãn nếu có điều kiện bức sau: Tồn tại tập hữu hạn N∗ ⊂ C sao cho miny∈ N∗ φ( x, y) → −∞ khi x ∈ C, || x || → +∞.

225

12.3 Bài tập

Tương tự (B1) thoả mãn nếu Tồn tại tập hữu hạn M∗ ⊂ C sao cho maxx∈ M∗ φ( x, y) → +∞ khi y ∈ C, ||y|| → +∞.

12.3. Bài tập I 12.1. Cho f là hàm lồi, đóng chính thường trên IRn . Chứng minh rằng: ( x + ∂ f )−1 là hàm đơn trị và xác định khắp nơi. I 12.2. Tìm ví dụ chứng tỏ rằng bài toán cân bằng tìm x ∗ ∈ C sao cho φ( x ∗ , x ) ≥ 0 ∀ x ∈ C có thể không có nghiệm cho dù C là tập lồi compact khác rỗng và hàm φ liên tục trên C × C.

I 12.3. Giả sử φ( x, x ) = 0 với mọi x ∈ C. Chứng tỏ rằng x ∗ là nghiệm của bài toán cân bằng Tìm x ∗ ∈ C sao cho φ( x ∗ , x ) ≥ 0∀ x ∈ C khi và chỉ khi x ∗ ∈ S( x ∗ ), trong đó S( x ) là tập hợp các điểm cực tiểu của hàm φ( x, .) trên C.

I 12.4. Giả sử φ( x, x ) = 0 với mọi x ∈ C. Đặt g( x ) := sup{−φ( x, y)} y∈ C

Chứng tỏ rằng g( x ) ≥ 0, x ∈ C và g( x ) = 0, x ∈ C khi và chỉ khi φ( x, y) ≥ 0 với mọi y ∈ C.

226

Nhập môn giải tích lồi ứng dụng

I 12.5. Cho T : C → IRn thoả mãn điều kiện Lipschitz || T ( x ) − T (y)|| ≤ L|| x − y|| ∀ x, y ∈ C. Chứng tỏ rằng khi đó tồn tại các hằng số c > 0, d > 0 sao cho với mọi x, y, z ∈ C, ta có

hT (y) − T ( x ), z − yi ≥ −c||y − x ||2 − d||z − y||2 .

Tài liệu tham khảo [1] Aubin J.P. and Ekeland I. (1984)Applied Nonlinear Analysis, John Willey and Sons. [2] Blum E. and Oettli W. (1994) From optimization and variational inequality to equilibrium problems, Math. Student 63, 127 - 149. [3] Facchinei F. Pang J.S. (2003) Finite-Dimensional Variational Inequalities and Complementary Problems, Springer-Verlag, NewYork . [4] Konnov I. V. (2000) Combined Relaxation Methods for Variational Inequalities, Springer-Verlag, Berlin. [5] Lê Dũng Mưu (1998) Nhập môn các phương pháp tối ưu, Nhà xuất bản KHKT. [6] Đỗ Văn Lưu and Phan Huy Khải (2000) Giải tích lồi, Nhà xuất bản KHKT. [7] Nguyen V. H. (2002) Lecture Notes on Equilibrium Problems CIUF-CUD Summer School on Optimization and Applied Mathematics, Nha Trang. [8] Rockafellar R. T. (1970) Convex Analysis, Princeton University Press.

228

TÀI LIỆU THAM KHẢO

[9] Tuy H. (2003) Convex Analysis and Global Optimization Kluwer Academic Publishers.

Danh mục từ khóa D A a-phin . . . . . . . . . . . . . . . . . . . . . . 12 đạo hàm theo hướng. . . . . . . 168 điểm biên . . . . . . . . . . . . . . . . . . . 41 điểm cực biên . . . . . . . . . . . 42, 50 B bất đẳng thức biến phân . . . . 73 điểm cực tiểu toàn cục . . . . . . 44 bao đóng . . . . . . . . . . . . . . . . . . 110 điểm trong . . . . . . . . . . . . . . . . . 41 bao a-phin . . . . . . . . . . . . . . 12, 36 điểm trong tương đối . . . . . . . 26 Bao lồi . . . . . . . . . . . . . . . . . . . . . . 36 điểm yên ngựa . . . . . . . . . . . . 207 Bao lồi đóng . . . . . . . . . . . . . . . . 43 đỉnh . . . . . . . . . . . . . . . . . . . . . . . . 18 bao lồi cận dưới . . . . . . . . . . . 119 đỉnh không suy biến . . . . . . . . 58 bao nón lồi . . . . . . . . . . . . . . . . . 36 Đoạn thẳng . . . . . . . . . . . . . . . . . 12 biên tương đối . . . . . . . . . . . . . . 26 độ thẳng . . . . . . . . . . . . . . . . . . . . 53 độc lập a-phin . . . . . . . . . . . . . . 17 đóng . . . . . . . . . . . . . . . . . . 106, 187 C cực đại địa phương . . . . . . . . 128 đơn điệu . . . . . . . . . . . . . . . . . . . . 74 cực đại toàn cục . . . . . . . . . . . 128 đơn điệu cực đại . . . . . . . . . . . 186 cực đại tuyệt đối . . . . . . . . . . . 128 đơn điệu mạnh . . . . . . . . . . . . . 74 cực tiểu địa phương . . . . . . . 128 đơn điệu tuần hoàn . . . . . . . . 185 cực tiểu địa phương . . . . . . . . 44 đơn điệu tuần hoàn cực đại 186 cực tiểu tuyệt đối . . . . . . . . . . 128 đơn hình . . . . . . . . . . . . . . . . . . . 18 cạnh . . . . . . . . . . . . . . . . . . . . . . . . 50 đơn hình chuẩn tắc . . . . . . . . . 18 Carathéodory . . . . . . . . . . . . . . . 39 đường thẳng. . . . . . . . . . . . . . . . 11 chính tắc. . . . . . . . . . . . . . . . . . . . 59 diện . . . . . . . . . . . . . . . . . . . . . . . . 50 chính thường . . . . . . . . . . . . . . 106 dưới đạo hàm . . . . . . . . . . . . . 173 chiều . . . . . . . . . . . . . . . . . . . . . . . 36 dưới tuyến tính . . . . . . . . . . . . 109

230

DANH MỤC TỪ KHÓA

E L e−cực tiểu. . . . . . . . . . . . . . . . . 201 lồi chặt . . . . . . . . . . . . . . . . . . . . 104 e-dưới đạo hàm của . . . . . . . 199 lồi mạnh . . . . . . . . . . . . . . . . . . . 104 Lipschitz địa phương . . . . . . 114 H hình chiếu . . . . . . . . . . . . . . . . . . 68 M hàm mặt cầu . . . . . . . . . . . . . . 107 một mặt . . . . . . . . . . . . . . . . . . . . 60 hàm a-phin . . . . . . . . . . . . . . . . 107 mở tương đối . . . . . . . . . . . . . . . 26 hàm cận dưới . . . . . . . . . . . . . . 119 miền chấp nhận được . . . . . . . 44 hàm cận trên . . . . . . . . . . . . . . 118 miền hữu dụng . . . . . . . . . . . . 103 hàm chỉ . . . . . . . . . . . . . . . . . . . 107 miền ràng buộc . . . . . . . . . . . . . 44 hàm chuẩn . . . . . . . . . . . . . . . . 107 N hàm khoảng cách . . . . . . . . . . 107 hàm lồi . . . . . . . . . . . . . . . . . . . . 104 nón . . . . . . . . . . . . . . . . . . . . . . . . . 19 hàm lõm . . . . . . . . . . . . . . . . . . . 105 nón đối cực . . . . . . . . . . . . . . . . . 21 hàm Lagrange . . . . . . . . . . . . . 130 nón chấp nhận được . . . . . . . . 22 hàm liên hợp . . . . . . . . . . . . . . 154 nón lồi . . . . . . . . . . . . . . . . . . 19, 20 hàm mục tiêu . . . . . . . . . . . . . . . 44 nón lồi đóng . . . . . . . . . . . . . . . . 21 hàm tựa . . . . . . . . . . . . . . . . 98, 107 nón lồi đa diện . . . . . . . . . . . . . 19 hàm tổng chập. . . . . . . . . . . . . 108 nón lùi xa . . . . . . . . . . . . . . 20, 136 hàm yên ngựa . . . . . . . . . . . . . 207 nón nhọn . . . . . . . . . . . . . . . . . . . 19 hệ bất đẳng thức lồi . . . . . . . 140 nón pháp tuyến . . . . . . . . . . . . . 21 hệ số lồi . . . . . . . . . . . . . . . . . . . 106 nón tiếp xúc . . . . . . . . . . . . . . . . 22 hướng chấp nhận được . . . . . 21 nửa không gian . . . . . . . . . . . . . 15 hướng cực biên . . . . . . . . . . . . . 50 nửa không gian đóng . . . . . . . 15 hướng lùi xa . . . . . . . . . . . . . . . . 20 nửa không gian mở . . . . . . . . . 15 hướng vô hạn . . . . . . . . . . . . . . . 20 nửa không gian tựa . . . . . . . . . 50 nửa liên tục dưới . . . . . . . . . . 110 K nửa liên tục trên . . . . . . 110, 187 không gian con . . . . . . . . . . 15, 16 P không gian con song song . . 16 không gian hằng . . . . . . . . . . 136 phép biến đổi Legendrekhông gian thẳng . . . . . . 53, 137 Fenchel . . . . . . . . . . . . 154 khả dưới vi phân . . . . . . . . . . 173 phương án chấp nhận được . 44

DANH MỤC TỪ KHÓA phiếm hàm cỡ . . . . . . . . . . . . . . 30 phiếm hàm Minkowski . . . . . 30 S siêu phẳng . . . . . . . . . . . . . . 14, 15 siêu phẳng tựa . . . . . . . . . . . . . . 50 T tách . . . . . . . . . . . . . . . . . . . . . . . . 82 tách đúng . . . . . . . . . . . . . . . . . . 85 tách chặt . . . . . . . . . . . . . . . . . . . . 82 tập đối cực . . . . . . . . . . . . . . . . . 96 tập đóng . . . . . . . . . . . . . . . . . . . . 41 tập a-phin . . . . . . . . . . . . . . . 14, 15 tập com-pắc . . . . . . . . . . . . . . . . 41 tập lồi . . . . . . . . . . . . . . . . . . . . . . 12 tập lồi đa diện . . . . . . . . . . . . . . 18 tập mức dưới . . . . . . . . . . . . . . 136 tập mức trên . . . . . . . . . . . . . . . 136 tọa độ trọng tâm . . . . . . . . . . . . 42 tổ hợp a-phin . . . . . . . . . . . . . . 12 tổ hợp lồi . . . . . . . . . . . . . . . . . . . 12 thứ nguyên . . . . . . . . . . . . . . . . . 36 thứ nguyên . . . . . . . . . . . . . . . . 16 thuần nhất dương . . . . . . . . . 109 tia cực biên . . . . . . . . . . . . . . . . . 50 trên đồ thị . . . . . . . . . . . . . . . . . 104 V véc-tơ pháp tuyến . . . . . . . . . . . 15