@@ -3,7 +3,9 @@ \chapter{Fluxo de Gradiente em Espaços de Wasserstein}
3
3
4
4
Neste capítulo mostraremos como EDPs podem ser expressadas como
5
5
fluxos de gradiente em um espaço de Wasserstein
6
- (i.e. espaço métrico de medidas de probabilidades com distância de Wasserstein). A exposição é
6
+ (i.e. espaço métrico de medidas de probabilidades com distância
7
+ de Wasserstein)\footnote {A principal referência para este capítulo
8
+ é \citet {santambrogio2017euclidean }.}. A exposição é
7
9
focada em apresentar de maneira clara e sucinta o necessário para entendimento
8
10
do assunto, sem provar os resultados mais refinados, o que tornaria o
9
11
texto muito extenso e de difícil
@@ -41,6 +43,8 @@ \chapter{Fluxo de Gradiente em Espaços de Wasserstein}
41
43
42
44
\section {Introdução ao Fluxo de Gradiente }
43
45
46
+ \subsection {Definições Iniciais }
47
+
44
48
Antes de formalizar a ideia de fluxo de gradiente, vamos introduzir alguns
45
49
conceitos de análise convexa que são necessárias para tratar
46
50
do assunto de maneira rigorosa.
@@ -53,9 +57,10 @@ \section{Introdução ao Fluxo de Gradiente}
53
57
f(y) \geq f(x) + \langle p, y-x\rangle , \forall y \in \mathbb R^n
54
58
\} .
55
59
\end {equation }
60
+ Se $ p \in \partial f(x)$ , então $ p$ é um subgradiente de $ f$ no ponto $ x$ .
56
61
\end {definition }
57
62
A intuição por trás da definição
58
- de subdiferencial (ou subgradiente) é ilustrada na Figura \ref {fig:subdiferencial }.
63
+ de subdiferencial é ilustrada na Figura \ref {fig:subdiferencial }.
59
64
Note que se a função $ f$ for convexa e diferenciável, teremos que $ \partial f(x) = \{ \nabla f(x)\} $ .
60
65
Porém, caso a função não seja convexa, não haverá essa garantia. Assim, é comum usar essa ideia de
61
66
subdiferencial somente em funções convexas.
@@ -106,19 +111,115 @@ \section{Introdução ao Fluxo de Gradiente}
106
111
107
112
\begin {figure }[H]
108
113
\includegraphics [width=1\textwidth ]{./Figures/subdiferencial}
109
- \caption {Exemplo de subdiferencial.}
114
+ \caption {Exemplo de subdiferencial. Perceba que considerando
115
+ o subdiferencial generalizado, teríamos
116
+ $ p_1 \in \partial _G f(0 )$ e $ p_2 \in \partial _G f(0 )$ para as duas imagens.}
110
117
\label {fig:subdiferencial }
111
118
\end {figure }
112
119
113
120
Agora podemos definir de forma rigorosa o fluxo de gradiente.
114
121
115
122
\begin {definition }[Fluxo de Gradiente]
116
123
Seja $ f:\mathbb R^n \to \mathbb R$ .
117
- Dizemos que $ x:(0 ,+\infty ) \to \text {Dom}(f)$ é um fluxo de gradiente
124
+ Assim, dizemos que $ x:(0 ,+\infty ) \to \text {Dom}(f)$ é um fluxo de gradiente
118
125
de $ f$ se $ x \in \text {AC}_{\text {loc}}((0 ,+\infty ), \mathbb R^n)$ e
119
126
\begin {equation }
120
127
x'(t) \in - \nabla _G f(x(t)), \quad \text {para } \lambda\text {-a.e } t \in (0,+\infty ),
121
128
\end {equation }
122
129
onde $ \lambda $ é a medida de Lebesgue. Note que dizemos que $ x$ começa em $ x_0 $ se
123
130
$ \lim _{t \to 0^+} x(t) = x_0 $ .
124
- \end {definition }
131
+ \end {definition }
132
+
133
+ \subsection {Resultados Básicos de Existência e Unicidade }
134
+
135
+ Uma vez introduzida a ideia de fluxo de gradiente, vamos agora provar alguns
136
+ resultados básicos relacionados ao sistema de equações
137
+
138
+ \begin {equation }
139
+ \begin {cases }
140
+ x'(t) \in -\partial F(x(t)), \ \text {para quase todo } t>0,\\
141
+ x(0) = x_0.
142
+ \end {cases }
143
+ \label {eq:fluxograd }
144
+ \end {equation }
145
+
146
+ Veja que agora a função $ F$ não é mais necessariamente derivável. Este cenário
147
+ é bem menos restrito que o que apresentamos logo no início do capítulo.
148
+
149
+ \begin {lemma }
150
+ Seja $ f:\mathbb R^n \to \mathbb R \cup \{ +\infty \} $ convexa, $ p_1 \in \partial f(x_1 )$
151
+ e $ p_2 \partial f(x_2 )$ . Então
152
+ \begin {equation }
153
+ \langle p_1 - p_2, x_1 - x_2 \rangle \geq 0.
154
+ \end {equation }
155
+ \end {lemma }
156
+ \begin {prf }
157
+ Pela definição de subdiferencial, temos que
158
+ \begin {align* }
159
+ &p_1 \in \partial f(x_1) \implies f(x_2) \geq f(x_1) + \langle p_1, x_2 - x_1\rangle \\
160
+ &p_2 \in \partial f(x_2) \implies
161
+ f(x_1) \geq f(x_2) + \langle p_2, x_1 - x_2\rangle .
162
+ \end {align* }
163
+ Assim, somando as duas equações, temos que
164
+ \begin {align* }
165
+ &f(x_2) + f(x_1) \geq f(x_1) + f(x_2) +
166
+ \langle p_1, x_2 - x_1\rangle
167
+ \langle p_2, x_1 - x_2\rangle
168
+ \end {align* }
169
+ Rearranjando, obtemos
170
+ \begin {align* }
171
+ &0 \geq
172
+ \langle p_1,x_2 \rangle
173
+ -\langle p_2,x_1 \rangle
174
+ \langle p_2,x_1 \rangle
175
+ -\langle p_2,x_2 \rangle \\
176
+ &\implies
177
+ \langle p_1 - p_2 , x_1 - x_2 \rangle \geq 0.
178
+ \end {align* }
179
+ \end {prf }
180
+
181
+ \begin {theorem }
182
+ Seja $ F:\mathbb R^n \to \mathbb R$ \textbf {convexa }, $ x_0 \in \mathbb R^n$ , e
183
+ $ x_1 $ e $ x_2 $ duas soluções de \eqref {eq:fluxograd }.
184
+ Então,
185
+ \begin {equation }
186
+ |x_1(t) - x_2(t)| \leq |x_1(0) - x_2(0)|, \ \forall t >0.
187
+ \end {equation }
188
+ Logo, a solução do sistema de equações é única.
189
+ \end {theorem }
190
+ \begin {prf }
191
+ Primeiro, faça $ g(t) = \frac {(x_1(t) - x_2(t))^2}{2}$ , e toma a derivada em $ t$ . Assim
192
+ \begin {equation* }
193
+ g'(t) = \langle x_1(t) - x_2(t), x_1'(t) - x_2'(t) \rangle .
194
+ \end {equation* }
195
+ Usando o fato que
196
+ $ x_1 '(t) \in \partial F(x_1 (t))$ e
197
+ $ x_2 '(t) \in \partial F(x_2 (t))$ , temos pelo lemma que acabamos de demonstrar que
198
+ \begin {equation* }
199
+ g'(t) = \langle x_1'(t) - x_2'(t) , x_1(t) - x_2(t) \rangle \geq 0.
200
+ \end {equation* }
201
+ Além disso, como ambas as soluções começam em $ x_0 $ , temos que $ g(0 ) = 0 \geq g(t)$ , já que
202
+ a derivada de $ g(t)$ é sempre menor ou igual a zero. Portanto
203
+ \begin {align* }
204
+ g(t) = \frac {(x_1(t) - x_2(t))^2}{2} \leq 0 &\implies
205
+ |x_1(t) - x_2(t)| \leq |x_1(0) - x_2(0)| = 0
206
+ \\
207
+ &\implies
208
+ x_1(t) = x_2(t).
209
+ \end {align* }
210
+ \end {prf }
211
+
212
+ Podemos estender o resultado do teorema acima para o caso mais geral onde
213
+ $ F$ é $ \lambda $ -convexa. A demonstração é bastante parecida, porém, um pouco mais convoluta.
214
+ Por conta disso optamos por apresentar os dois resultados de forma separada.
215
+
216
+ \begin {theorem }
217
+ Seja $ F:\mathbb R^n \to \mathbb R$ \textbf {$ \lambda $ -convexa }, $ x_0 \in \mathbb R^n$ .
218
+ Então o sistema de equações \eqref {eq:fluxograd } tem uma solução única.
219
+ Além disso, se $ \lambda >0 $ , a taxa de convergência para o mínimo global
220
+ de $ F$ é exponencial, ou seja, para $ x^* = \argmin _{x\in \mathbb R^n} F(x)$
221
+ \begin {equation }
222
+ |x(t) - x^*| \leq e^{-\lambda t}|x(0)- x^*|,
223
+ \end {equation }
224
+ onde $ x(t)$ é a solução.
225
+ \end {theorem }
0 commit comments