Skip to content

Commit

Permalink
Metric statements proved
Browse files Browse the repository at this point in the history
  • Loading branch information
sizzziy committed Apr 7, 2024
1 parent ea1e60e commit 072f65d
Show file tree
Hide file tree
Showing 4 changed files with 24 additions and 71 deletions.
9 changes: 9 additions & 0 deletions .gitignore
Original file line number Diff line number Diff line change
Expand Up @@ -120,3 +120,12 @@ logs/
*/mnist
*.csv
!.dvc

*.aux
*.bbl
*.blg
*.out
*.gz
*.nav
*.snm
*.toc
Binary file not shown.
83 changes: 15 additions & 68 deletions Divilkovskiy2024SourceSpace/paper/Divilkovskiy2024SourceSpace.tex
Original file line number Diff line number Diff line change
Expand Up @@ -14,6 +14,8 @@
\usepackage{natbib}
\usepackage{doi}

\pagestyle{fancy}



\title{Восстановление прогноза, сделанного в метрическом вероятностном пространстве, в исходное пространство (временных рядов)}
Expand Down Expand Up @@ -75,7 +77,7 @@

\keywords{Riemannian Space \and Trades \and Multidimensional Scaling \and Time Series}

\section{Introduction}
\section{Introduction TO BE REWRITTEN}
Временные ряды возникают во многих прикладных задачах, таких как анализ физической активности, мозговых волн или биржевых котировок. Цель данной работы заключается в представлении нового метода прогнозирования для конкретного типа временных рядов, характеризующихся высокой дисперсией и высокой попарной ковариацией. Задача разбивается на три этапа: сначала исходное пространство временных рядов трансформируется в метрическое пространство (по попарным расстояниям), затем в этом пространстве производится прогноз, после чего результат возвращается в исходное пространство. В данной статье исследуется восстановление ответа в пространство временных рядов, то есть третий этап задачи. Также проводится оценка качества прогноза.

Классические способы предсказания временных рядов, такие как LSTM \cite{LSTM}, SSA \cite{SSA} и многие другие \cite{Biosignals}, \cite{boyd2017multiperiod} основаны на предсказании значения одного ряда, тогда как в данной работе предлагается анализировать изменение набора временных рядов. Подобное исследование проводится в статье \cite{MulticorrelatedQuadratic}, однако в ней делается упор на задаче feature selection.
Expand All @@ -86,7 +88,7 @@ \section{Introduction}

Эксперимент проводится на биологических и финансовых данных. Цель эксперимента заключается в выборе наилучшего способа построения метрического пространства.

\section{Problem Statement}
\section{Problem Statement TO BE REWRITTEN}

\subsection{Formal Problem}

Expand Down Expand Up @@ -164,82 +166,27 @@ \subsection{MSSA}

MSSA (Multivariate Singular Spectrum Analysis) в отличие от других методов позволяет брать во внимание корреляцию между несколькими рядами и прогнозировать несколько.

% \section{Headings: first level}
% \label{sec:headings}

% \lipsum[4] See Section \ref{sec:headings}.

% \subsection{Headings: second level}
% \lipsum[5]
% \begin{equation}
% \xi _{ij}(t)=P(x_{t}=i,x_{t+1}=j|y,v,w;\theta)= {\frac {\alpha _{i}(t)a^{w_t}_{ij}\beta _{j}(t+1)b^{v_{t+1}}_{j}(y_{t+1})}{\sum _{i=1}^{N} \sum _{j=1}^{N} \alpha _{i}(t)a^{w_t}_{ij}\beta _{j}(t+1)b^{v_{t+1}}_{j}(y_{t+1})}}
% \end{equation}

% \subsubsection{Headings: third level}
% \lipsum[6]

% \paragraph{Paragraph}
% \lipsum[7]



% \section{Examples of citations, figures, tables, references}
% \label{sec:others}

% \subsection{Citations}
% Citations use \verb+natbib+. The documentation may be found at
% \begin{center}
% \url{http://mirrors.ctan.org/macros/latex/contrib/natbib/natnotes.pdf}
% \end{center}
\section{Метрика}

% Here is an example usage of the two main commands (\verb+citet+ and \verb+citep+): Some people thought a thing \citep{kour2014real, hadash2018estimate} but other people thought something else \citep{kour2014fast}. Many people have speculated that if we knew exactly why \citet{kour2014fast} thought this\dots
При условии высокой попарной корреляции входных рядов и постановке задачи о предсказании значения рядов в следующий момент времени необходимо определить достаточные данные для модели.

% \subsection{Figures}
% \lipsum0]
% See Figure \ref{fig:fig1}. Here is how you add footnotes. \footnote{Sample of the first footnote.}
% \lipsum[11]
\paragraph{Недостаточность матрицы попарных расстояний}

% \begin{figure}
% \centering
% \includegraphics[width=0.5\textwidth]{../figures/log_reg_cs_exp.eps}
% \caption{Sample figure caption.}
% \label{fig:fig1}
% \end{figure}
Пусть дана предсказанная матрица попарных расстояний $\Sigma$ размера $d \times d$ для многомерного временного ряда $\overline{X} \in \mathbb{R}^{d \times t}$. Предсказывается $y \in \mathbb{R}^d$. Так же, известна метрика $d : \mathbb{R}^{t+1} \times \mathbb{R}^{t+1} \rightarrow \mathbb{R}$, введённая на временных рядах, обладающая свойствами метрики. То есть, $\Sigma_{i,j} = d(X_i \circ y_i, X_j \circ y_j)$, где $\circ$ означает конкатенацию векторов.

% \subsection{Tables}
% See awesome Table~\ref{tab:table}.
В качестве примера рассмотрим евклидову метрику:

% The documentation for \verb+booktabs+ (`Publication quality tables in LaTeX') is available from:
% \begin{center}
% \url{https://www.ctan.org/pkg/booktabs}
% \end{center}
$$d(p,q)=\sqrt{\sum_{k=1}^n (p_k-q_k)^2}.$$

Использование данной метрики приводит к тому, что прибавление ко всем координатам $y$ некоторой константы $C$ не изменяет ответ. В случае задачи предсказывания временных рядов это свойство критично, поскольку даже в случае верного предсказания матрицы $\Sigma$ невозможно понять как себя поведут временные ряды в момент времени $t+1$.

% \begin{table}
% \caption{Sample table title}
% \centering
% \begin{tabular}{lll}
% \toprule
% \multicolumn{2}{c}{Part} \\
% \cmidrule(r){1-2}
% Name & Description & Size ($\mu$m) \\
% \midrule
% Dendrite & Input terminal & $\sim$100 \\
% Axon & Output terminal & $\sim$10 \\
% Soma & Cell body & up to $10^6$ \\
% \bottomrule
% \end{tabular}
% \label{tab:table}
% \end{table}
Это приводит к невозможности использования алгоритма MDS для восстановления ответа в исходное пространство временных рядов.

% \subsection{Lists}
% \begin{itemize}
% \item Lorem ipsum dolor sit amet
% \item consectetur adipiscing elit.
% \item Aliquam dignissim blandit est, in dictum tortor gravida eget. In ac rutrum magna.
% \end{itemize}
Однако, даже использование других метрик не позволяет избавиться от проблемы. Рассмотрим метрику $d(x, y)$ как функцию из $\mathbb{R}^{2t+2}$ в $\mathbb{R}$. Известно, что метрика не сюръективна, поскольку $d(x, x) = 0$. Из этого следует существование нескольких возможных ответов на задачу. \textbf{TODO: возможно стоит использовать теорему Рисса об эквивалентности норм в конечномерных пространствах.}

Исходя из этих утверждений, использование только лишь матрицы расстояний не позволяет решить задачу прогнозирования.

\section{
\bibliography{references}
\bibliographystyle{plain}
Expand Down
3 changes: 0 additions & 3 deletions Divilkovskiy2024SourceSpace/paper/arxiv.sty
Original file line number Diff line number Diff line change
Expand Up @@ -3,9 +3,6 @@
\ProcessOptions\relax

% fonts
\renewcommand{\rmdefault}{ptm}
\renewcommand{\sfdefault}{phv}

% set page geometry
\usepackage[verbose=true,letterpaper]{geometry}
\AtBeginDocument{
Expand Down

0 comments on commit 072f65d

Please sign in to comment.