diff --git a/.gitignore b/.gitignore index 66717dc..73ba4eb 100644 --- a/.gitignore +++ b/.gitignore @@ -120,3 +120,12 @@ logs/ */mnist *.csv !.dvc + +*.aux +*.bbl +*.blg +*.out +*.gz +*.nav +*.snm +*.toc diff --git a/Divilkovskiy2024SourceSpace/paper/Divilkovskiy2024SourceSpace.pdf b/Divilkovskiy2024SourceSpace/paper/Divilkovskiy2024SourceSpace.pdf index 4b38ecc..397732b 100644 Binary files a/Divilkovskiy2024SourceSpace/paper/Divilkovskiy2024SourceSpace.pdf and b/Divilkovskiy2024SourceSpace/paper/Divilkovskiy2024SourceSpace.pdf differ diff --git a/Divilkovskiy2024SourceSpace/paper/Divilkovskiy2024SourceSpace.tex b/Divilkovskiy2024SourceSpace/paper/Divilkovskiy2024SourceSpace.tex index 72ab580..07fd7aa 100644 --- a/Divilkovskiy2024SourceSpace/paper/Divilkovskiy2024SourceSpace.tex +++ b/Divilkovskiy2024SourceSpace/paper/Divilkovskiy2024SourceSpace.tex @@ -14,6 +14,8 @@ \usepackage{natbib} \usepackage{doi} +\pagestyle{fancy} + \title{Восстановление прогноза, сделанного в метрическом вероятностном пространстве, в исходное пространство (временных рядов)} @@ -75,7 +77,7 @@ \keywords{Riemannian Space \and Trades \and Multidimensional Scaling \and Time Series} -\section{Introduction} +\section{Introduction TO BE REWRITTEN} Временные ряды возникают во многих прикладных задачах, таких как анализ физической активности, мозговых волн или биржевых котировок. Цель данной работы заключается в представлении нового метода прогнозирования для конкретного типа временных рядов, характеризующихся высокой дисперсией и высокой попарной ковариацией. Задача разбивается на три этапа: сначала исходное пространство временных рядов трансформируется в метрическое пространство (по попарным расстояниям), затем в этом пространстве производится прогноз, после чего результат возвращается в исходное пространство. В данной статье исследуется восстановление ответа в пространство временных рядов, то есть третий этап задачи. Также проводится оценка качества прогноза. Классические способы предсказания временных рядов, такие как LSTM \cite{LSTM}, SSA \cite{SSA} и многие другие \cite{Biosignals}, \cite{boyd2017multiperiod} основаны на предсказании значения одного ряда, тогда как в данной работе предлагается анализировать изменение набора временных рядов. Подобное исследование проводится в статье \cite{MulticorrelatedQuadratic}, однако в ней делается упор на задаче feature selection. @@ -86,7 +88,7 @@ \section{Introduction} Эксперимент проводится на биологических и финансовых данных. Цель эксперимента заключается в выборе наилучшего способа построения метрического пространства. -\section{Problem Statement} +\section{Problem Statement TO BE REWRITTEN} \subsection{Formal Problem} @@ -164,82 +166,27 @@ \subsection{MSSA} MSSA (Multivariate Singular Spectrum Analysis) в отличие от других методов позволяет брать во внимание корреляцию между несколькими рядами и прогнозировать несколько. -% \section{Headings: first level} -% \label{sec:headings} - -% \lipsum[4] See Section \ref{sec:headings}. - -% \subsection{Headings: second level} -% \lipsum[5] -% \begin{equation} -% \xi _{ij}(t)=P(x_{t}=i,x_{t+1}=j|y,v,w;\theta)= {\frac {\alpha _{i}(t)a^{w_t}_{ij}\beta _{j}(t+1)b^{v_{t+1}}_{j}(y_{t+1})}{\sum _{i=1}^{N} \sum _{j=1}^{N} \alpha _{i}(t)a^{w_t}_{ij}\beta _{j}(t+1)b^{v_{t+1}}_{j}(y_{t+1})}} -% \end{equation} - -% \subsubsection{Headings: third level} -% \lipsum[6] - -% \paragraph{Paragraph} -% \lipsum[7] - - - -% \section{Examples of citations, figures, tables, references} -% \label{sec:others} - -% \subsection{Citations} -% Citations use \verb+natbib+. The documentation may be found at -% \begin{center} -% \url{http://mirrors.ctan.org/macros/latex/contrib/natbib/natnotes.pdf} -% \end{center} +\section{Метрика} -% Here is an example usage of the two main commands (\verb+citet+ and \verb+citep+): Some people thought a thing \citep{kour2014real, hadash2018estimate} but other people thought something else \citep{kour2014fast}. Many people have speculated that if we knew exactly why \citet{kour2014fast} thought this\dots +При условии высокой попарной корреляции входных рядов и постановке задачи о предсказании значения рядов в следующий момент времени необходимо определить достаточные данные для модели. -% \subsection{Figures} -% \lipsum0] -% See Figure \ref{fig:fig1}. Here is how you add footnotes. \footnote{Sample of the first footnote.} -% \lipsum[11] +\paragraph{Недостаточность матрицы попарных расстояний} -% \begin{figure} -% \centering -% \includegraphics[width=0.5\textwidth]{../figures/log_reg_cs_exp.eps} -% \caption{Sample figure caption.} -% \label{fig:fig1} -% \end{figure} +Пусть дана предсказанная матрица попарных расстояний $\Sigma$ размера $d \times d$ для многомерного временного ряда $\overline{X} \in \mathbb{R}^{d \times t}$. Предсказывается $y \in \mathbb{R}^d$. Так же, известна метрика $d : \mathbb{R}^{t+1} \times \mathbb{R}^{t+1} \rightarrow \mathbb{R}$, введённая на временных рядах, обладающая свойствами метрики. То есть, $\Sigma_{i,j} = d(X_i \circ y_i, X_j \circ y_j)$, где $\circ$ означает конкатенацию векторов. -% \subsection{Tables} -% See awesome Table~\ref{tab:table}. +В качестве примера рассмотрим евклидову метрику: -% The documentation for \verb+booktabs+ (`Publication quality tables in LaTeX') is available from: -% \begin{center} -% \url{https://www.ctan.org/pkg/booktabs} -% \end{center} +$$d(p,q)=\sqrt{\sum_{k=1}^n (p_k-q_k)^2}.$$ +Использование данной метрики приводит к тому, что прибавление ко всем координатам $y$ некоторой константы $C$ не изменяет ответ. В случае задачи предсказывания временных рядов это свойство критично, поскольку даже в случае верного предсказания матрицы $\Sigma$ невозможно понять как себя поведут временные ряды в момент времени $t+1$. -% \begin{table} -% \caption{Sample table title} -% \centering -% \begin{tabular}{lll} -% \toprule -% \multicolumn{2}{c}{Part} \\ -% \cmidrule(r){1-2} -% Name & Description & Size ($\mu$m) \\ -% \midrule -% Dendrite & Input terminal & $\sim$100 \\ -% Axon & Output terminal & $\sim$10 \\ -% Soma & Cell body & up to $10^6$ \\ -% \bottomrule -% \end{tabular} -% \label{tab:table} -% \end{table} +Это приводит к невозможности использования алгоритма MDS для восстановления ответа в исходное пространство временных рядов. -% \subsection{Lists} -% \begin{itemize} -% \item Lorem ipsum dolor sit amet -% \item consectetur adipiscing elit. -% \item Aliquam dignissim blandit est, in dictum tortor gravida eget. In ac rutrum magna. -% \end{itemize} +Однако, даже использование других метрик не позволяет избавиться от проблемы. Рассмотрим метрику $d(x, y)$ как функцию из $\mathbb{R}^{2t+2}$ в $\mathbb{R}$. Известно, что метрика не сюръективна, поскольку $d(x, x) = 0$. Из этого следует существование нескольких возможных ответов на задачу. \textbf{TODO: возможно стоит использовать теорему Рисса об эквивалентности норм в конечномерных пространствах.} +Исходя из этих утверждений, использование только лишь матрицы расстояний не позволяет решить задачу прогнозирования. +\section{ \bibliography{references} \bibliographystyle{plain} diff --git a/Divilkovskiy2024SourceSpace/paper/arxiv.sty b/Divilkovskiy2024SourceSpace/paper/arxiv.sty index ccb7feb..34e8aa0 100644 --- a/Divilkovskiy2024SourceSpace/paper/arxiv.sty +++ b/Divilkovskiy2024SourceSpace/paper/arxiv.sty @@ -3,9 +3,6 @@ \ProcessOptions\relax % fonts -\renewcommand{\rmdefault}{ptm} -\renewcommand{\sfdefault}{phv} - % set page geometry \usepackage[verbose=true,letterpaper]{geometry} \AtBeginDocument{