Modelagem de Séries Temporais com Python¶

Grupy-SP — dezembro/2017¶

Wilson Freitas¶

físico
quant
corredor
padeiro

Agenda¶

Séries Temporais
Processos Estocásticos Lineares Estacionários
Modelos de Volatilidade

O que são Séries Temporais?¶

Qualquer conjunto de dados ordenados no tempo

Exemplos:
- preços de ações na Bolsa de Valores
- dados de tráfego do estado de São Paulo
- registro de temperatura
- Dados de GPS: posição, frequência cardíaca

Como são modeladas séries temporais?¶

Usando estatística
- Regressão
- Modelos ARIMA
- Modelos GARCH
- ...
Usando Machine Learning
- Redes Neurais: multilayer perceptron, bayesian neural networks, radial basis functions
- Lógica Fuzzy
- K-nearest neighbor
- Support vector machines
- ...

Nosso objeto de estudo: série do dólar em reais $p_t$¶

In [3]:

import quandl
dol = quandl.get('BCB/1', start_date = '2000-01-01')

In [4]:

dol.rename(columns={"Value": "USD"}, inplace=True)
dol.plot();

A variação do dólar: retorno do dólar $x_t$¶

$$ x_t = \log\left( \frac{p_t}{p_{t-1}} \right) $$

In [5]:

dol_ret = np.log(dol).diff().dropna()
dol_ret.plot();

O que vamos fazer aqui?¶

Vamos utilizar 3 técnincas para modelagem de séries temporais para realizar simulações da série do dólar.

Modelo de média constante
Modelo autoregressivo - AR(1)
Modelo de volatilidade - GARCH(1)

Todos os modelos utilizam a série de retornos.

Um modelo simples para os retornos do dólar¶

$$ x_t = \mu + \epsilon_t $$

$\mu$ é a média dos retornos $x_t$
$\epsilon_t \sim \mathrm{iid}\, N(0,\sigma^2)$

In [6]:

dol_mu = dol_ret.values.mean()
dol_sd = dol_ret.values.std()
dol_sim1 = dol_mu + dol_sd*np.random.randn(len(dol_ret))
plot_two(dol_ret, dol_sim1, [-0.1,0.1], 'Retorno do dólar', 'Retorno do dólar simulado')

Voltando para os preços¶

Dados os retornos

$$ x_t = \log\left( \frac{p_t}{p_{t-1}} \right) $$

Invertemos a equação para voltar aos preços

$$ p_{t} = p_{t-1} \exp{x_t} $$

In [7]:

dol1 = np.cumprod(np.r_[dol.values[1], np.exp(dol_sim1)])

plt.figure(figsize=(16,8))
plt.subplot(221)
plt.ylim([1, 4.5])
plt.plot(dol)
plt.title('Dólar')
plt.subplot(222)
plt.ylim([1, 4.5])
plt.plot(dol1)
plt.title('Dólar simulado');

Vamos complicar um pouco¶

Vamos assumir que o passado pode explicar o futuro.

$$ x_t = \mu + \phi_1 x_{t-1} + \epsilon_t $$

Processo Autoregressivo de ordem $1$ = AR(1)
A order do process define até onde o passado pode explicar o futuro
AR(1) faz parte da família ARIMA

`statsmodels`¶

Linear regression models
Generalized linear models
Discrete choice models
Robust linear models
Many models and functions for time series analysis
Nonparametric estimators
A collection of datasets for examples
A wide range of statistical tests
Input-output tools for producing tables in a number of formats (Text, LaTex, HTML) and for reading Stata files into NumPy and Pandas.
Plotting functions
Extensive unit tests to ensure correctness of results

fonte: http://statsmodels.sourceforge.net/

In [8]:

import statsmodels.tsa as tsa
import statsmodels.api as sm

In [9]:

model = sm.tsa.ARMA((dol_ret - dol_mu)/dol_sd, (1, 0)).fit()
print(model.summary())

                              ARMA Model Results                              
==============================================================================
Dep. Variable:                    USD   No. Observations:                 4510
Model:                     ARMA(1, 0)   Log Likelihood               -6391.577
Method:                       css-mle   S.D. of innovations              0.998
Date:                Fri, 15 Dec 2017   AIC                          12789.154
Time:                        14:03:37   BIC                          12808.397
Sample:                    01-04-2000   HQIC                         12795.934
                         - 12-14-2017                                         
==============================================================================
                 coef    std err          z      P>|z|      [0.025      0.975]
------------------------------------------------------------------------------
const       3.824e-05      0.016      0.002      0.998      -0.031       0.031
ar.L1.USD      0.0589      0.015      3.962      0.000       0.030       0.088
                                    Roots                                    
=============================================================================
                 Real           Imaginary           Modulus         Frequency
-----------------------------------------------------------------------------
AR.1           16.9730           +0.0000j           16.9730            0.0000
-----------------------------------------------------------------------------

In [21]:

dol_ar_proc = tsa.arima_process.ArmaProcess(np.r_[1, -model.params], [1])
dol_ar_sim = dol_ar_proc.generate_sample(len(dol_ret)) * dol_sd + dol_mu

plt.figure(figsize=(16,8))
plt.subplot(221)
plt.ylim(-0.1,0.1)
plt.plot(dol_ret)
plt.title('Retorno do dólar')
plt.subplot(222)
plt.ylim(-0.1,0.1)
plt.plot(dol_ar_sim)
plt.title('Retorno do dólar simulado');

In [22]:

dol1 = np.cumprod(np.r_[dol.values[1], np.exp(dol_ar_sim)])

plt.figure(figsize=(16,8))
plt.subplot(221)
plt.ylim([1, 4.5])
plt.plot(dol)
plt.title('Dólar')
plt.subplot(222)
plt.ylim([1, 4.5])
plt.plot(dol1)
plt.title('Dólar simulado');

Vamos tentar algo realmente diferente¶

Os modelos da família GARCH

$$ x_t = \mu + \epsilon_t $$

onde

$$ \begin{align} \epsilon_t & = z_t \sigma_t \\ \sigma^2_t & = \omega + \alpha_1 e^2_{t-1} + \beta_1 \sigma^2_{t-1} \end{align} $$

$z_t \sim N(0, 1)$.
A variância do processo é um processo autoregressivo

`arch`¶

The ARCH toolbox currently contains routines for

Univariate volatility models
Bootstrapping
Multiple comparison procedures
Unit root tests

fonte: http://arch.readthedocs.io/en/latest/

In [15]:

from arch import arch_model
am = arch_model((dol_ret-dol_mu)/dol_sd)
res = am.fit(disp = 'off')
print(res.summary())

                     Constant Mean - GARCH Model Results                      
==============================================================================
Dep. Variable:                    USD   R-squared:                      -0.001
Mean Model:             Constant Mean   Adj. R-squared:                 -0.001
Vol Model:                      GARCH   Log-Likelihood:               -5443.94
Distribution:                  Normal   AIC:                           10895.9
Method:            Maximum Likelihood   BIC:                           10921.5
                                        No. Observations:                 4510
Date:                Fri, Dec 15 2017   Df Residuals:                     4506
Time:                        14:03:39   Df Model:                            4
                                  Mean Model                                  
==============================================================================
                 coef    std err          t      P>|t|        95.0% Conf. Int.
------------------------------------------------------------------------------
mu            -0.0312  1.206e-02     -2.587  9.673e-03 [-5.483e-02,-7.564e-03]
                              Volatility Model                              
============================================================================
                 coef    std err          t      P>|t|      95.0% Conf. Int.
----------------------------------------------------------------------------
omega          0.0128  3.534e-03      3.622  2.929e-04 [5.873e-03,1.973e-02]
alpha[1]       0.1561  1.902e-02      8.208  2.256e-16     [  0.119,  0.193]
beta[1]        0.8438  1.778e-02     47.470      0.000     [  0.809,  0.879]
============================================================================

Covariance estimator: robust

In [16]:

def simulate_garch(params, nobs):
    e = np.random.randn(nobs)
    var = np.zeros(len(e))
    x = np.zeros(len(e))

    for t in range(len(e)):
        var[t] = params[1] + params[2] * x[t-1]**2 + params[3] * var[t-1]
        x[t] = params[0] + e[t] * np.sqrt(var[t])
    
    return x

In [19]:

dol_am_sim = simulate_garch(res.params, len(dol_ret)) * dol_sd + dol_mu

plt.figure(figsize=(16,8))
plt.subplot(221)
plt.ylim(-0.1,0.1)
plt.plot(dol_ret)
plt.title('Retorno do dólar')
plt.subplot(222)
plt.ylim(-0.1,0.1)
plt.plot(dol_am_sim)
plt.title('Retorno do dólar simulado');

In [20]:

dol1 = np.cumprod(np.r_[dol.values[1], np.exp(dol_am_sim)])

plt.figure(figsize=(16,8))
plt.subplot(221)
plt.ylim([1, 5])
plt.plot(dol)
plt.title('Dólar')
plt.subplot(222)
plt.plot(dol1)
plt.title('Dólar simulado');

Conclusões¶

Aqui vimos um breve exemplo de como realizar Modelagem de Séries Temporais com Python.

A Modelagem de Séries Temporais é fundamental para a compreensão da dinâmica das séries temporais, particularmente utilizada para modelar séries financeiras.

A modelagem de séries temporais financeiras é utilizada para:

Trading de Índices de Volatilidade
Gestão de risco
Apreçamento de derivativos financeiros
Modelos de Volatilidade em Séries Intradiárias para avaliação de Risco Intradiário
Modelos de Cointegração para trading de pares (pairs trading)
Modelos de execução de ordens em condições heterogêneas

Modelagem de Séries Temporais com Python¶

Grupy-SP — dezembro/2017¶

Wilson Freitas¶

Wilson Freitas¶

Agenda¶

O que são Séries Temporais?¶

Como são modeladas séries temporais?¶

Nosso objeto de estudo: série do dólar em reais $p_t$¶

A variação do dólar: retorno do dólar $x_t$¶

O que vamos fazer aqui?¶

Um modelo simples para os retornos do dólar¶

Voltando para os preços¶

Vamos complicar um pouco¶

`statsmodels`¶

Vamos tentar algo realmente diferente¶

`arch`¶

Conclusões¶

Referências¶

Dúvidas?¶

Modelagem de Séries Temporais com Python¶

Grupy-SP — dezembro/2017¶

Wilson Freitas¶

Wilson Freitas¶

Agenda¶

O que são Séries Temporais?¶

Como são modeladas séries temporais?¶

Nosso objeto de estudo: série do dólar em reais $p_t$¶

A variação do dólar: retorno do dólar $x_t$¶

O que vamos fazer aqui?¶

Um modelo simples para os retornos do dólar¶

Voltando para os preços¶

Vamos complicar um pouco¶

statsmodels¶

Vamos tentar algo realmente diferente¶

arch¶

Conclusões¶

Referências¶

Dúvidas?¶

`statsmodels`¶

`arch`¶