Sunday 6 August 2017

Autoregressive moving average time series model


Ada sejumlah pendekatan untuk memodelkan time series. Kami menguraikan beberapa pendekatan yang paling umum di bawah ini. Trend, Seasonal, Residual Decompositions Salah satu pendekatannya adalah menguraikan deret waktu menjadi komponen tren, musiman, dan residual. Pemulusan eksponensial tiga adalah contoh pendekatan ini. Contoh lain, disebut loess musiman, didasarkan pada kuadrat terkecil tertimbang lokal dan dibahas oleh Cleveland (1993). Kami tidak membahas permainan musiman di buku pegangan ini. Metode Berbasis Frekuensi Pendekatan lain, yang umum digunakan dalam aplikasi ilmiah dan teknik, adalah menganalisis rangkaian dalam domain frekuensi. Contoh dari pendekatan ini dalam pemodelan kumpulan data tipe sinusoidal ditunjukkan dalam studi kasus defleksi balok. Plot spektral adalah alat utama untuk analisis frekuensi deret waktu. Model Autoregressive (AR) Pendekatan umum untuk pemodelan univariat time series adalah model autoregressive (AR): Xt delta phi1 X phi2 X cdots phip X Di mana (Xt) adalah deret waktu, (At) adalah white noise, dan delta Kiri (1 - sum p phii kanan) mu. Dengan (mu) yang menunjukkan mean prosesnya. Model autoregresif hanyalah sebuah regresi linier dari nilai arus seri terhadap satu atau lebih nilai awal dari rangkaian. Nilai (p) disebut urutan model AR. Model AR dapat dianalisis dengan salah satu dari berbagai metode, termasuk teknik kuadrat linier standar. Mereka juga memiliki interpretasi langsung. Model Moving Average (MA) Pendekatan umum lainnya untuk pemodelan model rangkaian waktu univariat adalah model moving average (MA): Xt mu At - theta1 A - theta2 A - cdots - thetaq A, di mana (Xt) adalah deret waktunya, (mu ) Adalah mean dari rangkaian, (A) adalah istilah white noise, dan (theta1,, ldots,, thetaq) adalah parameter dari model. Nilai (q) disebut urutan model MA. Artinya, model rata-rata bergerak secara konseptual adalah regresi linier dari nilai arus seri terhadap noise putih atau guncangan acak dari satu atau lebih nilai awal dari rangkaian. Guncangan acak pada masing-masing titik diasumsikan berasal dari distribusi yang sama, biasanya distribusi normal, dengan lokasi pada nol dan skala konstan. Perbedaan dalam model ini adalah bahwa guncangan acak ini digabungkan ke nilai masa depan dari seri waktu. Pemasangan perkiraan MA lebih rumit daripada model AR karena istilah error tidak dapat diamati. Ini berarti bahwa prosedur pemasangan non-linier iteratif harus digunakan sebagai pengganti kuadrat terkecil linier. Model MA juga memiliki interpretasi yang kurang jelas dibanding model AR. Kadang-kadang ACF dan PACF akan menyarankan bahwa model MA akan menjadi pilihan model yang lebih baik dan terkadang kedua istilah AR dan MA harus digunakan dalam model yang sama (lihat Bagian 6.4.4.5). Namun, perlu diketahui bahwa istilah kesalahan setelah model sesuai harus independen dan mengikuti asumsi standar untuk proses univariat. Box dan Jenkins mempopulerkan pendekatan yang menggabungkan rata-rata bergerak dan pendekatan autoregresif dalam buku Time Series Analysis: Forecasting and Control (Box, Jenkins, dan Reinsel, 1994). Meskipun pendekatan autoregresif dan pendekatan rata-rata sudah diketahui (dan pada awalnya diselidiki oleh Yule), kontribusi Box and Jenkins adalah dalam mengembangkan metodologi sistematis untuk mengidentifikasi dan memperkirakan model yang dapat menggabungkan kedua pendekatan tersebut. Hal ini membuat model Box-Jenkins menjadi model kelas yang hebat. Beberapa bagian selanjutnya akan membahas model-model ini secara rinci. Pengenalan pada ARIMA: model nonseasonal persamaan peramalan ARIMA (p, d, q): Model ARIMA secara teori merupakan kelas model paling umum untuk meramalkan rangkaian waktu yang dapat dibuat. Menjadi 8220stationary8221 dengan membedakan (jika perlu), mungkin bersamaan dengan transformasi nonlinier seperti penebangan atau pengapuran (jika perlu). Variabel acak yang merupakan deret waktu bersifat stasioner jika sifat statistiknya konstan sepanjang waktu. Seri stasioner tidak memiliki tren, variasinya berkisar rata-rata memiliki amplitudo konstan, dan bergoyang secara konsisten. Yaitu pola waktu acak jangka pendeknya selalu terlihat sama dalam arti statistik. Kondisi terakhir ini berarti autokorelasinya (korelasi dengan penyimpangannya sendiri dari mean) tetap konstan dari waktu ke waktu, atau ekuivalen, bahwa spektrum kekuatannya tetap konstan seiring berjalannya waktu. Variabel acak dari bentuk ini dapat dilihat (seperti biasa) sebagai kombinasi antara sinyal dan noise, dan sinyal (jika ada) dapat menjadi pola pengembalian cepat atau lambat, atau osilasi sinusoidal, atau alternasi cepat pada tanda , Dan itu juga bisa memiliki komponen musiman. Model ARIMA dapat dilihat sebagai model 8220filter8221 yang mencoba memisahkan sinyal dari noise, dan sinyal tersebut kemudian diekstrapolasikan ke masa depan untuk mendapatkan perkiraan. Persamaan peramalan ARIMA untuk rangkaian waktu stasioner adalah persamaan linier (yaitu regresi-tipe) dimana prediktor terdiri dari kelambatan variabel dependen dan atau lag dari kesalahan perkiraan. Yaitu: Prediksi nilai Y adalah konstanta dan atau jumlah tertimbang dari satu atau lebih nilai Y dan satu angka tertimbang dari satu atau lebih nilai kesalahan terkini. Jika prediktor hanya terdiri dari nilai Y yang tertinggal, itu adalah model autoregresif murni (8220 self-regressed8221), yang hanyalah kasus khusus dari model regresi dan yang dapat dilengkapi dengan perangkat lunak regresi standar. Sebagai contoh, model autoregresif orde pertama (8220AR (1) 8221) untuk Y adalah model regresi sederhana dimana variabel independennya hanya Y yang tertinggal satu periode (LAG (Y, 1) dalam Statgrafik atau YLAG1 dalam RegresIt). Jika beberapa prediktor tertinggal dari kesalahan, model ARIMA TIDAK merupakan model regresi linier, karena tidak ada cara untuk menentukan error8221 8220last periodier178 sebagai variabel independen: kesalahan harus dihitung berdasarkan periode-ke-periode Saat model dipasang pada data. Dari sudut pandang teknis, masalah dengan menggunakan kesalahan tertinggal sebagai prediktor adalah bahwa prediksi model8217 bukanlah fungsi linear dari koefisien. Meskipun mereka adalah fungsi linier dari data masa lalu. Jadi, koefisien pada model ARIMA yang mencakup kesalahan tertinggal harus diestimasi dengan metode optimasi nonlinier (8220 climb-climbing8221) daripada hanya dengan memecahkan sistem persamaan. Akronim ARIMA adalah singkatan Auto-Regressive Integrated Moving Average. Lags dari rangkaian stasioner dalam persamaan peramalan disebut istilah quotautoregressivequot, kelambatan kesalahan perkiraan disebut istilah kuotasi rata-rata quotmoving average, dan deret waktu yang perlu dibedakan untuk dijadikan stasioner disebut versi seri integimental dari seri stasioner. Model random-walk dan random-trend, model autoregresif, dan model pemulusan eksponensial adalah kasus khusus model ARIMA. Model ARIMA nonseasonal diklasifikasikan sebagai model quotARIMA (p, d, q) quot, di mana: p adalah jumlah istilah autoregresif, d adalah jumlah perbedaan nonseasonal yang diperlukan untuk stasioneritas, dan q adalah jumlah kesalahan perkiraan yang tertinggal dalam Persamaan prediksi Persamaan peramalan dibangun sebagai berikut. Pertama, izinkan y menunjukkan perbedaan D dari Y. yang berarti: Perhatikan bahwa perbedaan kedua Y (kasus d2) bukanlah selisih 2 periode yang lalu. Sebaliknya, ini adalah perbedaan pertama-perbedaan-dari-pertama. Yang merupakan analog diskrit turunan kedua, yaitu akselerasi lokal dari seri daripada tren lokalnya. Dalam hal y. Persamaan peramalan umum adalah: Disini parameter rata-rata bergerak (9528217s) didefinisikan sehingga tanda-tanda mereka negatif dalam persamaan, mengikuti konvensi yang diperkenalkan oleh Box dan Jenkins. Beberapa penulis dan perangkat lunak (termasuk bahasa pemrograman R) mendefinisikannya sehingga mereka memiliki tanda plus. Bila nomor aktual dicolokkan ke dalam persamaan, tidak ada ambiguitas, tapi penting untuk mengetahui konvensi mana yang digunakan perangkat lunak Anda saat Anda membaca hasilnya. Seringkali parameter dilambangkan dengan AR (1), AR (2), 8230, dan MA (1), MA (2), 8230 dll. Untuk mengidentifikasi model ARIMA yang sesuai untuk Y. Anda memulai dengan menentukan urutan differencing (D) perlu membuat stasioner seri dan menghilangkan fitur musiman musiman, mungkin bersamaan dengan transformasi yang menstabilkan varians seperti penebangan atau pengapuran. Jika Anda berhenti pada titik ini dan meramalkan bahwa rangkaian yang berbeda adalah konstan, Anda hanya memiliki model acak berjalan atau acak acak. Namun, rangkaian stationarized masih memiliki kesalahan autokorelasi, menunjukkan bahwa beberapa jumlah istilah AR (p 8805 1) dan beberapa istilah MA (q 8805 1) juga diperlukan dalam persamaan peramalan. Proses penentuan nilai p, d, dan q yang terbaik untuk rangkaian waktu tertentu akan dibahas di bagian catatan selanjutnya (yang tautannya berada di bagian atas halaman ini), namun pratinjau beberapa jenis Model ARIMA nonseasonal yang biasa dijumpai diberikan di bawah ini. ARIMA (1,0,0) model autoregresif orde pertama: jika seri stasioner dan autokorelasi, mungkin dapat diprediksi sebagai kelipatan dari nilai sebelumnya, ditambah konstanta. Persamaan peramalan dalam kasus ini adalah 8230 yang Y regresi pada dirinya sendiri tertinggal oleh satu periode. Ini adalah model konstanta 8220ARIMA (1,0,0) constant8221. Jika mean Y adalah nol, maka istilah konstan tidak akan disertakan. Jika koefisien kemiringan 981 1 positif dan kurang dari 1 besarnya (harus kurang dari 1 dalam besaran jika Y adalah stasioner), model tersebut menggambarkan perilaku rata-rata pada nilai periodisasi berikutnya yang diperkirakan akan menjadi 981 1 kali sebagai Jauh dari mean sebagai nilai periode ini. Jika 981 1 negatif, ia memprediksi perilaku rata-rata dengan alternasi tanda, yaitu juga memprediksi bahwa Y akan berada di bawah rata-rata periode berikutnya jika berada di atas rata-rata periode ini. Dalam model autoregresif orde kedua (ARIMA (2,0,0)), akan ada istilah Y t-2 di sebelah kanan juga, dan seterusnya. Bergantung pada tanda dan besaran koefisien, model ARIMA (2,0,0) bisa menggambarkan sistem yang pembalikan rata-rata terjadi dengan mode sinusoidal oscillating, seperti gerak massa pada pegas yang mengalami guncangan acak. . ARIMA (0,1,0) berjalan acak: Jika seri Y tidak stasioner, model yang paling sederhana untuk model ini adalah model jalan acak, yang dapat dianggap sebagai kasus pembatas model AR (1) dimana autoregresif Koefisien sama dengan 1, yaitu deret dengan reversi mean yang jauh lebih lambat. Persamaan prediksi untuk model ini dapat ditulis sebagai: di mana istilah konstan adalah perubahan periode-ke-periode rata-rata (yaitu drift jangka panjang) di Y. Model ini dapat dipasang sebagai model regresi yang tidak mencegat dimana Perbedaan pertama Y adalah variabel dependen. Karena hanya mencakup perbedaan nonseasonal dan istilah konstan, model ini diklasifikasikan sebagai model quotARIMA (0,1,0) dengan konstan. Model random-walk-without - drift akan menjadi ARIMA (0,1, 0) model tanpa ARIMA konstan (1,1,0) model autoregresif orde satu yang terdesentralisasi: Jika kesalahan model jalan acak diobot dengan autokorelasi, mungkin masalahnya dapat diperbaiki dengan menambahkan satu lag variabel dependen ke persamaan prediksi - - yaitu Dengan mengundurkan diri dari perbedaan pertama Y pada dirinya sendiri yang tertinggal satu periode. Ini akan menghasilkan persamaan prediksi berikut: yang dapat diatur ulang menjadi Ini adalah model autoregresif orde pertama dengan satu urutan perbedaan nonseasonal dan istilah konstan - yaitu. Model ARIMA (1,1,0). ARIMA (0,1,1) tanpa perataan eksponensial sederhana: Strategi lain untuk memperbaiki kesalahan autokorelasi dalam model jalan acak disarankan oleh model pemulusan eksponensial sederhana. Ingatlah bahwa untuk beberapa seri waktu nonstasioner (misalnya yang menunjukkan fluktuasi yang bising di sekitar rata-rata yang bervariasi secara perlahan), model jalan acak tidak berjalan sebaik rata-rata pergerakan nilai masa lalu. Dengan kata lain, daripada mengambil pengamatan terbaru sebagai perkiraan pengamatan berikutnya, lebih baik menggunakan rata-rata beberapa pengamatan terakhir untuk menyaring kebisingan dan memperkirakan secara lebih akurat mean lokal. Model pemulusan eksponensial sederhana menggunakan rata-rata pergerakan rata-rata tertimbang eksponensial untuk mencapai efek ini. Persamaan prediksi untuk model smoothing eksponensial sederhana dapat ditulis dalam sejumlah bentuk ekuivalen matematis. Salah satunya adalah bentuk koreksi yang disebut 8220error correction8221, dimana ramalan sebelumnya disesuaikan dengan kesalahan yang dibuatnya: Karena e t-1 Y t-1 - 374 t-1 menurut definisinya, ini dapat ditulis ulang sebagai : Yang merupakan persamaan peramalan ARIMA (0,1,1) - tanpa perkiraan konstan dengan 952 1 1 - 945. Ini berarti bahwa Anda dapat menyesuaikan smoothing eksponensial sederhana dengan menentukannya sebagai model ARIMA (0,1,1) tanpa Konstan, dan perkiraan koefisien MA (1) sesuai dengan 1-minus-alpha dalam formula SES. Ingatlah bahwa dalam model SES, rata-rata usia data dalam prakiraan 1 periode adalah 1 945. yang berarti bahwa mereka cenderung tertinggal dari tren atau titik balik sekitar 1 945 periode. Dengan demikian, rata-rata usia data dalam prakiraan 1-periode-depan model ARIMA (0,1,1) - tanpa konstan adalah 1 (1 - 952 1). Jadi, misalnya, jika 952 1 0,8, usia rata-rata adalah 5. Karena 952 1 mendekati 1, model ARIMA (0,1,1) - tanpa model konstan menjadi rata-rata bergerak jangka-panjang, dan sebagai 952 1 Pendekatan 0 menjadi model random-walk-without-drift. Apa cara terbaik untuk memperbaiki autokorelasi: menambahkan istilah AR atau menambahkan istilah MA Dalam dua model sebelumnya yang dibahas di atas, masalah kesalahan autokorelasi dalam model jalan acak diperbaiki dengan dua cara yang berbeda: dengan menambahkan nilai lag dari seri yang berbeda Ke persamaan atau menambahkan nilai tertinggal dari kesalahan perkiraan. Pendekatan mana yang terbaik Aturan praktis untuk situasi ini, yang akan dibahas lebih rinci nanti, adalah bahwa autokorelasi positif biasanya paling baik ditangani dengan menambahkan istilah AR ke model dan autokorelasi negatif biasanya paling baik ditangani dengan menambahkan MA istilah. Dalam deret waktu bisnis dan ekonomi, autokorelasi negatif sering muncul sebagai artefak differencing. (Secara umum, differencing mengurangi autokorelasi positif dan bahkan dapat menyebabkan perubahan dari autokorelasi positif ke negatif.) Jadi, model ARIMA (0,1,1), di mana perbedaannya disertai dengan istilah MA, lebih sering digunakan daripada Model ARIMA (1,1,0). ARIMA (0,1,1) dengan perataan eksponensial sederhana konstan dengan pertumbuhan: Dengan menerapkan model SES sebagai model ARIMA, Anda benar-benar mendapatkan fleksibilitas. Pertama, perkiraan koefisien MA (1) dibiarkan negatif. Ini sesuai dengan faktor pemulusan yang lebih besar dari 1 dalam model SES, yang biasanya tidak diizinkan oleh prosedur pemasangan model SES. Kedua, Anda memiliki pilihan untuk memasukkan istilah konstan dalam model ARIMA jika Anda mau, untuk memperkirakan tren nol rata-rata. Model ARIMA (0,1,1) dengan konstanta memiliki persamaan prediksi: Prakiraan satu periode dari model ini secara kualitatif serupa dengan model SES, kecuali bahwa lintasan perkiraan jangka panjang biasanya adalah Garis miring (kemiringannya sama dengan mu) bukan garis horizontal. ARIMA (0,2,1) atau (0,2,2) tanpa pemulusan eksponensial linier konstan: Model pemulusan eksponensial linier adalah model ARIMA yang menggunakan dua perbedaan nonseason dalam hubungannya dengan persyaratan MA. Perbedaan kedua dari seri Y bukan hanya perbedaan antara Y dan dirinya tertinggal dua periode, namun ini adalah perbedaan pertama dari perbedaan pertama - i. Perubahan perubahan Y pada periode t. Jadi, perbedaan kedua Y pada periode t sama dengan (Y t - Y t-1) - (Y t-1 - Y t-2) Y t - 2Y t-1 Y t-2. Perbedaan kedua dari fungsi diskrit sama dengan turunan kedua dari fungsi kontinyu: ia mengukur kuotasi kuadrat atau quotcurvaturequot dalam fungsi pada suatu titik waktu tertentu. Model ARIMA (0,2,2) tanpa konstan memprediksi bahwa perbedaan kedua dari rangkaian sama dengan fungsi linier dari dua kesalahan perkiraan terakhir: yang dapat disusun ulang sebagai: di mana 952 1 dan 952 2 adalah MA (1) dan MA (2) koefisien. Ini adalah model pemulusan eksponensial linear umum. Dasarnya sama dengan model Holt8217s, dan model Brown8217s adalah kasus khusus. Ini menggunakan rata-rata pergerakan tertimbang eksponensial untuk memperkirakan tingkat lokal dan tren lokal dalam rangkaian. Perkiraan jangka panjang dari model ini menyatu dengan garis lurus yang kemiringannya bergantung pada tren rata-rata yang diamati menjelang akhir rangkaian. ARIMA (1,1,2) tanpa perataan eksponensial eksponensial yang terfragmentasi. Model ini diilustrasikan pada slide yang menyertainya pada model ARIMA. Ini mengekstrapolasikan tren lokal di akhir seri namun meratakannya pada cakrawala perkiraan yang lebih panjang untuk memperkenalkan catatan konservatisme, sebuah praktik yang memiliki dukungan empiris. Lihat artikel di quotWhy the Damped Trend karyaquot oleh Gardner dan McKenzie dan artikel quotGolden Rulequot oleh Armstrong dkk. Untuk rinciannya. Umumnya disarankan untuk tetap berpegang pada model di mana setidaknya satu dari p dan q tidak lebih besar dari 1, yaitu jangan mencoba menyesuaikan model seperti ARIMA (2,1,2), karena hal ini cenderung menyebabkan overfitting. Dan isu-isu kuotom-faktorquot yang dibahas secara lebih rinci dalam catatan tentang struktur matematis model ARIMA. Implementasi Spreadsheet: Model ARIMA seperti yang dijelaskan di atas mudah diterapkan pada spreadsheet. Persamaan prediksi adalah persamaan linier yang mengacu pada nilai-nilai masa lalu dari rangkaian waktu asli dan nilai kesalahan masa lalu. Dengan demikian, Anda dapat membuat spreadsheet peramalan ARIMA dengan menyimpan data di kolom A, rumus peramalan pada kolom B, dan kesalahan (data minus prakiraan) di kolom C. Rumus peramalan pada sel biasa di kolom B hanya akan menjadi Ekspresi linier yang mengacu pada nilai pada baris sebelumnya kolom A dan C, dikalikan dengan koefisien AR atau MA yang sesuai yang tersimpan dalam sel di tempat lain pada model ARMA (p, q) Moving Average ARMS (p, q) untuk Analisis Seri Waktu - Bagian 3 Ini adalah Pos ketiga dan terakhir dalam seri mini model Autoregressive Moving Average (ARMA) untuk analisis time series. Weve memperkenalkan model Autoregressive dan model Moving Average di dua artikel sebelumnya. Kini saatnya menggabungkan mereka untuk menghasilkan model yang lebih canggih. Pada akhirnya, ini akan membawa kita pada model ARIMA dan GARCH yang memungkinkan kita memprediksi pengembalian aset dan meramalkan volatilitas. Model ini akan menjadi dasar untuk sinyal perdagangan dan teknik manajemen risiko. Jika Anda telah membaca Bagian 1 dan Bagian 2 Anda akan melihat bahwa kita cenderung mengikuti pola untuk analisis model waktu seri. Saya mengulanginya sebentar di sini: Dasar Pemikiran - Mengapa kita tertarik dengan model khusus ini Definisi - Definisi matematis untuk mengurangi ambiguitas. Correlogram - Merencanakan korelogram sampel untuk memvisualisasikan perilaku model. Simulasi dan Pemasangan - Memasukkan model ke simulasi, untuk memastikan kita memahami model dengan benar. Data Keuangan Nyata - Terapkan model ke harga aset historis yang nyata. Prediksi - Perkiraan nilai berikutnya untuk membangun sinyal atau filter perdagangan. Untuk mengikuti artikel ini disarankan untuk melihat artikel sebelumnya mengenai analisis deret waktu. Mereka semua bisa ditemukan di sini. Kriteria Informasi Bayesian Pada Bagian 1 dari seri artikel ini, kami melihat Kriteria Informasi Akaike (AIC) sebagai alat untuk membantu kami memilih antara model rangkaian waktu terbaik yang terpisah. Alat yang terkait erat adalah Bayesian Information Criterion (BIC). Intinya memiliki perilaku yang mirip dengan AIC karena menisumsi model karena memiliki terlalu banyak parameter. Hal ini dapat menyebabkan overfitting. Perbedaan antara BIC dan AIC adalah bahwa BIC lebih ketat dengan penaliasinya terhadap parameter tambahan. Kriteria Informasi Bayesian Jika kita mengambil fungsi likelihood untuk model statistik, yang memiliki parameter k, dan L memaksimalkan kemungkinannya. Maka Kriteria Informasi Bayesian diberikan oleh: Dimana n adalah jumlah titik data dalam deret waktu. Kami akan menggunakan AIC dan BIC di bawah saat memilih model ARMA (p, q) yang sesuai. Uji Ljung-Box Pada Bagian 1 dari rangkaian artikel ini, Rajan menyebutkan dalam komentar Disqus bahwa uji Ljung-Box lebih tepat daripada menggunakan Kriteria Informasi Akaike terhadap Kriteria Informasi Bayesian dalam menentukan apakah model ARMA sesuai untuk satu waktu. seri. Uji Ljung-Box adalah tes hipotesis klasik yang dirancang untuk menguji apakah seperangkat autokorelasi dari model rangkaian waktu yang dipasang berbeda secara signifikan dari nol. Tes ini tidak menguji setiap lag individu untuk keacakan, namun menguji keacakan pada sekelompok kelambatan. Uji Ljung-Box Kami mendefinisikan hipotesis nol sebagai berikut: Data deret waktu pada setiap lag adalah i. i.d .. yaitu, korelasi antara nilai seri populasi adalah nol. Kami mendefinisikan hipotesis alternatif sebagai berikut: Data deret waktu bukan i. i.d. Dan memiliki korelasi serial. Kami menghitung statistik uji berikut. T: Dimana n adalah panjang sampel deret waktu, hat k adalah autokorelasi sampel pada lag k dan h adalah jumlah kelambatan yang diuji. Aturan keputusan mengenai apakah menolak hipotesis nol adalah untuk memeriksa apakah Q gt chi2, untuk distribusi chi-kuadrat dengan derajat kebebasan pada persentil 100 (1-alfa). Sementara rincian tes mungkin tampak sedikit rumit, sebenarnya kita bisa menggunakan R untuk menghitung tes untuk kita, menyederhanakan prosedurnya dengan agak. Autogressive Moving Average (ARMA) Model order p, q Sekarang yang membahas BIC dan uji Ljung-Box, siap untuk membahas model campuran pertama kami, yaitu Autoregressive Moving Average dari order p, q, atau ARMA (p, Q). Sampai saat ini kami telah mempertimbangkan proses autoregresif dan proses rata-rata bergerak. Model sebelumnya menganggap perilaku masa lalu sebagai masukan bagi model dan upaya untuk menangkap efek partisipan pasar, seperti momentum dan pembalikan rata-rata dalam perdagangan saham. Model yang terakhir digunakan untuk mengkarakterisasi informasi kejutan ke dalam rangkaian, seperti pengumuman pendapatan mengejutkan atau kejadian tak terduga (seperti tumpahan minyak BP Deepwater Horizon). Oleh karena itu, model ARMA mencoba menangkap kedua aspek ini saat memodelkan deret waktu keuangan. Perhatikan bahwa model ARMA tidak memperhitungkan pengelompokkan volatilitas, fenomena empiris kunci dari banyak rangkaian waktu keuangan. Ini bukan model heteroscedastic kondisional. Untuk itu kita perlu menunggu model ARCH dan GARCH. Definisi Model ARMA (p, q) adalah kombinasi linier dari dua model linier dan dengan demikian sendiri masih linier: Model Rata-rata Moving Average Autoregressive order p, q Model time series,, adalah model rata-rata bergerak autoregresif dari order p, q . ARMA (p, q), jika: mulai xt alpha1 x alpha2 x ldot wt beta1 w beta2 w ldots betaq w end Dimana white noise dengan E (wt) 0 dan varians sigma2. Jika kita mempertimbangkan Backward Shift Operator. (Lihat artikel sebelumnya), maka kita dapat menulis ulang fungsi fta dan phi di atas: Kita dapat dengan mudah melihatnya dengan menetapkan p neq 0 dan q0 kita mengembalikan model AR (p). Demikian pula jika kita menetapkan p 0 dan q neq 0 kita mengembalikan model MA (q). Salah satu fitur utama model ARMA adalah bahwa hal itu bersifat pelit dan berlebihan dalam parameternya. Artinya, model ARMA seringkali memerlukan parameter yang lebih sedikit daripada model AR (p) atau MA (q) saja. Selain itu jika kita menulis ulang persamaan dalam hal BSO, maka theta dan phi polinomial kadang-kadang dapat berbagi faktor yang sama, sehingga mengarah ke model yang lebih sederhana. Simulasi dan Correlogram Seperti model rata-rata autoregressive dan moving average, kita sekarang akan mensimulasikan berbagai seri ARMA dan kemudian mencoba menyesuaikan model ARMA dengan realisasi ini. Kami melaksanakan ini karena kami ingin memastikan bahwa kami memahami prosedur pemasangannya, termasuk cara menghitung interval kepercayaan untuk model, serta memastikan bahwa prosedur tersebut benar-benar menghasilkan perkiraan yang masuk akal untuk parameter ARMA yang asli. Pada Bagian 1 dan Bagian 2 kita secara manual menyusun seri AR dan MA dengan menggambar sampel N dari distribusi normal dan kemudian menyusun model deret waktu tertentu dengan menggunakan lag dari sampel ini. Namun, ada cara yang lebih mudah untuk mensimulasikan AR, MA, ARMA dan bahkan data ARIMA, cukup dengan menggunakan metode arima. sim di R. Mari kita mulai dengan model ARMA non-sepele yang paling sederhana, yaitu ARMA (1,1 ) model. Artinya, model pesanan autoregresif satu dikombinasikan dengan model rata-rata bergerak dari pesanan satu. Model seperti itu hanya memiliki dua koefisien, alpha dan beta, yang mewakili kelambatan pertama dari deret waktu itu sendiri dan istilah white noise yang mengejutkan. Model seperti ini diberikan oleh: Kita perlu menentukan koefisien sebelum simulasi. Mari kita ambil alpha 0.5 dan beta -0.5: Outputnya adalah sebagai berikut: Mari juga plot correlogram: Kita dapat melihat bahwa tidak ada autokorelasi yang signifikan, yang diharapkan dari model ARMA (1,1). Akhirnya, mari kita coba dan tentukan koefisien dan kesalahan standarnya dengan menggunakan fungsi arima: Kita dapat menghitung interval kepercayaan untuk setiap parameter dengan menggunakan kesalahan standar: Interval kepercayaan mengandung nilai parameter sebenarnya untuk kedua kasus tersebut, namun kita harus mencatat bahwa 95 interval kepercayaan sangat luas (konsekuensi dari kesalahan standar yang cukup besar). Mari sekarang coba model ARMA (2,2). Artinya, model AR (2) dikombinasikan dengan model MA (2). Kita perlu menentukan empat parameter untuk model ini: alpha1, alpha2, beta1 dan beta2. Mari kita ambil alpha1 0.5, alpha2-0.25 beta10.5 dan beta2-0.3: Output dari model ARMA (2,2) kami adalah sebagai berikut: Dan autocorelation yang sesuai: Sekarang kita dapat mencoba model ARMA (2,2) sesuai dengan Data: Kita juga dapat menghitung interval kepercayaan untuk setiap parameter: Perhatikan bahwa interval kepercayaan untuk koefisien untuk komponen rata-rata bergerak (beta1 dan beta2) sebenarnya tidak mengandung nilai parameter asli. Ini menguraikan bahaya mencoba menyesuaikan model dengan data, bahkan ketika kita mengetahui nilai parameter sebenarnya. Namun, untuk tujuan trading kita hanya perlu memiliki kekuatan prediksi yang melebihi kebetulan dan menghasilkan keuntungan yang cukup di atas biaya transaksi, agar menguntungkan Jangka panjang. Sekarang kita melihat beberapa contoh model ARMA yang disimulasikan, kita memerlukan mekanisme untuk memilih nilai p dan q saat menyesuaikan model dengan data keuangan riil. Memilih Model ARMA Terbaik (p, q) Untuk menentukan urutan p, q dari model ARMA yang sesuai untuk satu seri, kita perlu menggunakan AIC (atau BIC) pada subset nilai untuk p, q, dan Kemudian menerapkan uji Ljung-Box untuk menentukan apakah kecocokan yang baik telah tercapai, untuk nilai p tertentu, q. Untuk menunjukkan metode ini, kita akan mensimulasikan proses ARMA (p, q) pertama. Kita kemudian akan mengulang semua nilai berpasangan dari p dalam dan q dan menghitung AIC. Kita akan memilih model dengan AIC terendah dan kemudian menjalankan tes Ljung-Box pada residu untuk menentukan apakah kita telah mencapai kecocokan yang baik. Mari kita mulai dengan mensimulasikan seri ARMA (3,2): Kami sekarang akan membuat objek akhir untuk menyimpan model terbaik dan nilai AIC terendah. Kami mengulang kombinasi p, q dan menggunakan objek saat ini untuk menyimpan kecocokan model ARMA (i, j), untuk variabel perulangan i dan j. Jika AIC saat ini kurang dari AIC yang dihitung sebelumnya, kami menetapkan nilai akhir AIC ke nilai saat ini dan memilih pesanan tersebut. Setelah penghentian loop kita memiliki urutan model ARMA yang tersimpan di final. order dan ARIMA (p, d, q) sesuai dengan dirinya sendiri (dengan komponen d Integrated set to 0) yang disimpan sebagai final. arma: Mari output AIC , Koefisien order dan ARIMA: Kita dapat melihat bahwa orde awal dari model ARMA simulasi telah ditemukan, yaitu dengan p3 dan q2. Kita bisa merencanakan corelogram residu model untuk melihat apakah mereka terlihat seperti realisasi white noise diskrit (DWN): Corelogram memang terlihat seperti realisasi DWN. Akhirnya, kami melakukan uji Ljung-Box selama 20 lag untuk mengkonfirmasi ini: Perhatikan bahwa nilai p lebih besar dari 0,05, yang menyatakan bahwa residu independen pada tingkat 95 dan dengan demikian model ARMA (3,2) menyediakan Model yang bagus cocok Jelas hal ini seharusnya terjadi karena kita telah mensimulasikan data diri kita Namun, inilah prosedur yang akan kita gunakan saat kita menyesuaikan model ARMA (p, q) dengan indeks SampP500 pada bagian berikut. Data Keuangan Sekarang telah dijelaskan prosedur pemilihan model time series yang optimal untuk seri simulasi, agak mudah untuk menerapkannya pada data keuangan. Untuk contoh ini kita akan sekali lagi memilih Indeks Ekuitas AS Sampp500. Mari kita download harga penutupan harian menggunakan quantmod dan kemudian menciptakan arus kembali log: Mari kita melakukan prosedur pemasangan yang sama seperti seri simulasi ARMA (3,2) di atas pada seri pengembalian kembali SampP500 menggunakan AIC: Model pas terbaik Telah memesan ARMA (3,3): Mari plot residu model yang dipasang ke arus pengembalian harian SampP500 log: Perhatikan bahwa ada beberapa puncak yang signifikan, terutama pada kelambatan yang lebih tinggi. Ini menunjukkan kecocokan yang buruk. Mari kita melakukan uji Ljung-Box untuk mengetahui apakah kita memiliki bukti statistik untuk hal ini: Seperti yang kita duga, nilai p kurang dari 0,05 dan karena itu kita tidak dapat mengatakan bahwa residu adalah realisasi dari noise putih diskrit. Oleh karena itu ada tambahan autokorelasi pada residu yang tidak dijelaskan oleh model ARMA (3,3) yang dipasang. Langkah Selanjutnya Seperti yang telah kita bahas selama ini dalam seri artikel ini, kita telah melihat bukti adanya heteroskedastisitas bersyarat (volatility clustering) pada seri SampP500, terutama pada periode sekitar 2007-2008. Saat kita menggunakan model GARCH nanti di seri artikel kita akan melihat bagaimana cara menghilangkan autokorelasi ini. Dalam prakteknya, model ARMA tidak pernah umum cocok untuk pengembalian ekuitas log. Kita perlu mempertimbangkan heteroskedastisitas bersyarat dan menggunakan kombinasi ARIMA dan GARCH. Artikel berikutnya akan mempertimbangkan ARIMA dan menunjukkan bagaimana komponen Terpadu berbeda dari model ARMA yang telah kita pertimbangkan dalam artikel ini. Mulai dengan Trading Kuantitatif

No comments:

Post a Comment