از نظر تاریخی ، مدل های پیش بینی نرخ ارز عملکردهای ضعیف خارج از نمونه را به نمایش گذاشته و نسبت به مدل پیاده روی تصادفی پایین تر بودند. داده های پانل ماهانه از سال 1973 تا 2014 برای ده جفت ارز از کشورهای OECD برای تهیه نمونه های خارج از نمونه با شبکه های عصبی مصنوعی و مدل های XGBoost استفاده می شود. بیشتر رویکردها قدرت پیش بینی قابل توجهی و قابل توجهی را در پیش بینی های جهت نشان می دهند. علاوه بر این ، شواهد نشان می دهد که اطلاعات مربوط به زمان پیش بینی یک مؤلفه اصلی در عملکرد پیش بینی است.
1. مقدمه < Pan> پیش بینی نرخ ارز با روشهای پیشرفته یادگیری ماشین
از نظر تاریخی ، مدل های پیش بینی نرخ ارز عملکردهای ضعیف خارج از نمونه را به نمایش گذاشته و نسبت به مدل پیاده روی تصادفی پایین تر بودند. داده های پانل ماهانه از سال 1973 تا 2014 برای ده جفت ارز از کشورهای OECD برای تهیه نمونه های خارج از نمونه با شبکه های عصبی مصنوعی و مدل های XGBoost استفاده می شود. بیشتر رویکردها قدرت پیش بینی قابل توجهی و قابل توجهی را در پیش بینی های جهت نشان می دهند. علاوه بر این ، شواهد نشان می دهد که اطلاعات مربوط به زمان پیش بینی یک مؤلفه اصلی در عملکرد پیش بینی است.
1. مقدمه پیش بینی نرخ نرخ با روشهای پیشرفته یادگیری ماشین
از نظر تاریخی ، مدل های پیش بینی نرخ ارز عملکردهای ضعیف خارج از نمونه را به نمایش گذاشته و نسبت به مدل پیاده روی تصادفی پایین تر بودند. داده های پانل ماهانه از سال 1973 تا 2014 برای ده جفت ارز از کشورهای OECD برای تهیه نمونه های خارج از نمونه با شبکه های عصبی مصنوعی و مدل های XGBoost استفاده می شود. بیشتر رویکردها قدرت پیش بینی قابل توجهی و قابل توجهی را در پیش بینی های جهت نشان می دهند. علاوه بر این ، شواهد نشان می دهد که اطلاعات مربوط به زمان پیش بینی یک مؤلفه اصلی در عملکرد پیش بینی است.
1. مقدمه
یک معضل دیرینه در نظریه کلان اقتصادی ناتوانی در پیش بینی حرکات نرخ ارز با اصول اقتصادی است. چندین مدل پیش بینی نرخ ارز از فرضیات حاصل شده است که امروزه بخش اساسی برنامه درسی اقتصاد است. به عنوان مثال ، برابری علاقه کشف نشده (UIP) مبتنی بر برابری علاقه تحت پوشش تجربی و فرض بی طرفی ریسک است که هر دو به طور گسترده ای پذیرفته شده اند (نیلی و سارنو 2002). با این حال ، در حالی که بسیاری از مدلهای پیش بینی نرخ ارز از دیدگاه نظری به خوبی پایه گذاری شده اند ، برنامه های تجربی آنها اجراهای پیش بینی ضعیفی را به نمایش گذاشته اند. در بیشتر موارد ، یک پیش بینی پیاده روی تصادفی ساده (RW) از فکر خوب از طریق مدل ها بهتر است. احتمالاً برجسته ترین مدل های پیش بینی نرخ ارز ، مدل UIP فوق الذکر ، مدل برابری قدرت خرید (PPP) و مدل پولی (MM) است. آنها مبتنی بر تئوری های اقتصادی است که از فرضیات مختلف حاصل می شود. برای چندین دهه ، تأثیر کمی از اصول مورد استفاده در این مدل ها در حرکات نرخ ارز در کوتاه مدت یافت شده است ، اگرچه توضیحات نظری منطقی به نظر می رسد. این واقعیت که هیچ ارتباطی بین اصول و حرکات نرخ ارز نمی تواند با کمک مدلهای اقتصادی فوق الذکر نشان داده شود ، به معنای این نیست که هیچ رابطه ای به خودی خود وجود ندارد. به عنوان آمات و همکاران.(2018) خاطرنشان می کند ، یک عامل محدود کننده مهم این مدل ها شکل عملکردی آنها است. معادلات پیش بینی شامل ترکیبات خطی ساده از اصول است. به این ترتیب ، غیرخطی های بالقوه مورد غفلت قرار می گیرند. دلیل شکل خطی دقیق ، مشتقات نظری مدل ها است. در صورت استفاده از معادله مدل غیرخطی ، اصول می تواند تأثیر قابل توجهی و قابل توجهی در حرکت نرخ ارز داشته باشد. نویسندگان آمات و همکاران.(2018) از روشهای یادگیری ماشین ساده (ML) با اصول اقتصادی استفاده می کند تا آزمایش کند اگر این منجر به نتایج پیش بینی بهتر در مقایسه با تخمین های حداقل مربعات معمولی (OLS) شود. اگرچه رگرسیون خط الراس و مدلهای متوسط وزن به صورت تصاعدی عملکرد را در مقایسه با برآورد OLS بهبود می بخشد ، اما آنها همیشه نمی توانند پیش بینی RW را شکست دهند.
با تکیه بر تحقیقات آمات و همکاران.(2018) ، من استدلال می کنم که استفاده از مدل های پیچیده تر ML می تواند منجر به عملکرد بهتر پیش بینی شود زیرا آنها برای ضبط غیرخطی های بالقوه مناسب تر هستند. سوالی که با این امتحان به آن می پردازم ساده است:
آیا اصول از مدل PPP ، UIP یا MM بدون توجه به شکل عملکردی معادله تخمین ، قدرت پیش بینی شده با توجه به حرکات نرخ ارز را دارند؟
انعطاف پذیری مدل های ANN و XGBOOST باید به فرد اجازه دهد عملکردی را که از اطلاعات موجود در اصول اقتصادی سوء استفاده می کند ، تقریب دهد. بنابراین ، اگر اصول قدرت پیش بینی کننده داشته باشد ، این امر باید با عملکرد پیش بینی بالاتر نسبت به معیار RW مشهود باشد. سوال تحقیق را می توان با دو سؤال خاص زیر مشخص کرد:
آیا روشهای پیچیده ML با صندوق های اقتصادی می توانند پیش بینی های RW را در پیش بینی دیفرانسیل نرخ ارز ضرب و شتم کنند؟
آیا روشهای پیچیده ML با صندوق های اقتصادی می توانند پیش بینی های RW را در پیش بینی جهت حرکت نرخ ارز ضرب و شتم کنند؟
در اینجا ، روشهای پیچیده ML مدل های XGBOOST و ANN هستند و اصول اقتصادی از نظریه های PPP ، UIP و MM گرفته شده است. من نشان می دهم که هیچ مدل ML قادر به پیش بینی RW از دیفرانسیل نرخ ارز نیست و وقتی این کار را انجام دهند ، اثر نسبتاً کوچک است و اهمیت آماری تقریباً همیشه فاقد آن است. از طرف دیگر ، در پیش بینی جهت حرکات نرخ ارز ، هر دو روش ML از پیش بینی RW تقریباً در همه موارد با سطوح مختلف از اهمیت آماری استفاده می کنند. علاوه بر این ، ANN ها نتایج پیش بینی بهتری نسبت به مدل های XGBoost ارائه می دهند. علاوه بر این ، مزیت مدل های ML بر روی مدل RW کاملاً ناپدید می شود که آدمک های زمان از ویژگی های مرحله آموزش خارج می شوند. این نشان می دهد که اطلاعاتی که پیش بینی جهت مدلها برای نرخ ارز را انجام می دهد به تنهایی از اصول حاصل نمی شود ، بلکه تا حد زیادی به زمان پیش بینی بستگی دارد ، که توسط متغیرهای ساختگی زمان تعریف می شود. این استدلال با عملکرد خوب یک مدل جداگانه ANN پشتیبانی می شود که جهت حرکت نرخ ارز را با استفاده از فقط آدمک های زمانی به عنوان متغیرهای توضیحی پیش بینی می کند. با این حال ، مدلهای آموزش دیده با متغیرهای اساسی هنوز هم کمی بهتر عمل می کنند ، نشان می دهد که اصول ممکن است هنوز قدرت پیش بینی کننده داشته باشند اما به زمان پیش بینی وابسته هستند.
این مقاله به شرح زیر است: در بخش 2 ، من در مورد ادبیات مرتبط بحث می کنم. بخش 3 با توضیحات روش شناسی ، از جمله مدل های کلاسیک PPP ، UIP و MM ، که اصول اقتصادی موجود در قسمت تجربی این مطالعه ناشی از آن و همچنین روش های ML کاربردی Ann و XGBoost است ، دنبال می شود. در بخش 4 ، من مجموعه داده را شرح می دهم. بخش 5 با توضیحات نتایج ادامه می یابد و به دنبال آن بحث مختصری در مورد پیامدها انجام می شود. سرانجام ، نتیجه گیری نتیجه گرفته می شود.
2. ادبیات مرتبط < Pan> این مقاله به شرح زیر است: در بخش 2 ، من در مورد ادبیات مرتبط بحث می کنم. بخش 3 با توضیحات روش شناسی ، از جمله مدل های کلاسیک PPP ، UIP و MM ، که اصول اقتصادی موجود در قسمت تجربی این مطالعه ناشی از آن و همچنین روش های ML کاربردی Ann و XGBoost است ، دنبال می شود. در بخش 4 ، من مجموعه داده را شرح می دهم. بخش 5 با توضیحات نتایج ادامه می یابد و به دنبال آن بحث مختصری در مورد پیامدها انجام می شود. سرانجام ، نتیجه گیری نتیجه گرفته می شود.
2. مقاله مربوط به ادبیات به شرح زیر ساختار یافته است: در بخش 2 ، من در مورد ادبیات مرتبط بحث می کنم. بخش 3 با توضیحات روش شناسی ، از جمله مدل های کلاسیک PPP ، UIP و MM ، که اصول اقتصادی موجود در قسمت تجربی این مطالعه ناشی از آن و همچنین روش های ML کاربردی Ann و XGBoost است ، دنبال می شود. در بخش 4 ، من مجموعه داده را شرح می دهم. بخش 5 با توضیحات نتایج ادامه می یابد و به دنبال آن بحث مختصری در مورد پیامدها انجام می شود. سرانجام ، نتیجه گیری نتیجه گرفته می شود.
2. ادبیات مرتبط
مدلهای کلاسیک پیشبینی نرخ ارز اقتصادی مبتنی بر نظریههای PPP، UIP و MM هستند و موضوع مطالعات متعددی بودهاند. معروف ترین این مطالعات توسط میس و روگوف (1983) انجام شد که مشخصات مختلف مدل پولی را آزمایش کردند. آنها هر دو رویکرد قیمتی چسبنده و انعطافپذیر را در قالب مدلهای پولی Drenkel-Bilson، Dornbusch-Frenkel و Hopper-Morton شامل میشوند (Meese and Rogoff 1983). آنها جفت های مختلف کشور را شامل می شدند و افق پیش بینی در نظر گرفته شده را از یک تا دوازده ماه تغییر می دادند. با وجود رویکردهای مختلف، مدلهای آنها نتوانستند از معیار RW در پیشبینی نرخ ارز بهتر عمل کنند. نویسندگان Vitek (2005) این رویکرد را با مجموعه داده بزرگتر در زمان بعدی تکرار کردند و این یافته ها را تأیید کردند. در سال های اخیر، ادبیات شواهد متناقضی در مورد پیش بینی پذیری نرخ ارز با استفاده از مبانی MM پیدا کرده است. در مطالعهای که توسط مارک (1995) انجام شد، مدلی مبتنی بر مبانی MM توانست معیار RW را در پیشبینی تفاوتهای نرخ ارز در افق زمانی طولانی شکست دهد. از سوی دیگر، انگل و همکاران.(2017) دریافتند که مدل پولی آنها با استفاده از اصول قاعده تیلور نمی تواند به طور مداوم معیار RW را در کوتاه مدت در پیش بینی های خارج از نمونه (OOS) شکست دهد، حتی اگر ضرایب اصول در رگرسیون OLS آنها از نظر آماری معنی دار باشد. با توجه به اهمیت عوامل بنیادی UIP در پیش بینی نرخ ارز، آنها به بررسی تأثیر این عوامل بنیادی از جمله تورم پرداختند. آنها دریافتند که ضرایب تورم در بسیاری از موارد هنگام پیشبینی تفاوت نرخ ارز بسیار معنیدار است. با این حال، تفاوت نرخ بهره، که قرار است عامل توضیحی برای تغییرات نرخ ارز بر اساس تئوری کلاسیک UIP باشد، در بیشتر موارد از نظر آماری معنادار نیست (Engel et al. 2017). با توجه به مدل PPP، ادیسون و کلولند (1987) پیش بینی پذیری کوتاه مدت تفاوت های نرخ ارز را بررسی کردند. آنها از یک سری زمانی از سال 1874 تا 1971 برای دو کشور نروژ و بریتانیا استفاده کردند. آنها هیچ مدرکی مبنی بر تأثیر اصول PPP بر تفاوت نرخ ارز پیدا نکردند (ادیسون و کلولند 1987). در دال بیانکو و همکاران.(2012)، نویسندگان با استفاده از دادههای کوتاهمدت هفتگی و ماهانه، برازش نمونهای خوبی از مدلهای اقتصادسنجی مبتنی بر بنیادی خود با R 2 0. 8 پیدا کردند. با این حال، در مقایسه OOS، مدل آنها از مدل RW پایین تر است.
علاوه بر استفاده از مجموعه های مختلف اصول ، محققان همچنین از مدل های مختلف یادگیری ماشین برای بهبود پیش بینی های خود استفاده می کنند. نویسندگان Plakandaras و همکاران.(2015) طیف گسترده ای از مدل های یادگیری ماشین و ترکیب های مدل را برای پیش بینی حرکات نرخ ارز ، از مدل های ARIMA گرفته تا پشتیبانی از ماشین های بردار و ANN استفاده کنید. آنها با در نظر گرفتن انواع متغیرها ، از قیمت کالا و قیمت سهام تا نرخ بهره و تولید ناخالص داخلی ، از RW در پیش بینی نرخ ارز OOS بهتر عمل می کنند. با این حال ، آنها روی یک تئوری اقتصادی خاص تمرکز نمی کنند ، زیرا هدف آنها دستیابی به بهترین عملکرد OOS ممکن است (Plakandaras و همکاران 2015). در آمات و همکاران.(2018) ، نویسندگان از استراتژی متوسط وزن نمایی (EWA) با فاکتورهای تخفیف و رگرسیون ریج برای پیش بینی دیفرانسیل نرخ ارز و همچنین جهت حرکت نرخ ارز استفاده می کنند. آنها اصول را از مدل های کلاسیک PPP ، MM و UIP شامل می شوند. آنها پیش بینی های OOS مدل های خود را با مدل های معیار OLS و RW مقایسه می کنند. آنها نتایج خود را برای اهمیت آماری با استفاده از آمار Diebol d-Marano (DM) و P-Values آزمایش کردند. در بعضی موارد ، آنها به سختی مدل RW را شکستند. غالباً تفاوت کمتر از یک درصد RMSE برای جفت های مختلف کشور است. پیش بینی های جهت دار آنها نشان می دهد که مدل EWA بهترین عملکرد را دارد ، اما رگرسیون OLS همچنین می تواند جهت حرکت نرخ ارز بیش از 50 درصد از زمان را برای اکثر جفت های ارز پیش بینی کند (آمات و همکاران 2018).
نویسندگان باجاری و همکاران.(2015) مدل های یادگیری ماشین مشترک را با مدل های اقتصادسنجی کلاسیک برای پیش بینی تقاضا مقایسه کنید. آنها از رگرسیون های خطی و لجستیک به عنوان مدل های اقتصاد سنجی استفاده می کنند ، که آنها را با جنگل های تصادفی و دستگاه های بردار پشتیبانی و همچنین سایر مدل های یادگیری ماشین مقایسه می کنند. با استفاده از شبیه سازی مونت کارلو ، آنها نشان می دهند که ترکیب مدل با رگرسیون خطی ، قدرت پیش بینی OOS را بهبود می بخشد. با استفاده از داده های پیش بینی تقاضای واقعی ، آنها نشان می دهند که مدل های ML به طور مداوم پیش بینی های OOS بهتری نسبت به همتایان اقتصاد سنجی خود ارائه می دهند ، نشان می دهد که چرا مدل های یادگیری ماشین باید در تنظیمات سنتی اقتصاد سنجی در نظر گرفته شوند.
قریشی و همکاران از یک مدل یادگیری ماشین پیچیدهتر برای پیشبینی اقتصادی استفاده میکنند.(2020). آنها از مدل دو مرحله ای XGBoost برای پیش بینی های تولید ناخالص داخلی کانادا استفاده می کنند. در مرحله اول، متغیرها را بر اساس اهمیت مدل XGBoost خود انتخاب می کنند و در مرحله دوم با استفاده از یک مدل XGBoost جداگانه آموزش دیده بر روی متغیرهای انتخاب شده، پیش بینی می کنند. نتایج آنها نشان میدهد که مدلهای XGBoost میتوانند به عملکرد پیشبینیکننده خوبی برای پیشبینیهای نرخ رشد ماهانه منجر شوند، همانطور که توسط عملکرد پیشبینی OOS نشان داده شده است (قریشی و همکاران 2020).
3. روش شناسی
مبانی مورد استفاده در این تحقیق از نظریه های UIP، PPP و MM می آید. علاوه بر این، من رویکرد "همه اصول" (AF) را که مجموعه ترکیبی اصول از هر سه مدل است را شامل میشود. توصیف مدلها به هیچ وجه جامع نیستند و در عوض قصد دارند ایدهای درباره اینکه شکل خطی معادلات پیشبینی مدلهای کلاسیک از کجا میآیند و اصول اولیه چگونه انتخاب میشوند، ارائه دهند.
3. 1. مدل برابری نرخ بهره کشف نشده (UIP).
مدل پیشبینی نرخ ارز UIP بر اساس شرایط UIP است. UIP از برابری نرخ بهره تحت پوشش (CIP) و فرض بی طرفی ریسک مشتق شده است. CIP بیان میکند که سرمایهگذاران نمیتوانند از تفاوتهای نرخ بهره دو کشور با استفاده از قراردادهای آتی استفاده کنند و با معادله (1) زیر بیان میشود.
که در آن F t قیمت یک قرارداد آتی در نرخ ارز St + 1 در زمان t + 1 است. S t نرخ مبادله در زمان t است که با واحد پول کشور داخلی نشان داده می شود. r d و r f به ترتیب نرخ های بهره داخلی و خارجی دارایی های قابل مقایسه با سررسید برابر هستند. تبدیل رابطه (2) با اعمال لگاریتم طبیعی و با فرض مقادیر کوچک برای r d و r f، معادله زیر را به دست میدهد (معادله (2)):
که در آن نرخ فوروارد با ft = l o g ( F t ) و نرخ نقطه با s t = l o g ( S t ) تعریف می شود .
نرخ آتی f t را می توان به صورت ترکیبی از سرمایه گذاران، انتظارات نرخ لحظه ای و ریسک مربوط به نگهداری یک دارایی داخلی نسبت به ریسک مرتبط با نگهداری دارایی خارجی، که با حق بیمه ریسک ρt بیان می شود، نشان داد. بنابراین، نرخ فوروارد f t را می توان با رابطه (3) توصیف کرد:
ترکیب معادلات (2) و (3) معادله (4) را به دست میدهد، که تغییر در نرخ نقطهای مورد انتظار Δ s t e را به تفاوت نرخ بهره در t (rd, t-rf, t) و حق بیمه ρt مرتبط میکند:
هنگامی که بی طرفی ریسک سرمایه گذار فرض شود ، حق بیمه خطر خنثی می شود (ρ t = 0) ، که منجر به UIP می شود ، که توسط معادله (5) شرح داده شده است:
بنابراین ، تفاوت نرخ بهره بین کشورهای مرتبط فرض می شود که تغییر نرخ ارز ارزهای آنها را توضیح می دهد. از این رو ، متغیرهای توضیحی که برای مدلهای بعدی در نظر گرفته شده است ، نرخ بهره دوره فعلی هر دو کشور برای دارایی های قابل مقایسه با همان بلوغ است (مریدیت و چین 1998).
3. 2خرید مدل برابری قدرت (PPP)
یک روش جایگزین برای توضیح حرکت نرخ ارز در نظریه PPP نهفته است. طبق نظریه PPP ، کالاها جایگزین های قابل معامله در سطح بین المللی هستند. غفلت از رفتار معاملاتی پیچیده ، به عنوان مثال ، به دلیل تفاوت در ترجیحات و سلیقه ها ، نظریه PPP همگن کالا را فرض می کند و به آنها اجازه می دهد تا به راحتی بین کشورها قابل معامله باشند. برابری قدرت خرید با معادله زیر تعریف می شود (معادله (6)):
جایی که P D ، T و P F ، T به ترتیب لگاریتم های طبیعی سطح قیمت در کشور داخلی و خارجی هستند. با توجه به شرایط عدم وجود آربیتراژ در بازارهای کالاهای فرض شده در نظریه PPP ، نرخ ارز مورد انتظار در T + 1 توسط معادله (7) داده می شود:
بنابراین ، تنها متغیرهایی که هنگام پیش بینی حرکات نرخ ارز در نظر گرفته می شود ، سطح قیمت کشورهای مربوطه است که اغلب به عنوان شاخص قیمت مصرف کننده (CPI) گزارش شده است (Juselius 1995).
3. 3مدل پولی (MM)
با توجه به مدل MM ، انواع مختلفی وجود دارد که به عنوان مثال ، بین قیمت های سفت و انعطاف پذیر ، مانند مدل Dornbusc h-Frankel (قیمت های سفت و سخت) و مدل Frenke l-Bilson (قیمت های انعطاف پذیر) (Meese and Rogoff 1983) متمایز می شود. معاینه از رویکرد پیش بینی آمات و همکاران پیروی می کند.(2018) ، که مبتنی بر مدل قیمت انعطاف پذیر Frenke l-Bilson است. آنها رابطه بین درآمد و عرضه پول را به عنوان معادله خطی زیر الگوبرداری می کنند ، معادله (8):
در جایی که M ، T و M F ، T به ترتیب سطح ورود به سیستم پول کشورهای داخلی و خارجی را نشان می دهد ، در حالی که Y D ، T و Y F ، T نشان دهنده درآمد ورود به سیستم آنها است. برای برآورد اختلاف نرخ ارز ، تفاوت بین دو دوره متوالی منجر به معادله (9) می شود:
در جایی که δ نشان می دهد که متغیر متصل ، دیفرانسیل زمان بین دوره مشخص شده و دوره قبلی متغیر مرتبط (به عنوان مثال ، Δ x = x t - x t - 1) است (آمات و همکاران 2018).
3. 4شبکه های عصبی مصنوعی (ANN)
تمام مدلهای پیش بینی کلان اقتصادی کلاسیک که تاکنون شرح داده شده است ، رابطه خطی بین اصول و دیفرانسیل نرخ ارز یا جهت های حرکت را فرض می کنند. دلیل فرض خطی بودن در این مدلها از مشتقات نظری مدل ها ناشی می شود. با این وجود ، اگر فرم عملکردی واقعی غیرخطی باشد ، محدودیت به یک شکل خطی ممکن است مانع باشد. Perceptrons چند لایه به عنوان تقریبی جهانی شناخته شده است. با توجه به قضیه تقریبی جهانی ، یک مدل Perceptron چند لایه می تواند هر عملکرد مداوم بین دو فضای اقلیدسی را تقریبی کند. دلیل انعطاف پذیری ANNS پیچیدگی بالای مدل به دلیل تعداد زیاد پارامترها و همچنین استفاده از توابع فعال سازی است که مسئول ویژگی غیرخطی تقریبی هستند (هورنیک 1991). توضیحی دقیق و گسترده در مورد عملکرد شبکه های عصبی را می توان در Goodfellow و همکاران یافت.(2016). در مطالعه من ، من از Perceptron چند لایه با دو لایه پنهان استفاده می کنم. اولین لایه پنهان شامل 1000 نورون مصنوعی ، دوم از 500 است. معادله مدل این شبکه در معادله (10) در زیر نشان داده شده است. بگذارید x t بردار ورودی ها را به شبکه در زمان t نشان دهد. این بردار از ارزشهای اصول اقتصادی P در زمان t تشکیل شده است. برای مدلهای رگرسیون ، پیش بینی Δ y t + 1 ^ (جایی که Δ y t + 1 = y t + 1 - y t) از مدل در زمان t به شرح زیر محاسبه می شود:
در حالی که برای مدل های طبقه بندی ، احتمال پیش بینی شده P (z t + 1 = 1 | x t) ^ مدل در زمان t به شرح زیر محاسبه می شود:< 1 , 2 , 3 >P (z t + 1 = 1 | x t) ^ = ϕ o u t p u t (w 3 ′ ϕ h i d d e n 2 (w 2 ′ ϕ h i d d e n 1 (w 1 ′ x t + b 1) + b 2) + b 3)
جایی که ϕ H i d d e n 1 ، ϕ h i d d e n 2 و ϕ o u t p u t توابع فعال سازی اول ، لایه های پنهان دوم و همچنین لایه خروجی هستند. پیش بینی Δ y t + 1 ^ دیفرانسیل نرخ ارز پیش بینی شده است. پیش بینی P (z t + 1 = 1 | x t) ^ احتمال پیش بینی شده از دیفرانسیل نرخ ارز مثبت است. z t + 1 یک متغیر پاسخ باینری است ، که به شرح زیر تعریف شده است
W 1 ، W 2 و W 1 ماتریس با اندازه متفاوت از لایه پنهان اول و دوم و همچنین لایه خروجی هستند. B 1 ، B 2 و B 3 اصطلاحات تعصب مقیاس را نشان می دهد ، که در لایه های پنهان اول و دوم و همچنین لایه خروجی اضافه می شوند. برای توابع فعال سازی ϕ H i d d e n 1 و ϕ h i d d e n 2 من عملکرد RELU را انتخاب کردم ، همانطور که در معادله (14) در زیر آمده است.
برای طبقه بندی باینری مدل های MLP ، که پیش بینی جهت تغییر حرکات نرخ ارز ، یک تابع فعال سازی سیگموئید ، ارائه شده در معادله (14) ، به عنوان تابع فعال سازی نورون Oput ϕ o u t p u t استفاده می شود. برای رگرسیون های بعدی ، هیچ تابع فعال سازی ϕ o u t p u t اعمال نمی شود.
مدل MLP متناسب با یک مجموعه داده آموزشی است که شامل 75 ٪ از داده های در نظر گرفته شده است. به عنوان عملکرد عینی برای رگرسیون ، من عملکرد از دست دادن باقیمانده های مربع (SSR) را انتخاب کردم.
l o s b c e (x) = - 1 n ∑ t = 1 t z t · l o g (p (z t + 1 = 1 | x t) ^) + (1 - z t) · l o g (1 - p (z t + 1 = 1 |x t)) ^
عملکرد از دست دادن با استفاده از الگوریتم backpropagation به حداقل می رسد. الگوریتم backpropagation شیب عملکرد از دست دادن را از نظر وزنهای موجود در شبکه محاسبه می کند.
و وزنه ها را به روز کنید. Backpropagation از قانون زنجیره ای برای محاسبه شیب و الگوریتم نزول شیب استفاده می کند تا تغییرات وزن لازم را در شبکه اعمال کند. نزول شیب قبل از تفریق آنها از ماتریس های وزن در شبکه ها ، شیب را با توجه به میزان یادگیری کاهش می دهد ، همانطور که در معادله (17) در زیر نشان داده شده است (Goodfellow و همکاران 2016).
در اینجا ، α نشانگر نرخ یادگیری است. من مقدار α را انتخاب کردم که بیشترین کاهش در از دست دادن را ایجاد می کند. علاوه بر این ، من از نسخه دقیق الگوریتم نزول شیب که در بالا توضیح داده شد ، استفاده نکردم ، اما الگوریتم بهینه سازی پیشرفته تر آدام ، که الگوریتم های نزول شیب را با استفاده از اصطلاحات حرکت گسترش می دهد ، همانطور که توسط Kingma و BA (2015) شرح داده شده است. من از تمرینات Mini-Batch استفاده می کنم ، که وزنه ها را بعد از هر مینی دسته به روز می کند (Goodfellow و همکاران 2016). پس از تکرار مجموعه آموزش ، یک دوره به پایان رسید. من حداکثر اندازه دوره را به 1000 تنظیم کردم. با این حال ، این تعداد از دوره ها هرگز نرسیده بود ، زیرا من در اوایل به عنوان پاسخ به تماس عمل کردم. هر زمان که یک معیار بهبود از پیش تعریف شده دیگر پر شود ، روند آموزش را قطع می کند. در معاینه من ، اوایل تمرین آموزش یک مدل را قطع کرد ، هر زمان که خطای اعتبار سنجی با حاشیه 0. 0001 در طی 100 دوره گذشته بهبود نیاورد. تنظیم این حاشیه یک فرآیند ظریف است ، زیرا تنظیم بیش از حد آن می تواند منجر به زیربنایی شود ، یعنی این مدل به اندازه کافی داده های آموزش را از نزدیک متناسب نمی کند و بنابراین قدرت پیش بینی بالقوه را از دست می دهد. از طرف دیگر ، تنظیم آن ممکن است منجر به زمان غیر ضروری Traninig بدون بهبود شود (یائو و همکاران 2007). برای جلوگیری از بیش از حد ، من ترکیبی از روش تنظیم را پیاده سازی می کنم. ترک تحصیل با از بین بردن نورون ها در طی فرایند آموزش ، از سازگاری بیش از حد ، تنظیم بیش از حد مدل به اصطلاحات داده های آموزشی جلوگیری می کند (Srivastava و همکاران 2014). من قطره ای را برای هر دو لایه پنهان با احتمال مربوط به p = 0. 5 برای هر گره در هر پاس در طول آموزش قرار می دهم.
3. 5تقویت شیب شدید (XGBOOST)
XGBOOST مخفف تقویت شیب شدید است و بسته ای است که توسط چن و گسترین (2016) برای کاربرد آسان و تنظیم تقویت شیب با روشهای منظم در مدل های خطی و مدل های سبد (طبقه بندی و درختان رگرسیون) تهیه شده است. برای مطالعات تجربی من ، از درختان طبقه بندی و رگرسیون به عنوان زبان آموزان ضعیف برای مدل های XGBoost استفاده می کنم. XGBOOST و همچنین سایر روش های تقویت شیب ، نتایج پیشرفته ای را در دامنه های مختلف برای هر دو طبقه بندی و رگرسیون ارائه داده اند. به طور کلی ، تقویت شیب یک روش گروهی است که پیش بینی های وزنی چندین زبان آموز ضعیف ، در این حالت مدل های درختی را در یک مدل پیش بینی برتر ترکیب می کند. در فرآیند آموزش ، مدل XGBoost توسط زبان آموزان ضعیف متوالی در نمونه های بوت استرپ ساخته شده است. با این حال ، به جای قرار دادن آنها در متغیر هدف ، هدف این است که شبه بازرسی مدل فراگیران ضعیف را که قبلاً متناسب است ، کاهش دهد. بنابراین ، زبان آموزان ضعیف پی در پی در باقیمانده های زبان آموزان ضعیف قبلاً متناسب هستند. با افزودن پیش بینی های زبان آموزان ضعیف ، خطای پیش بینی به حداقل می رسد. هنگامی که ، خطا را نمی توان به طور مؤثر توسط زبان آموزان ضعیف اضافی کاهش داد ، مدل افزودنی نهایی به شکل معادله (18) برای رگرسیون و معادله (19) برای طبقه بندی می شود (چن و گستین 2016).
جایی که F K R و F K C به ترتیب مدل های درخت رگرسیون و طبقه بندی را نشان می دهند ، و K تعداد زبان آموزان ضعیف موجود در مدل نهایی است. مانند مدل MLP ، مدل افزودنی نیز با به حداقل رساندن یک عملکرد از دست رفته از پیش تعریف شده تعبیه شده است. بر خلاف قبل ، عملکرد ضرر شامل یک مجازات برای تنظیم مجدد است ، همانطور که توسط معادله (20) برای رگرسیون و (21) برای طبقه بندی نشان داده شده است.
l o s s r (Δ y t + 1 ^ ، Δ y t + 1) = ∑ t = 1 t κ (Δ y t + 1 ^ ، Δ y t + 1) + ∑ k = 1 k ω (f k)
l o s s c (p (z t + 1 = 1 | x t) ^ ، z t + 1) = ∑ t = 1 t κ (p (z t + 1 = 1 | x t) ^ ، z t + 1) + ∑ k = 1 k ω(F K)
در اینجا ، m تعداد برگهای موجود در یک سبد سبد یادگیرنده ضعیف را نشان می دهد و ∥ W ∥ 2 نشان می دهد L 2-norm از وزنهای W وصل شده با هر مرخصی در یک درخت. از آنجا که M و W پیچیدگی یک درخت را تعریف می کنند ، اصطلاح ω (F K) هم پیچیدگی درخت و هم وزن های غیر ضروری بزرگ را در عملکرد از دست دادن مجازات می کند. توضیحات مفصلی را می توان در چن و گسترین (2016) یافت.
4. داده ها
این مجموعه داده شامل اصول و نرخ ارز از سال 1973-2014 برای 10 جفت کشور مختلف است. اصول این معاینه از نظریه های فوق الذکر UIP ، PPP و MM و همچنین یک رویکرد AF ناشی می شود. نرخ ارز نسبت به دلار دلار بیان شده و در پایان ماه ثبت شده است. مجموعه داده توسط Amat و همکاران ارائه شده است.(2018) و در وب سایت آنها موجود است ، که من برای کسب اطلاعات بیشتر در مورد مجموعه داده ها به آن اشاره می کنم. داده ها در ابتدا از DataStream ، OECD و وب سایت فدرال رزرو (Amat و همکاران 2020) تهیه شده اند.
هنگام آموزش مدل های یادگیری ماشین پیچیده ، لازم است که الگوریتم بسیاری از مشاهدات را برای دستیابی به یک سطح قابل قبول از سازگاری بدون استفاده بیش از حد ارائه دهید. به همین دلیل ، من تصمیم گرفتم که الگوریتم ها را با استفاده از داده های ترکیبی از همه ارزها آموزش دهم ، اما پیش بینی OOS را برای هر جفت ارز به طور جداگانه انجام دهم. همه متغیرها با حداکثر مقیاس بندی مطلق مقیاس می شوند. برای تمایز بین کشورها ، شناسه های جفت ارز را با متغیرهای ساختگی رمزگذاری کردم. همچنین شامل آدمک های زمانی برای ماه ها و سالها است.
برای هر جفت کشور ، مجموعه داده ها به یک مجموعه آموزشی (در نمونه) که شامل 67 ٪ اول دوره های موجود و یک مجموعه اعتبار سنجی (خارج از نمونه) متشکل از 33 ٪ باقی مانده از دوره ها است ، تقسیم می شود.
با این رویکرد ، من هدف تعیین شده توسط Amat و همکاران را دنبال می کنم.(2018). هدف این نیست که دقیق ترین پیش بینی های دیفرانسیل نرخ ارز یا جهت های حرکت را ارائه دهیم. در عوض ، هدف این است که بررسی کنیم که آیا اصول از مدلهای اقتصادی فوق الذکر قدرت پیش بینی کننده در مورد دیفرانسیل نرخ ارز یا جهت های حرکت دارند.
5- نتایج
Hyperparameters برای مدل های ANN و همچنین XBOOST با توجه به کاهش همراه در از دست دادن OOS ، به صورت متوالی انتخاب می شوند. نتایج امتحانات در جدول 1 ، جدول 2 ، جدول 3 ، جدول 4 و جدول 5 ثبت شده است. هر جدول شامل معیارهای به دست آمده از پیش بینی های OOS ، یعنی آمار Diebol d-Mariano (DM) ، DM P-Values و Theil است. نسبت های رگرسیون و همچنین آمار DM ، DM P-Values و نرخ خطا برای طبقه بندی ، برای هر یک از 10 جفت ارز ، یک بار با و یک بار بدون آدمک های زمان.
جدول 1 شامل نتایج مربوط به رگرسیون با تمام مجموعه های بنیادی با استفاده از XGBoost است. قابل توجه است که در هیچ موردی نسبت Theil کمتر از 1 نیست، که نشان می دهد همه مدل های مرتبط تفاوت نرخ ارز OOS را بدتر از پیش بینی های RW پیش بینی می کنند. علاوه بر این، در بسیاری از موارد پیشبینی RW به طور قابلتوجهی بهتر از مدل XGBoost مرتبط است. این مورد زمانی است که نسبت Theil بالاتر از 1 باشد و آزمون DM و p-value به طور همزمان اهمیت آماری را نشان میدهند. در اینجا، مقادیر p برای اکثر کشورها و برای همه مجموعههای بنیادی، اهمیت آماری را حداقل در سطح 10 درصد، گاهی اوقات حتی در سطح 1 درصد، نشان میدهد. با استفاده از الگوریتم XGBoost، من نمیتوانم شواهدی مبنی بر اینکه مبانی اقتصادی پیشبینی تفاوتهای نرخ ارز را بهبود میبخشد، بیابم.
متناوباً، جدول 2 نتایج را برای رگرسیونها با استفاده از شبکههای عصبی مصنوعی با تمام مجموعهای از اصول، یک بار شامل و یک بار بدون احتساب ساختگیهای زمانی نشان میدهد. برخلاف نتایج قابل مقایسه با استفاده از XGBoost در جدول 1، نسبت Theil اکنون به یک نزدیکتر است. در حدود نیمی از موارد، آنها حتی کمی زیر یک هستند. با این حال، این تفاوت همیشه بسیار کم است و در بیشتر موارد از نظر آماری معنی دار نیست. تفاوت معناداری بین پیشبینیهای ایجاد شده توسط مجموعههای مختلف اصول اقتصادی و بین رویکردهایی که شامل ساختگیهای زمانی هستند یا آنها را حذف میکنند، وجود ندارد. اگرچه به نظر میرسد که ANNها نسبت به مدلهای XGBoost با دادهها سازگاری بهتری دارند، همانطور که نسبت Theil پایینتر نشان میدهد، این به پیشبینیهای قابل توجهی بهتر منجر نمیشود. بنابراین، استنباط اثر کلی عوامل بنیادی بر تفاوت های نرخ ارز به اهمیت لازم منجر نمی شود. بنابراین، هیچ مدرکی برای حمایت از این ادعا وجود ندارد که مبانی اقتصادی قدرت پیشبینی بر تفاوتهای نرخ ارز دارند.