StochRSI
کمک می کند که تغییرات RSI به صورت شفاف قابل رؤیت باشد
TRIX
یک میانگین متحرک از قیمتی که سه بار نرم (smooth) شده است
TSI
اندیکاتوری برای اندازه گیری جهت تغییرات قیمت سهام و خرید و فروش بیش از اندازه
Ulcer Index
اندیکاتوری برای اندازه گیری نوسانات و ریسک بازار
Ultimate Oscillator
این اندیکاتور میانگین های متحرک کوتاه مدت، میان مدت و بلند مدت را با یکدیگر ترکیب می کند
Vortex Indicator
اندیکاتوری برای تشخیص روندهای جدید و نقاط خرید و فروش بیش از اندازه
Williams %R
با بهره گرفتن از احتمالات، نقاط خرید و فروش بیش از اندازه را اندازه می گیرد
DPO
اسیلاتور قیمتی که با حذف روند، چرخه ها را پیش بینی می کند
بنابراین، در این مرحله اندیکاتورهای تکنیکی برای پیش بینی قیمت سهم با بهره گرفتن از اطلاعات قیمتی سهم شامل قیمت بالا، پایین، بسته شدن و اطلاعات حجمی شامل حجم معاملات ساخته می شوند.
۳-۳-۲-۲- داده کاوی سری های زمانی
همانگونه که گفته شد، اطلاعات دیگری که برای پیش بینی باید به پایگاه داده اضافه گردند شامل سری های زمانی مشابه سری زمانی در دست بررسی می باشند. برای شناسایی شبیه ترین سری ها به سری قیمت های سهم مورد نظر، از داده کاوی سری های زمانی استفاده می گردد. برای داده کاوی سری های زمانی روش های زیادی موجود هستند، در این پژوهش به دلیل حجیم بودن داده ها از روش Cross-Correlation استفاده می گردد. این روش که از روش های تأخیر زمانی[۲۴۰] می باشد، سری های زمانی را دو به دو بررسی می کند؛ در هر بررسی تمام lagهای ممکن بین دو سری زمانی نیز بررسی می شود. برای مثال سری زمانی x(t) و سری زمانی y(t) با یکدیگر مقایسه می شوند. سپس سری زمانی x(t) با سری زمانی y(t-h) بررسی شده، سپس x(t) با y(t-h+1) مقایسه شده و این روند ادامه می یابد تا x(t) با y(t+h) مقایسه می گردد. در این میان بهترین نتیجه انتخاب شده و از آن سری زمانی با آن lag برای پیش بینی استفاده می گردد.
در واقع، در هر بار بررسی دو سری زمانی با یک lag مشخص، correlation میان دو سری مشخص شده و در نهایت پس از مقایسه دو سری در تمام lagها، بهترین correlation مشخص می شود. فرمول زیر نشان دهنده چگونگی محاسبه همبستگی دو سری زمانی x و y را با m، lag برای سری y می باشد :
رابطه ۳-۳
در این مرحله، سری زمانی قیمت هر سهم در هر صنعت با تمام سری های زمانی قیمتی سهام دیگر آن صنعت مقایسه شده و بهترین lag به عنوان یکی از ورودی های احتمالی برای پیش بینی انتخاب می گردد. فلسفه کار داده کاوی سری های زمانی به این صورت است که دو سری زمانی ممکن است در حالت عادی شبیه هم نباشند، اما با در نظر گرفتن lagهای ممکن بین این دو سری، شاید بتوان شباهتی پیدا کرد. شکل ۳-۱ این موضوع را در قالب نموداری نشان داده است :
شکل ۳-۱ : شباهت سری های سفید و سیاه با در نظر گرفتن lag
همانگونه که واضح است، دو سری سفید و سیاه رنگ در حالت عادی شباهت کمی به هم دارند اما در صورتی که سری سیاه را با lag در نظر گرفته و داده های سری سفید را با داده های قبلی سری سیاه مقایسه کنیم، شباهت زیادی پیدا می شود. لذا با دانستن مقادیر سری سیاه، می توان مقادیر سفید را برای آینده پیش بینی کرد.
در این پژوهش نیز، با پیدا کردن سری های زمانی مشابه، می توان از روی تغییرات فعلی یا تغییرات گذشته یک سری زمانی، تغییرات آینده آن را پیش بینی کرد. در این مرحله، برای تمام سری های زمانی موجود در هر صنعت، داده کاوی سری زمانی انجام شده و lag بهینه برای وارد شدن به مدل برای هر یک انتخاب می شود.
۳-۳-۲-۳- کاهش سطری در رکوردهای جدید
پس از اضافه شدن اندیکاتورها و سری های زمانی مشابه، لازم است بار دیگر کاهش سطری برای حذف داده های پرت و داده های مغشوش طبق متد ارائه شده در بخش قبل انجام گردد. دلیل این امر این است که بسیاری از اندیکاتورها از چندین داده قبلی برای دوره فعلی ساخته می شوند و لذا مقادیر NaN در ابتدا و انتهای داده ها اضافه می گردد. همچنین سری های جدید نیز در چهار فیلد قیمت های بالا، پایین و بسته شدن و حجم مبادلات قرار دارند که ممکن است طبق قوانین سه گانه تدوین شده در قسمت قبل، داده مغشوش به حساب آمده و نیاز باشد که حذف شوند.
۳-۳-۳- انتخاب داده ها و کاهش ستونی
پس از طی شدن مراحل قبل، پایگاه داده شامل اطلاعات قیمتی و حجمی سهم مورد نظر، اطلاعات حجمی و قیمتی سهام حاضر در صنعت مورد نظر با در نظر گرفتن lag بهینه و اندیکاتورهای تکنیکی می باشد. از آنجا که این حجم از داده ها برای ورود به شبکه عصبی بسیار زیاد هستند، باید از میان اندیکاتورها و سهام حاضر در صنعت مربوطه تعداد محدودی را انتخاب کرد و این کار با مراحل زیر صورت می پذیرد