
เคยได้ยินคำกล่าวที่ว่า “The more, the merrier“ ที่แปลว่า “ยิ่งคนเยอะ ยิ่งสนุก หรือ ยิ่งดี” ที่มักถูกใช้กันบ่อยๆ ในภาพยนต์ฝรั่ง เวลามีเพื่อนจัดปาร์ตี้ แล้วมีคนอนุญาติเจ้าภาพขอพาเพื่อนมาเพิ่ม เจ้าภาพส่วนใหญ่ก็จะบอกว่า Of course, the more, the merrier … ได้แน่นอน ยิ่งคนเยอะยิ่งสนุก!! วันนี้เราจะพาไปดูกันว่า เจ้าสถานการณ์ยิ่งเยอะยิ่งดี หรือ ยิ่งเยอะยิ่งเจ๋ง จะให้กับจำนวน Machine Learning ่ที่ใช้ในการทำนายในระบบเทรดได้หรือไม่? ผ่านการทดลองง่ายๆกันค่ะ
ก่อนอื่นมาดูอัลกอริทึ่ม Machine Learning ที่จะใช้กันก่อน ในที่นี้เราจะเลือกอัลกอริทึ่มที่ไม่ซับซ้อน เพื่อที่เราจะได้เห็นประสิทธิภาพของการเพิ่มจำนวน “ตัวทำนาย” ให้ชัดๆ ไม่โดนประสิทธิภาพและความซับซ้อนของอัลกอริทึ่มเข้ามาทำให้ไขว้เขว

ชนิดของ Machine Learning อัลกอริทึ่มมีจำนวนมาก ถึงขนาดที่ว่าถ้าจะให้ลิสส์ออกมาก็อาจจะไม่สามารถลิสส์ออกมาให้ครบถ้วนได้ ดังนั้น ในที่นี้ เราจะทำการเลือก Machine Learning ออกมา 6 ตัว โดยจะเน้นโมเดลที่ทำงานไม่ซับซ้อน ใช้เวลา และทรัพยากรในการประมวลผลไม่สูงมากและ ML แต่ละชนิดนั้นสามารถทำงานได้ดีสำหรับชนิดข้อมูลจำเพาะที่แตกต่างกัน ดังนี้
- Polynomial Regression
- Linear Regression
- Support Vector Regression (rbf kernel)
- Support Vector Regression (linear kernel)
- Support Vector Regression (polynomial kernel)
- Random Forest
ขั้นตอนการทดลอง
ในส่วนของการทดลองเราจะเริ่มกันที่ผลการทดลองที่ใช้อัลกอริทึ่มเพียง 1 ชนิด คือ Polynomial Regression ก่อน แล้วจึงจะทำการเพิ่มจำนวนอัลกอริทึ่มทีละ 1 เพื่อทดสอบผลลัพธ์
ขั้นตอนที่ 1 การเตรียมข้อมูล (Data preparation)
ขั้นตอนแรก คือ การโหลดข้อมูลราคาหุ้นรายวันที่ประกอบด้วย ราคาเปิด (Open) ราคาสูงสุด (High) ราคาต่ำสุด (Low) และ ราคาปิด (Close) เมื่อได้ข้อมูลในรูปแบบที่ถูกต้อง ต่อมาจะทำการทำความสะอาดข้อมูล (Data Cleaning) โดยการแทนที่ค่าที่หายไปด้วยค่าเฉลี่ยแบบเคลื่อนที่ (Moving Average) ต่อมาข้อมูลที่ผ่านการทำความสะอาดจะถูกแบ่งออกเป็น 2 ส่วน คือ ชุดข้อมูลสอน (Training) และ ชุดข้อมูลทดสอบ (Testing) ในที่นี้ชุดข้อมูลสอนจะอยู่ระหว่างปี 2000 ถึง 2012 และชุดข้อมูลทดสอบ จะเริ่มตั้งแต่ปี 2013 ไปจนจบปี 2014 ต่อมาชุดข้อมูลทดสอบจะถูกนำไปคำนวนฟีเจอร์สำหรับการแบ่งกลุ่ม (Clustering Features) คือ ค่าเฉลี่ย (Mean) และ ค่าเบี่ยงเบนมาตรฐาน (Standard Deviation) ของค่ากำไรในรูปแบบลอการิทึม (Logarithm Return) 5 วันย้อนหลัง
ขั้นตอนที่ 2 การแบ่งกลุ่มข้อมูล (Clustering)
นำข้อชุดมูลสอน (Training set) มาทำการแบ่งกลุ่มโดยอาศัยขั้นตอนวิธี K-mean clustering ในที่นี้ เราจะทำการแบ่งกลุ่มข้อมูลสอนออกด้วยฟีเจอร์ที่คำนวณไว้ในขั้นตอนที่ 1 คือ ค่าเบี่ยงเบนมาตรฐาน (Standard Deviation) ของค่ากำไรในรูปแบบลอการิทึม (Logarithm Return) โดยในการทดลองนี้จะแบ่งกลุ่มข้อมูลออกเป็น 2 กลุ่ม

ขั้นตอนที่ 3 การสอนโมเดล (Training)
ขั้นตอนนี้จะสอนอัลกอริทึ่ม Machine Learning เพื่อสร้างตัวทำนาย โดยใช้ข้อมูลแต่ละกลุ่มที่ได้จากการแบ่งกลุ่มด้วย K-mean clustering ในขั้นตอนที่ 2 ดังนั้น จำนวนตัวทำนายที่ได้ จะขึ้นอยู่กับจำนวนกลุ่มของข้อมูลสอนที่แบ่งได้ และจำนวนอัลกอริทึ่มที่ใช้ ข้อมูลที่ใช้ทำการสอน คือ ข้อมูลหุ้นปี 2000-2012 การแบ่งกลุ่ม และการสอนโมเดล แสดงได้ดังรูป

จากรูป จะเห็นว่าชุดข้อมูลสอน ถูกแบ่งออกเป็น n กลุ่ม ได้แก่ Cluster 0, Cluster 1, … , Cluster n ดังนั้น อัลกอริทึ่มแรก (Machine Learning algorithm #0) ก็จะมีจำนวนตัวทำนาย n ตัวได้แก่ Predictor (0,0), Predictor (0,1), … , Predictor (0,n) ที่ได้รับการสอนโดยใช้ข้อมูลกลุ่ม Cluster 0, Cluster 1, … , Cluster n ตามลำดับ ทำให้ถึงแม้จำเป็นอัลกอริทึ่ม Machine Learning ชนิดเดียวกัน แต่ตัวทำนายเหล่านี้จะมีความสามารถในการทำงานที่แตกต่างกัน เมื่อมีการเพิ่มจำนวนอัลกอริทึ่ม Machine Learning ก็จะทำให้จำนวน Predictor เพิ่มขึ้นตามขนาดของกลุ่มของข้อมูลสอนนั่นเอง เช่น มีอัลกอริทึ่ม Machine Learning จำนวน m อัลกอริทึ่ม และ มีจำนวนกลุ่มข้อมูลสอน n กลุ่ม จำนวนตัวทำนายทั้งหมดสามารถคำนวนได้ m * n ตัว นั่นเอง
ขั้นตอนที่ 4 การทดสอบโมเดล (Testing)
การทดสอบโมเดลจะใช้ชุดข้อมูลทดสอบ (Testing set) คือ ข้อมูลหุ้นปี 2013-2014 ซึ่งข้อมูลที่ไม่เคยถูกใช้งานมาก่อน โดยในระหว่างการทดสอบ ระบบจะทำการเลือกตัวทำนายเพื่อใช้ในการทำนาย ณ วันนั้นๆ และมีความสามารถเปลี่ยนตัวทำนายได้เมื่อสถานการณ์เปลี่ยนแปลงไป สำหรับการเลือกตัวทำนายนี้ อยู่บนสมมุติฐานที่ว่า ตัวทำนายแต่ละตัวได้รับการสอนด้วยข้อมูลที่มีความแตกต่างกัน ดังนั้น จะมีความสามารถในการทำนายไม่เท่ากัน เช่น ตัวทำนายนึงจะมีความสามารถในการทำนายในช่วงของข้อมูลขาขึ้นได้ดีกว่าอีกตัว เป็นต้น
ในขั้นตอนการทดสอบโมเดลนี้ จะมีการส่งข้อมูลทดสอบไปยังฟังก์ชั่นที่ใช้ในการควบคุมการเลือกตัวทำนาย (Predictor Control) เพื่อทำหน้าที่เลือกตัวทำนายที่เหมาะสมในแต่ละรอบการทำงาน จากนั้นข้อมูลจะถูกต้องไปให้ตัวทำนายที่ถูกเลือก เพื่อทำนายค่าผลตอบแทนของวันพรุ่งนี้ และส่งผลการทำนายไปยังฟังก์ชั่นสร้างสัญญาณการเทรด (Signal Creation) เพื่อแปรผลการทำนายเป็นสัญญาณเทรด จากนั้นทำการประเมินผลที่ได้จากการเทรด เมื่อทำการทดสอบจนครบ จึงส่งผลการทำงานมายังฟังก์ชั่นที่ทำหน้าที่ประเมินประสิทธิภาพของโมเดล (System Performance) เพื่อแสดงผลการทำงานของระบบ

ผลการทดลอง
ในที่นี้เราได้ทำการทดสอบบนข้อมูลหุ้นที่แตกต่างกันทั้ง 11 หุ้น จากตลาดหุ้นชั้นนำของโลก คือ ตลาดหุ้นแห่งสหราชอาณาจักร และสหรัฐอเมริกา ซึ่งหุ้นเหล่านี้ถูกสุ่มเลือกมาจากกลุ่มธุรกิจที่แตกต่างกัน ดังแสดงในตาราง
สัญลักษณ์ | ชื่อบริษัท | ประเภทธุรกิจ | ตลาด |
CARR.L | Carr’s Group plc. | Food producers | LON |
TSCO.L | Tesco plc. | Multinational groceries | LON |
MKS.L | Marks & Spencer Group plc | Multinational retailer | LON |
MACF.L | Macfarlane Group plc. | General Industrials | LON |
FERG.L | Ferguson plc. | Industrial suppliers | LON |
COST.L | Costain Group plc. | Construction and Materia | LON |
OXIG.L | Oxford Instruments plc. | Electronic and Electrical Equipment | LON |
SXS.L | Spectris plc. | Electronic and Electrical Equipment | LON |
D4T4.L | D4T4 Solution plc. | Software and computer service | LON |
GOOG | Alphabet inc. | Multinational conglomerate | NASDAQ |
MCD | McDonalds | Fast food company | NYSE |
ตัวอย่างผลลัพธ์บางส่วน

ผลลัพธ์ที่แสดงประกอบด้วย 3 กราฟย่อย ดังนี้ กราฟบนสุดแสดงราคาปิด (Close price) กราฟรูปกลางแสดงผลลัพธ์ที่ได้จากการเทรดด้วยกลยุทธ์ที่แตกต่างกัน 3 แบบด้วยกัน คือ แบบตัวทำนายเดียว (กราฟเส้นสีแดง) แบบหลายตัวทำนาย (กราฟเส้นสีเขียว) เทียบกับผลการเทรดที่ได้จากกลยุทธ์ Buy & Hold (กราฟเส้นสีดำ) ซึ่งใช้เป็น Benchmark ในการเปรียบเทียบผลการทดลองครั้งนี้ โดยค่าผลลัพธ์ที่แสดงในรูปนี้ คือ ค่า Logarithm Return กราฟในรูปล่างสุดแสดงค่า Drawdown ของการเทรดโดยกลยุทธ์แบบหลายตัวทำนาย กราฟเส้นสีเขียว แสดงค่า Drawdown ตลอดช่วงเวลาเทรด ส่วนกราฟสีแดง แสดงค่า Drawdown ที่มากที่สุดของการเทรด
จากผลลัพธ์ที่ได้จาก CARR พบว่าราคาของหุ้นตัวนี้ เริ่มต้นที่ประมาณ 100 กว่าเพนนี ณ วันเริ่มต้นการทดลอง คือ ณ วันแรกของปี 2013 และ ราคาของหุ้นมีการขยับขึ้น จนไปสิ้นสุดที่ราคาประมาณ 180 เพนนี ณ วันสิ้นสุดการทดสอบ คือ ณ วันสุดท้ายของปี 2014 ผลลัพธ์ที่ได้จากการทดลองจะเห็นได้ว่า การใช้ตัวทำนายเพียงตัวทำนายเดียว ซึ่งในที่นี้คือ Polynomial Regressor ที่แสดงด้วยกราฟเส้นสีแดงนั้นไม่สามารถให้ผลลัพธ์ที่ดีกว่า Benchmark (Buy & Hold) ที่แสดงด้วยกราฟเส้นสีดำได้ จะเห็นว่ากราฟเส้นสีแดง และ สีดำ ให้ผลลัพธ์ที่คล้ายคลึงกันมาก โดยตั้งแต่ช่วงเริ่มต้นของการทดลอง ไปจนถึงประมาณเดือน เมษายน ปี 2014 กลยุทธ์ตัวทำนายเดียว มีประสิทธิภาพในการเทรดดีกว่า Benchmark เล็กน้อย แต่ทว่าหลังจากเดือนเมษายน ปี 2014 Benchmark กลับเป็นกลยุทธ์ที่ทำงานได้ดีกว่า ตัวทำนาย Polynomial ชนิดตัวทำนายเดียว แต่เมื่อมีการใช้ตัวทำนาย Polynomial 2 ตัว กลับพบว่า ผลลัพธ์ที่ได้ดังแสดงด้วยเส้นกราฟสีเขียวนั้น มีประสิทธิภาพมากกว่าผลการทดลองที่ได้จากกลยุทธ์อื่นอย่างเห็นได้ชัด แม้กระทั่งในช่วงนี้หุ้น CARR มีราคาตกต่ำในช่วงเดือนเมษายน ปี 2013 และ เดือนเมษายน ปี 2014 กลยุทธ์ตัวทำนายมากกว่าหนึ่งตัวยังสามารถทำกำไรได้อย่างต่อเนื่อง
จากผลลัพธ์ดังกล่าวพบว่า กลยุทธ์ Buy & Hold ซึ่งเป็น Benchmark สามารถทำกำไรได้ 62.38% เมื่อสิ้นสุดช่วงเวลาที่ทำการทดสอบ ในขณะที่กลยุทธ์ตัวทำนายเดียวสามารถทำกำไรได้น้อยกว่า Buy & Hold ที่ 52.92% สำหรับกลุยุทธ์ตัวทำนายหลายตัวสามารถทำกำไรได้มากกว่ากลยุทธ์อื่นๆ อย่างมีนัยสำคัญที่ 183.38% กลยุทธ์ตัวทำนายหลายตัวไม่เพียงแต่มีประสิทธิภาพในการทำงานดีกว่ากลยุทธ์อื่นๆ ในแง่ของการทำกำไร แต่ยังแสดงผลลัพธ์ที่ดีกว่าในแง่ของค่า Drawdown อีกด้วย โดยในขณะที่กลยุทธ์อื่นๆ มีค่า Drawdown ที่ค่อนข้างใหญ่ คือ 26.32% (สำหรับกลยุทธ์ Buy & Hold) และ 29.33% (สำหรับกลยุทธ์ตัวทำนายเดียว) กลยุทธ์หลายตัวทำนายมีค่า Drawdown น้อยกว่ากลยุทธ์อื่นที่ 19.05% เมื่อพิจารณาค่า Sharpe Ratio พบว่าเป็นไปในแนวทางเดียวกันคือ กลยุทธ์หลายตัวทำนายมีค่า Sharpe Ratio สูงที่สุดที่ 1.78 ในขณะที่กลยุทธ์ตัวทำนายเดียว และ Buy & Hold มีค่า Sharpe Ratio เพียง0.77 และ 0.66 เท่านั้น ซึ่งค่า Sharpe Ratio ถือเป็นค่าที่สำคัญที่สุดในการทดลอง เนื่องจากเป็นค่าที่บอกประสิทธิภาพในการทำกำไรของระบบโดยมีการนำค่าความเสี่ยงเข้ามาคำนวณร่วมด้วย

จากผลลัพธ์ที่ได้จากหุ้น TSCO จะเห็นได้ว่ากลยุทธ์แบบหลายตัวทำนายมีประสิทธิภาพสูงสุดเช่นกัน แม้ว่าข้อมูลหุ้น TSCO จะมีแนวโน้มที่ต่างกับหุ้น CARR อย่างสิ้นเชิง กล่าวคือ ราคาของหุ้น TSCO มีลักษณะของหุ้นแนวโน้มขาลงตลอดช่วงของการทำนาย แม้ว่าในช่วง 3 เดือนแรก ทั้งกลยุทธ์แบบตัวทำนายเดียว (กราฟสีแดง) และกลยุทธ์หลายตัวทำนาย (กราฟสีเขียว) จะไม่สามารถเอาชนะกลยุทธ์ Buy & Hold (กราฟสีดำ) ได้อย่างเห็นได้ชัด แต่หลังจากนั้น กลยุทธ์หลายทำนายได้แสดงผลงานที่ดีกว่า Buy & Hold อย่างมีนัยสำคัญตลอดไปจนจบการทดสอบ โดยเมื่อสิ้นสุดการทดสอบ กลยุทธแบบหลายตัวทำนายสามารถทำกำไรได้ถึง 44.84% ในขณะที่ Benchmark คือ กลยุทธ์ Buy & Hold นั้นมีการขาดทุนถึง 44.86% สำหรับกลยุทธ์ตัวทำนายเดียวนั้น แม้ว่าจะทำผลงานในช่วงท้ายการทดลองได้ดีกว่ากลยุทธ์ Buy & Hold แต่ก็จบลงที่การขาดทุนเช่นกัน โดยขาดทุนถึง 17.42% เมื่อสิ้นสุดการทดลองสำหรับผลการทดลองของหุ้นตัวอื่นๆ ที่เหลือจะแสดงในตาราง
CARR Buy & Hold Single Predictor Multiple Predictors | 62.38 52.92 183.38 | 0.77 0.66 1.78 | -26.32 -29.33 -19.05 | 52.89 52.46 54.39 | 0.302 0.302 0.300 |
COST Buy & Hold Single Predictor Multiple Predictors | 11.57 81.97 -14.54 | 0.09 0.97 -0.38 | -22.26 -15.72 -38.90 | 51.26 51.46 49.37 | 0.296 0.295 0.296 |
D4T4 Buy & Hold Single Predictor Multiple Predictors | 39.10 -27.22 70.71 | 1.19 -1.25 1.98 | -37.76 -46.08 -17.22 | 51.75 49.12 58.77 | 0.586 0.586 0.583 |
FERG Buy & Hold Single Predictor Multiple Predictors | 18.59 20.85 26.61 | 0.26 0.31 0.42 | -16.09 -32.67 -13.84 | 49.10 48.70 50.90 | 0.211 0.211 0.211 |
GOOG Buy & Hold Single Predictor Multiple Predictors | 45.71 48.67 -8.45 | 0.74 0.79 -0.35 | -18.72 -15.49 -24.30 | 50.10 50.50 48.31 | 0.213 0.213 0.213 |
MACF Buy & Hold Single Predictor Multiple Predictors | 26.96 -1.83 114.62 | 0.65 -0.15 2.33 | -28.06 -36.28 -19.23 | 49.81 52.92 58.37 | 0.312 0.313 0.309 |
MCD Buy & Hold Single Predictor Multiple Predictors | 3.97 1.78 23.87 | 0.08 0.17 0.63 | -14.61 -14.61 -10.33 | 54.6 54.2 54.2 | 0.124 0.124 0.124 |
MKS Buy & Hold Single Predictor Multiple Predictors | 25.11 -18.61 4.13 | 0.35 -0.56 0.04 | -25.24 -29.86 -27.50 | 48.8 48.6 53.2 | 0.237 0.237 0.238 |
OXIG Buy & Hold Single Predictor Multiple Predictors | -15.00 21.61 357.01 | -0.33 0.20 2.19 | -46.91 -27.29 -16.29 | 48.07 50.10 52.55 | 0.346 0.346 0.343 |
SXS Buy & Hold Single Predictor Multiple Predictors | 0.67 -45.88 67.36 | 0.10 -1.30 0.88 | -35.85 -52.22 -22.65 | 51.70 47.29 53.91 | 0.263 0.262 0.262 |
TSCO Buy & Hold Single Predictor Multiple Predictors | -44.86 -17.42 44.84 | -1.35 -0.52 0.64 | -57.50 -29.66 -15.80 | 46.91 46.91 50.50 | 0.244 0.244 0.244 |
จากตารางแสดงผลลัพธ์ที่ทำการทดสอบด้วยข้อมูลหุ้นที่แตกต่างกัน 11 หุ้น ผลลัพธ์แสดงในรูปแบบของ กำไร (%), Sharpe Ratio, ค่า Drawdown ที่สูงที่สุด, ค่าความถูกต้อง และ ค่าเบี่ยงเบนมาตรฐาน โดยค่าที่การทดลองนี้ให้ความสำหรับสูงที่สุดคือ Sharpe Ratio ดังที่ได้กล่าวไปแล้วในหัวข้อที่ xxx จากผลการทดลองทั้งหมดพบว่ากลยุทธ์หลายตัวทำนายสามารถทำผลงานได้ดีที่สุดสำหรับ 8 หุ้นด้วยกัน คือ CARR, D4T4, MACF, MCD, OXIG, SXS, TSCOและ FERG เมื่อพิจารณาหุ้นทั้ง 8 นี้ จะเห็นได้ว่าประกอบด้วยหุ้นทั้งขาขึ้นและขาลง ตัวอย่างเช่น หุ้นขาขึ้น คือ CARR, D4T4 และ MACF และ หุ้นขาลงคือ OXIG และ TSCO จึงกล่าวได้ว่า การเพิ่มจำนวนตัวทำนายสามารถเพิ่มประสิทธิภาพในการเทรดได้ทั้งสำหรับหุ้นที่อยู่ในช่วงขาขึ้นและหุ้นที่อยู่ในช่วงขาลง นั่นเอง
ถึงแม้ว่ากลยุทธ์หลายตัวทำนาย (Multiple Predictors) จะทำงานได้ดีกับหุ้นส่วนใหญ่ในกลุ่ม แต่ก็มีหุ้นบางตัวที่กลยุทธ์นี้ไม่สามารถเพิ่มประสิทธิภาพในการเทรดได้ ได้แก่ COST, GOOG และ MKS สำหรับ MKS จะสามารถสังเกตุได้ว่า สาเหตุที่ประสิทธิภาพของกลยุทธ์หลายตัวทำนายไม่ดี แสดงได้จากค่า Sharpe Ratioที่ค่อนข้างต่ำ (0.04) อาจเนื่องมากจากอัลกอริทึ่มที่เลือกใช้ คือ Polynomial Regression อาจไม่เหมาะสมกับข้อมูลชุดนี้ สังเกตได้จากค่า Sharpe Ratio ที่ได้จากกลยุทธ์ตัวทำนายเดียวมีค่าต่ำเช่นกัน (-0.56)

สรุปผลการทดลอง
จากผลการทดลองดังกล่าวข้างต้นสามารถสรุปได้ว่า การเพิ่มจำนวนของตัวทำนายสามารถเพิ่มประสิทธิภาพในการเทรดได้ โดยเมื่อทำการคำนวณค่าทางสถิติ Paired T-test ของ Sharpe Ratio ที่ได้จากผลลัพธ์ทั้งหมด เปรียบเทียบระหว่างกลยุทธ์ตัวทำนายเดียว และ หลายตัวทำนาย พบว่ามีค่า p-value เท่ากับ 0.042 ซึ่งแสดงว่า ผลลัพธ์ทีได้จากกลยุทธ์หลายตัวทำนายมีความแตกต่างกับผลลัพธ์ที่ได้จากลยุทธ์แบบตัวทำนายเดียวอย่างมีนัยสำคัญ ที่ความเชื่อมั่นมากกว่า 95% เมื่อพิจารณาจากค่าเฉลี่ยของค่า Sharpe Ratio ของกลยุทธ์ตัวทำนายเดียว และหลายตัวทำนาย พบว่าค่าเฉลี่ย Sharpe Ratio ของกลยุทธ์ตัวทำนายเดียวมีค่าเท่ากับ -0.092 ในขณะที่ค่าเฉลี่ย Sharpe Ratio ของกลยุทธ์หลายตัวทำนายมีค่าเท่ากับ 0.92 จะเห็นได้ว่ากลยุทธ์หลายตัวทำนายมีค่าเฉลี่ย Sharpe Ratio สูงกว่ากลยุทธ์ตัวทำนายเดียวอย่างเห็นได้ชัด ประกอบกับค่า P-value ที่ได้
จึงสรุปได้ว่า กลยุทธ์หลายตัวทำนาย สามารถเพิ่มประสิทธิภาพในการเทรดได้ดีกว่ากลยุทธ์แบบตัวทำนายเดียวได้

ปัญหาจากการทดลอง
เนื่องจากการทดลองนี้ มีวัตถุประสงค์หลัก คือ การเพิ่มประสิทธิภาพของการเทรดโดยการเพิ่มจำนวนตัวทำนาย โดยอาศัยหลักการแบ่งกลุ่มข้อมูลสอนด้วยอัลกอริทึ่ม K-mean clustering ดังนั้น ผู้ทดลองมีความจำเป็นจะต้องควบคุมการเลือกตัวทำนายให้ถูกต้องมากที่สุด จึงมีการใช้ข้อมูลที่มีลักษณะของ Look-ahead bias ร่วมด้วยในขั้นตอนของการเลือกตัวทำนาย เพื่อประโยชน์ในการควบคุมสภาพแวดล้อมของระบบ เพื่อให้สามารถทดสอบสุมติฐานหลักของการทดลองได้ ดังนั้น มีความเป็นไปได้สูงที่ผลลัพธ์ที่ได้จะมีประสิทธิภาพที่ดีกว่าความเป็นจริง
ดังนั้น การจะได้มาซึ่งผลลัพธ์ดีข้างต้นนั้น จะต้องมีวิธีการเลือกตัวนายที่เหมาะสมในระหว่างการทำงานด้วย โดยในบทความต่อ เราจะมาวิเคราะห์กันว่า เมื่อทำการทดสอบการเลือกตัวทำนายโดยขจัดข้อมูล Look-ahead bias ออก ผลลัพธ์ที่ได้จะเป็นอย่างไร และ ถ้าเราทำการเพิ่มจำนวน Machine Learning อัลกอริทึ่มทีละ 1 ตัว จนครบทั้ง 6 ตัว ดังที่กล่าวไว้ข้างต้น จะสามารถช่วยเพิ่มประสิทธิภาพของโมเดลได้มากกว่านี้หรือไม่ ไว้รอดูกันในบทความต่อไปนะคะ 🙂
