นักลงทุนคนดัง Marcos Lopez de Prado แจก 10 ไอเดียการใช้ ML ในการลงทุน (ฉบับเต็ม)

เมื่อพูดถึงการใช้ Machine Learning ในงานด้านการลงทุนแล้ว คนส่วนใหญ่มักจะนึกถึง “การทำนาย” ราคาข้องหุ้นเป็นหลัก แต่จริงๆ แล้ว Machine Learning ไม่ได้ทำได้เพียงแค่การทำนายค่าราคาเท่านั้นในการลงทุน บทความนี้จะพาไปดู ไอเดียต่างๆ ในการนำ Machine Learning มาใช้ในการด้านการลงทุน โดยการสรุปของคุณ Marcos Lopez de Prado อดีตหัวหน้าทีมนักวิจัย Machine Learning แห่ง AQR Capital และ CIO แห่ง True Positive Technologies (TPT) CIO of True Positive Technologies (TPT) มาดูกันเลยค่ะว่า 10 ทางเลือกในการใช้ Machine Learning ในการลงทุน จะมีอะไรกันบ้าง

1. การทำนายราคา (Price Prediction)

Cr. https://unsplash.com

ปัญหายอดฮิตของ Machine Learning ในงาน Finance เลยค่ะ คือ “How can we make a better price prediction?” หรือ เราจะทำนายราคาให้แม่นยำขึ้น ได้อย่างไร?

ปัญหานี้ มักจะถูกมองใน 2 ด้านด้วยกันคือ

  • มองจากมุมมองในด้าน Machine Learning: นักคอมพิวเตอร์ หรือ ผู้เชี่ยวชาญก็มักจะนึกไปถึงคำถามประเภท
    – ตัวแปรอะไรที่จะเป็นตัวแปรที่มีผลต่อการทำนายที่ถูกต้อง มากที่สุด?
    – เมื่อมีตัวแปรแล้ว สมการล่ะ สมการอะไรที่มีความสามารถในการทำนายค่าราคา ได้ดีที่สุด?
  • มุมมองจากทางฝั่งของนักเศรษฐศาสตร์ กลับจะถึงนึง เหตุการณ์ และ การอธิบายปรากฏการณ์ต่างๆ เพื่อให้เข้าใจ และ ส่งผลไปสู่การคาดการณ์ค่าต่างๆ ในอนาคต

แต่ข้อควรระวังก็คือ “ปรากฏการณ์ที่สามารถอธิบายได้ดีที่สุด ไม่ได้ส่งผลไปสู่การทำนายค่าราคาในอนาคตที่ดีที่สุดเสมอไป” ณ จุดนี้เองที่ Machine Learning มีความได้เปรียบ ตรงที่ มันสามารถค้นหา “ตัวแปร” ที่เหมาะ สำหรับการทำนาย ในสถานการณ์ที่ไม่สามารถอธิบายได้อย่างสมบูรณ์ หรือ จากข้อมูลที่ไม่สมบูรณ์นั่นเอง

ผู้อ่านท่านใดสนใจหัวข้อนี้ สามารถตามอ่าน paper ได้ที่



Machine Learning: An Applied Econometric Approach

2. การจัดสร้างพอร์ต และ การจัดการความเสี่ยง (Portfolio Construction / Risk Analysis)

Cr. https://unsplash.com

ผู้อ่านท่านใดสนใจทฤษฏี “Modern Portfolio Theory” หรือ “Markowitz Portfolio Theory(MPT) ” สามารถอ่านบทความที่เราเคยเขียนไว้ได้ ที่ “Modern Portfolio Theory หนึ่งในนวตกรรมเปลี่ยนโลกการลงทุน”

การสร้าง และ การวิเคราะห์ Portfolio เป็นอีกหนึ่งแนวทางในการใช้งาน Machine Learning ที่ยังมีพื้นที่ให้วิจัยอีกมาก เนื่องจากถ้าเทียบกับงานวิจัยทางด้านการทำนายราคา แล้ว จำนวนของงานวิจัยด้านการบริหาจัดการ Portfolio ด้วย Machine Learning นั้นยังมีสัดส่วนที่น้อยมาก

Cr. Dr. Marcos Lopez de Prado

เมื่อพูดถึง “การบริหารจัดการพอร์ต” แล้ว นักลงทุนหลายๆ ท่าน คงจะคุ้นกันดีกับชื่อ “Efficient Frontier” หรือ “Markowitz analysis” กันดี เนื่องจากเป็นหลักการในการจัดการบริหารหุ้นในพอร์ตที่รู้จักกันอย่างแพร่หลาย

กล่าวสั้นๆ ก็คือ การจัดการพอร์ต แบบ “Markowitz Portfolio Theory(MPT)” นั้นเป็นการจัดการบริหารพอร์ตเพื่อให้ได้สัดส่วนของหุ้นในพอร์ตที่ให้ค่าตอบแทนสูงที่สุด ณ จุดของความเสี่ยงที่นักลงทุนสามารถรับได้

ถ้าจะให้กล่าวแบบไม่ลำเอียงเลยก็คือ ถึงแม้จะเป็นหลักการที่เป็นที่รู้จักการมาอย่างยาวนาน และ ยังถูกนำมากล่าวถึงกันจนถึงทุกวันนี้ แต่จำนวนของผู้ที่ไม่เห็นด้วยกับทฤษฏี MPT ก็มีไม่น้อยเลยทีเดียว

เนื่องด้วย เหตุผล ต่างๆ นานา อาทิเช่น การบริหารพอร์ตด้วยวิธีนี้มีความไม่มั่นคงสูงมาก เนื่องจากผลลัพธ์ที่ได้นั้นขึ้นอยู่กับตัวแปรที่เป็นค่า “คาดการณ์” และ ค่าคาดการณ์ที่สำคัญที่ก่อให้เกิดปัญหา Error หรือ ความไม่มั่นคง ของวิธีการนี้ก็คือ ค่าคาดการณ์ผลกำไร (Expected Returns) นั่นเองค่ะ ถ้าเราคาดการณ์ผลกำไรผิดพลาดไปเพียงเล็กน้อย การจัดสัดส่วนใน Portfolio ก็อาจจะเปลี่ยนไปจากหน้ามีอเป็นหลังมือได้เลย หรือ อีกตัวอย่างหนึ่งก็คือ ถ้าข้อมูลที่มี “หายไป” เพียงบางส่วนเล็กๆ แค่ส่วนเล็กๆ ของข้อมูลเช่น เพียงแค่ 10% ที่หายไป ก็สามารถส่งผลกระทบให้สัดส่วนของหุ้นใน Portfolio แตกต่างกันอย่างมากได้เช่นกันค่ะ ลักษณะของเหตุการณ์แบบนี้นี่เองที่ทำให้นักวิจัยหลายๆ ท่าน ไม่ค่อยจะพอใจนัก และ พากันตัดสินว่า MPT เป็นโมเดลที่ไม่ค่อยจะ “Robust” หรือ ไม่ทนทาน หรือ อาจจะ เรียกอีกอย่างว่าเป็นโมเดลที่ “Sensitive” ต่อ Input มากเกินไป นั่นเองค่ะ

อีกหนึ่งปัจจัยที่เป็นข้อด้วยของ MPT ก็คือ “Cost” หรือ ค่าใช้จ่าย นั่นเอง เนื่องจากบ่อยครั้งที่ การสร้าง Optimal Portfolio ตาม ทฤษฏี ของ MPT นั้น ไม่สามารถทำได้ภายใต้ ค่าใช้จ่ายที่เหมาะสม

Machine Learning in Portfolio Construction and Risk Analysis

หลังจากได้กล่าวถึงข้อจำกัด และ ความเสี่ยงบางประการที่เกิดขึ้นกับ MPT กันแล้ว ในส่วนนี้เราจะมากล่าวถึง ความได้เปรียบของการใช้ Machine Learning เข้ามาช่วยในการจัดการพอร์ตกัน

รูปด้านล่าง แสดงให้เห็นถึงการจัดการพอร์ตตามทฤษฏี MPT ที่หุ้นที่เราสนใจอยู่เป็นจำนวน 50 หุ้น แน่นอนว่าการสร้าง Optimal Portfolio ขึ้นตามหลักการของ MPT นั้น หนึ่งในค่าที่ต้องใช้ในการคำนวณก็คือ “Covariance” ระหว่างหุ้นทุกๆ คู่ ซึ่งปัญหาที่ใหญ่ของวิธีการนี้ก็คือ แทบจะเป็นไปไม่ได้เลยที่เราจะคาดการณ์ค่า Covariance ของหุ้นทุกคู่ ในจำนวนหุ้นทั้ง 50 ตัวนี้ได้แม่นยำ! และความไม่แม่นยำนี้เอง ที่ทำให้เกิด “ความเสี่ยง” ในการจัดพอร์ตที่ผิดพลาดได้

Cr. Dr. Marcos Lopez de Prado

มาดูแนวทางในการแก้ปัญหากันบ้างดีกว่า หนึ่งในวิธีที่ถูกนำมาใช้ในการแก้ปัญหานี้ก็คือ “Machine Learning” ที่คุณ Marcoz ได้อธิบายไว้ในบทความชื่อ ” BUILDING DIVERSIFIED PORTFOLIOS
THAT OUTPERFORM OUT-OF-SAMPLE”
ที่มีการเปลี่ยนแปลงจากการจับคู่ทุกคู่ เป็นการใช้ Tree Topology ที่สร้างโดยการคิดเลียนแบบมนุษย์ ที่มักมีการวิเคราะห์ ปัญหาแบบ Top-Down-Decision จะทำให้จำนวนคู่ของหุ้นที่จะต้องนำมาประมาณค่า มีจำนวนน้อยลงอย่างมาก ดังกราฟ ด้านล่าง

Cr. Dr. Marcos Lopez de Prado

ซึ่งวิธีการที่คุณ Marcos นำเสนอนี้ ได้มีผลสรุปออกมาอย่างน่าพอใจ ทำให้การจัดการพอร์ตมีความ Robust เพิ่มมากขึ้นเป็นอย่างมาก และ สามารถเพิ่มค่าของ Sharpe Ratio จากวิธีเดิมของ MPT ขึ้นมาสูงถึง 31% เลยทีเดียว (ผลก่อนการคำนวณค่า Transaction fees) จากข้อมูล Out-of-Sample

ผู้อ่านท่านใดสนใจเรื่องนี้ สามารถตามอ่านได้ที่ Paper ด่านล่างเลยค่ะ paper แรก เป็น paper ที่กล่าวถึงปัญหา และ การเปรียบเทียบการจัดการพอร์ต Optimal (MTP) กับการจัดการ Port แบบ Naive diversification (Equal weights) ส่วน Paper ที่สอง เป็น Paper ของคุณ Marcos ที่ใช้ Machine Learning มาใช้ในการสร้าง Tree ในการจัดการพอร์ต ที่กล่าวถึงไปข้างต้น นั่นเองค่ะ


Optimal Versus Naive Diversification: How Inefficient is the 1/N Portfolio Strategy?

Building Diversified Portfolio that Outperform Out-of-Sample

3. การตรวจจับเหตุการณ์ที่ผิดปกติ (Structural Breaks/ Anomaly Detection)

Cr. https://unsplash.com

หัวข้อนี้ เป็นหัวข้อที่ผู้คนส่วนใหญ่ในสายงาน Finance มักจะไม่เชื่อว่า Machine Learning สามารถทำได้ ก็คือ “การหาจุดของการเปลี่ยนแปลง” ภายในข้อมูล

แต่จริงๆ แล้ว Machine Learning มีประสิทธิภาพมากในการ “รู้จำรูปแบบของข้อมูล” หรือ Pattern Recognition และ สามารถตรวจจับได้อย่างรวดเร็วเมื่อมีข้อมูลที่ “แตกแถว” เข้ามาในระบบ

Cr. Dr. Marcos Lopez de Prado

ดังตัวอย่างในกราฟด้านบน เป็นตัวย่างการแนะนำไอเดียการใช้ Machine Learning ในการตรวจจับ “Flash Crash” หรือ การตกของราคาอย่างรวดเร็ว ของ S & P 500 ในที่นี้ กราฟสีเขียว คือ ราคาปิดของS & P 500 ส่วนกราฟสีฟ้า คือ SADF series ที่สร้างขึ้นจาก time-series ราคาปิดของ S &P 500 ซึ่งจะเห็นได้ว่า เมื่อไหร่ก็ตามที่กราฟสีฟ้าเกิดจุด Peak ขึ้นมา หมายความว่า ณ จุดนั้นคือ จุดของราคาที่มีการตก แบบ Flash Crash ที่อาจจะเกิดเป็นเวลานาน หรือ เพียงแค่ ไม่กี่ชั่วโมงก็ได้ ซึ่งถ้าดูจากกราฟราคาสีเขียว อาจจะไม่ทันได้สังเกตุ แต่ถ้าพิจารณาจากกราฟสีฟ้าแล้ว จะสังเกตุจุดของ Flash Crash ได้ชัดเจนมาก

ข้อมูล SADF series นี้เองที่คุณ Marcos แนะนำว่า สามารถ ใช้เป็นข้อมูลสอน ให้กับ Machine Learning ให้ เรียนรู้ว่าเมื่อไหร่ที่ข้อมูลมีลักษณะที่เปลี่ยนไปจากข้อมูลเดิม หรือ พูดง่ายๆ ก็คือ ใช้ Machine Learning ในการรู้จำว่า ก่อนที่จะเกิดค่า Peak ขึ้นมานั้น ข้อมูลมีลักษณะเฉพาะอย่างไร เพื่อนำไปสู่การตรวจจับการตกของราคาในอนาคตได้อย่างรวดเร็วนั่นเอง

ผู้อ่านท่านใดสนใจหัวข้อนี้ สามารถตามอ่าน paper ได้ที่



Ransac for outlier detection

4. การกำหนดขนาดของการลงทุน (Bet Sizing)

Cr. https://unsplash.com

โดยปกติแล้ว คนที่ใช้ Machine Learning เข้ามาช่วยในการลงทุน มักจะพุ่งตรงไปที่การ “ทำนาย” ราคาในอนาคต แต่ยังมีอีกหนึ่งเรื่องที่น่าสนใจไม่แพ้กัน ก็คือ เมื่อตัดสินใจว่าจะเปิด Order ไม่ว่าจะ “BUY” หรือ “SELL” แล้ว “ขนาดของ Order” ที่เราจะเปิดนั้น ควรจะเป็นเท่าไหร่?

จริงๆ แล้วมันไม่มี “วิธีที่ตายตัว” หรือ “วิธีที่ดีที่สุด” ในการกำหนดขนาดของการลงทุน แต่อย่างไรก็ตาม มันก็ไม่ได้สิ้นหวังเสียทีเดียว เพราะยังมี Machine Learning อยู่จำนวนหนึ่งที่สามารถนำมาประยุกต์ใช้งานในการหาขนาดของการลงทุน หรือ “Order’s size” ได้

ตัวอย่างที่จะนำมาให้ดูกันเรียกว่า “Meta-Labeling”

วิธีการนี้ก็คือ การเพิ่ม Machine Learning เข้าไปอีกตัวนึง เพื่อจัดการกับการตัดสินใจว่า “Signal” ที่ได้จากกลยุทธ์ (Strategy) นั้น มีความน่าเชื่อถือ ที่จะลงทุนตามมากแค่ไหน?

Machine Learning ที่เพิ่มเข้าไปควรจะเป็น Classification model และ แน่นอนว่า ก่อนที่ Machine Learning ตัวที่เพิ่มเข้าไปจะทำงานได้ก็ต้องมีการ “Train” หรือ การสอนโมเดลก่อน ในขั้นตอนนี้เราจะใช้ข้อมูล “ผลการทำงาน” ที่ได้จากแต่ละ Strategy (เช่น แต่ละ strategy อาจจะเป็น Machine Learning algorithm ที่แตกต่างกัน เป็นต้น) ให้นำผลการทำงานของ Strategy มาทำการ “labeling” โดย label 1 สำหรับการลงทุนที่ได้กำไร และ 0 สำหรับการลงทุนที่ขาดทุน

Cr. https://chrisalbon.com

จากนั้นนำ ข้อมูลเหล่านี้มา Train กับ Classifier ตัวที่เพิ่มเข้าไป (เช่น Random Forest หรือ Support Vector Machine เป็นต้น) ให้ทำการ Maximise ค่าความเชื่อมัน (Confidence) ของการเลือกโมเดล เช่น Maximise ค่า F1-score เป็นต้น เมื่อทำการ Train เรียบร้อยแล้ว ตัว Meta-labeling Machine Learning นี้จะถูกนำมาใช้ เป็นตัวกำหนด “ขนาด” ของการลงทุน หลังจากที่เราได้รับ Signal จากระบบของเรานั่นเอง

5. กำหนดความสำคัญของตัวแปรที่เกี่ยวข้อง (Feature Importance)

Cr. https://unsplash.com

เคยได้ยินคำเปรียบเปรย “Machine Learning” ว่าเป็น “black boxes” หรือ Machine Learning เปรียบเสมือน “กล่องดำ” กันมั้ยคะ? คำกล่าวนี้เป็นอีกหนึ่งความคิดที่โผล่ขึ้นมา เมื่อผู้คนนึกถึง Machine Learning หมายความว่า Machine Learning เป็น Algorithm ที่ไม่เปิดเผยวิธีการทำงาน เหมือนจับ Algorithm มาใส่ไว้ในกล่องดำ ที่ผู้ใช้ไม่จำเป็นต้องทราบว่าภายในกล่องมีอะไร เพียงแค่ทราบว่ากล่องนี้ทำหน้าที่อะไร หน้าที่ของผู้ใช้ก็คือ ใส่ข้อมูล Input เข้าไป แล้วเจ้ากล่องนี้ก็จะส่งผลลัพธ์หรือ ข้อมูล Output ออกมานั้นเอง

Cr. https://www.voipone.ch

สำหรับตัวผู้เขียนแล้ว ไม่ได้เชื่อว่าคำๆ นี้จะเป็นจริงทั้ง 100 % นะคะ มันอยู่ที่ “ผู้ใช้” ด้วย ว่าต้องการจะเป็นแค่ผู้ใช้ที่ต้องการใช้เพียงแค่ black box เท่านั้น แต่ไม่ต้องการเรียนรู้ที่จะปรับแต่งอะไรเลย หรือ ว่าต้องการเป็นผู้ใช้ที่มีความรู้ความเข้าใจในการทำงานของโมเดลด้วย ซึ่งการทำงานส่วนใหญ่ของโมเดล Machine Learning นั้น เป็นการทำงานที่ “White box” อยู่บนพื้นฐานทาง คณิตศาสตร์ ที่สามารถเข้าใจได้ทั้งสิ้น ไม่ว่าจะเป็นโมเดลที่ซับซ้อนอย่าง Deep Learning ก็ตาม เช่น ถ้าให้มนุษย์คำคิดนวณด้วยมือ ก็สามารถทำ Deep Learning ได้ เพียงแต่ อาจจะใช้เวลาที่มหาศาล ที่เท่ากับเป็นไปไม่ได้เท่านั้นเอง เราจึงต้องใช้คอมพิวเตอร์เข้ามาช่วย พอมีการใช้คอมพิวเตอร์เข้ามาช่วย ผู้ใช้ก็เริ่มปฏิเสธที่จะเรียนรู้ และพากันเชื่อว่า มันคือ Black box หรือ Magic box (กล่องมหัศจรรย์) นั่นเองค่ะ

ดังนั้น มันจะดีกว่ามากๆ ที่ผู้ใช้จะเรียนรู้ และ เข้าใจโมเดลอย่างถ่องแท้ เพื่อให้สามารถปรับปรุงค่าพารามิเตอร์ต่างๆ ในโมเดลได้อย่างเหมาะสม เพราะว่าจริงๆ แล้วแทบจะไม่มีโมเดลไหนหรอกค่ะ ที่จะสมบูรณ์ และ “พร้อมใช้” 100% กับข้อมูลทุกอย่างในโลกนี้ ถึงโมเดลจะดีแค่ไหน แต่ถ้าไม่มีการปรับแต่งที่ดีก็ไม่สามารถทำงานได้อย่างมีประสิทธิภาพ และ สุดท้ายก็จะได้ผลลัพธ์ที่ไม่ต่างจาก Garbage in, Garbage out หรอกค่ะ

Cr. https://www.dataquest.io

Garbage in, Garbage out (GIGO) คือ เหตุการณ์ที่ไม่ว่าโมเดล Machine Learning จะดีแค่ไหน แต่ถ้าเราให้ข้อมูลที่แย่ (ข้อมูลที่เป็นขยะ หรือ ไม่มีประโยชน์ใดๆ ในการเรียนรู้) โมเดลนั้น ก็จะให้ผลลัพธ์ที่แย่ออกมา ไม่ต่างจากขยะเช่นกัน

มาเข้าเรื่องกันดีกว่าค่ะ เมื่อเราตัดสินใจว่า จะเป็นผู้ใช้ที่มีความรู้ความเข้าใจในตัวโมเดล Machine Learning ก่อนการใช้งานกันแล้วล่ะก็ เรื่องแรกที่เราสามารถทำความเข้าใจได้ ก็คือ “Feature Importance” ซึ่งก็คือการวิเคราะห์ว่า ข้อมูลส่วนไหน คือข้อมูลที่มีประโยชน์ต่อการทำนาย นั่นเองค่ะ

ลองนึกๆ ดูนะคะว่า ข้อมูลในโลกนี้มีมากมาย (ต้องยกเครดิตให้ความก้าวล้ำของเทคโนโลยี) แต่จะมีข้อมูลซักกี่ตัวที่ส่งผล หรือ มีประโยชน์ต่องานที่เราต้องการทำจริงๆ ในส่วนนี้นี่เองที่ Machine Learning สามารถเข้ามาร่วมมีบทบาทด้วย เนื่องจาก Machine Learning มีความสามารถในการ “ระบุ หรือ ค้นหา” รูปแบบของข้อมูล จากข้อมูลที่มี High dimension และ “รูปแบบ” หรือ Patterns ที่ค้นพบนี่เอง ที่จะสามารถนำมา Backward analysis เพื่อค้นหา Features ที่มีความเกี่ยวข้องสัมพันธ์กับมันได้

Cr. Dr. Marcos Lopez de Prado

จากรูปเป็นตัวอย่างการวิเคราะห์ความสำคัญของ Feature หรือ Factor แต่ละตัว ว่ามีความสำคัญเพียงใด โดยวิเคราะห์ว่าเมื่อทำการตัด Feature นั้นๆ ออกแล้ว ค่าความถูกต้องของการทำงานของ Machine Learning model มีค่าเฉลี่ยการลดลง ของค่า “Accuracy” (ในการทดลองอื่น อาจจะมีการวัดค่า “Impurity” ด้วย) มากน้อยเพียงใด ทดสอบบนข้อมูลที่สร้างขึั้นมาโดยเฉพาะในการทดสอบ โดยผลการทดลองพบว่า Machine Learning สามารถระบบ Features ที่สำคัญ (prefix “I_”) ได้อย่างถูกต้อง แม้ในข้อมูลที่มี Noise หรือ ค่ารบกวนสูงมาก (เช่นเดียวกับข้อมูลจาก stock market)

เมื่อเราระบุ Features หรือ factors ที่สำคัญได้แล้ว เราก็สามารถนำ Features นั้นมาใช้ในการพัฒนาโมเดลที่มีประสิทธิภาพต่อไปได้ค่ะ ผู้อ่านท่านใดสนใจสามารถติดตามอ่านได้จาก Paper ของคุณ Marcos ด้านล่างค่ะ

López de Prado, M. (2018): Advances in Financial Machine Learning. Wiley, First Edition.

López de Prado, M. (2019b): Machine Learning for Financial Researchers. CambridgeUniversity Press, First edition.

6. การควบคุมผลกระทบ และ ความสัมพันธ์ภายในของตัวแปร (Controlling for Effects and Interaction)

Cr. https://unsplash.com/

หัวข้อนี้เป็นการพูดถึงการควบคุมผลกระทบ หรือ “Controlling for Effects” เพื่อให้แน่ใจว่า “ค่าที่เราทำนาย” นั้น เป็นผลมาจาก “ตัวแปร” ที่เราสนใจเท่านั้น

เป็นเรื่องปกติในการศึกษาทางด้าน Econometric ที่จะมีการศึกษาสำคัญ (Significant) ของตัวแปร X ในการอธิบาย หรือ ทำนายค่า ตัวแปร y ในขณะที่ต้องควบคุมผลกระทบจากตัวแปร Z ดังสมการด้านล่าง

Cr. Dr. Marcos Lopez de Prado



ในที่นี้ เราต้องการศึกษาผลกระทบของตัวแปร X ในขณะที่ควบคุมผลกระทบจากตัวแปร Z ในการคำนวณค่า y


ตัวอย่างการนำมาใช้งาน เช่น สมมุติว่าเราทำการเลือก Features ที่สำคัญที่จะใช้ในการทำนาย คือ X1 และ X2 เราก็ต้องนำ Features นี้มาทดลองใช้ในการทำนาย ซึ่งในการทำนายนี้ เราก็จะมีการควบคุมผลกระทบจากตัวแปร Y (ตัวแปรอื่นๆ ที่เราต้องการทดสอบว่าไม่มีผลต่อการทำนาย เช่น การเคลื่อนที่ของ index เป็นต้น) เพื่อให้มั่นใจว่าผลลัพธ์ที่ได้จากการทำนายนั้น ส่งผลมาจาก Features X1, X2 ที่เราเลือกไว้จริงๆ ไม่ใช่ผลกระทบจากค่าอื่นๆ เป็นต้น

ในการทำงานนี้ Mullainathan and Spiess ได้มีการนำเสนองานวิจัยที่บอกว่า สามารถใช้ Machine Learning มาใช้ในการแทนที่ค่า Z ด้วยผลจากการทำนายค่า y ด้วย feature Z ซึ่งวิธีการที่นำเสนอนี้เรียกว่า “The semi-parametric appoach” ซึ่งสามารถติดตามอ่านรายละเอียดได้ ใน Paper ด้านล่างค่ะ



Machine Learning: An Applied Econometric Approach

7. วิเคราะห์ความเสี่ยงด้านเครดิต และ ระบบให้คำแนะนำ (Credit Ratings, Analyst Recommendations)

Cr. https://unsplash.com/

การวิเคราะห์ความเสี่ยงทางด้านเครดิต เป็นอีกหนึ่งงานที่สร้างความปวดหัวให้กับนักวิเคราะห์ไม่น้อย ทำให้ไม่แปลกเลยว่าทำไมนักวิเคราะห์จำนวนมากถึงได้หันมาใช้ Machine Learning กัน

จากความซับซ้อนของพฤติกรรมของลูกค้าในปัจจุบัน ทำให้โมเดลทางคณิตศาสตร์แบบทั่วไปไม่สามารถระบุ กลุ่มของลูกค้าได้อย่างแม่นยำ ทำ Machine Learning ได้มีโอกาสเข้ามาแสดงบทบาทมากขึ้น ไม่ว่าจะเป็นการวิเคราะห์เพื่อออกบัตรเครดิตให้กับลูกค้าของธนาคาร การจัดลำดับของลูกค้าของบริษัทลงทุน การพิจารณายอดเงินกู้ให้กับลูกค้าสินเชื่อบ้าน เป็นต้น งานเหล่านี้ถือเป็นงานที่ซับซ้อนขึ้นทุกวันสืบเนื่องมาจากพฤติกรรมของลูกค้าที่เปลี่ยนแปลงไป

ตัวอย่างเช่น ภาพด้านล่างเป็นภาพแสดง Bond หรือ ตราสารหนี้ 2 ประเภท คือ สีดำซึ่งเป็นประเภทปกติ และ สีแดงซึ่งเป็นตราสารหนี้ที่ไม่สามารถจ่ายคืนได้ พูดง่ายๆ ก็คือ หนี้เสีย (ที่เจ้าของตราสารหนี้ ไม่สามารถจ่ายคืนได้ตามกำหนด หรือ ไม่สามารถจ่ายดอกเบี้ยให้ผู้ถือตราสารหนี้ได้อีกต่อไป)

Cr. Dr. Marcos Lopez de Prado

รูปแรก เป็นข้อมูลจริงของตราสารหนี้ ปกติ (สีดำ) และ ตราสารหนี้ที่เสีย หรือ defaults (สีแดง) จะเห็นว่าการจะหาโมเดลที่สามารถฟิตข้อมูลนี้ได้นั้นไม่ง่ายเลย เนื่องจากข้อมูล 2 สีนั้นกระจายปะปนกันอยู่ทั่วไปหมด หรือ แม้แต่ถ้าเราใช้โมเดล ML พื้นฐาน เช่น Linear Model ก็ไม่สามารถฟิตข้อมูลได้ ดังแสดงในรูปกลาง ดังนั้น สำหรับข้อมูลที่ซับซ้อนในระดับนี้ได้ ML ที่เลือกมาใช้ก็จะต้องเป็นโมเดลที่รองรับรูปแบบข้อมูลที่ซับซ้อนมากขึ้น เช่น Neural Network หรือ Random Forest เป็นต้น ดังแสดงในรูปที่สาม เป็นการใช้ Random Forest ในการแบ่งกลุ่มข้อมูล จะเห็นว่าใกล้เคียงกับของจริงมากทีเดียวค่ะ

8. การวิเคราะห์อารมณ์หรือความรู้สึกจากข้อความ (Sentiment Analysis / Recommender System)

Cr. https://unsplash.com/

การถอดข้อความจากเว็บไซต์ ไม่ว่าจะเป็นบทสนทนาจาก Social Media หรือ ข่าวจากเว็บไซต์ และ วิเคราะห์อารมณ์ หรือ ความรู้สึกของฝูงชน เพื่อนำมาใช้เป็นข้อมูลในการลงทุน หรือ ในการนำเสนอไอเดียการลงทุนใหม่แกลูกค้า ถือเป็นอีกสาขานึงที่มีการนำ ML เข้ามาใช้กันอย่างแพร่หลาย ซึ่งเราจะได้ยินกันในชื่อของสาขา การประมวลผลภาษาธรรมชาติ หรือ “Natural Language Processing (NLP)” นั่นเอง

รูปด้านล่างคือ การวิเคราะห์ข่าวสารต่างๆ ที่มีข้อมูลเกี่ยวกับหุ้น Tesla ของสหรัฐอเมริกา

Cr. Dr. Marcos Lopez de Prado

– กราฟสีฟ้า – คือ จำนวนข่าวสารเกี่ยวกับ Tesla ในแต่ละวัน ซึ่งมีค่าเฉลี่ยอยู่ที่ 458 ข่าวต่อวัน และ จำนวนข่าวสูงที่สุดในรอบ 4 ปีคือ 5000 ข่าวต่อวัน
– กราฟสีเขียว – คือ จำนวนข่าวในทางบวกที่ถูกพูดถึงเกี่ยวกับ Tesla
– กราฟสีแดง – คือ จำนวนข่าวในทางลบเกี่ยวกับ Tesla ที่ถูกพูดถึงในวันนั้นๆ

ข้อมูลเหล่านี้เองที่นักวิเคราะห์สามารถนำไปประยุกต์ใช้ในการคิดไอเดียการลงทุนได้ ซึ่งแน่นอนว่า การจะวิเคราะห์ว่าข่าวเหล่านั้นเป็นไปในทางบวก หรือ ลบ ก็คงจะไม่ได้ใช้วิธีการให้คนมานั่งอ่านข่าว แต่เป็นการวิเคราะห์ด้วย NLP นั่นเองค่ะ

9. ตรวจจับกลยุทธ์การลงทุนที่ผิดพลาด (Detection of False Investment Stategies)

Cr. https://unsplash.com/

หัวข้อนี้ถ้าจะพูดให้เข้าใจง่ายๆ ต้องกล่าวถึงปัญหากันก่อนค่ะ ในโลกของการวิจัยเพื่อค้นหากลยุทธ์ในการลงทุนนั้น กว่าจะได้มาซักกลยุทธ์ย่อมต้องผ่านการทำ Backtest กันมาแล้วนับครั้งไม่ถ้วน ซึ่งในแน่นอนว่ามีนักวิจัยไม่น้อยที่จงใจ “เลือก” กลยุทธ์ที่มีค่า Sharpe Ratio สูงๆ มาจากการรัน Backtest จำนวนมากๆ แต่ในความเป็นจริงแล้วก็ไม่ได้หมายความว่าถ้านำกลยุทธ์นั้นมาใช้แล้วจะได้ผลค่า Sharpe Ratio ที่เป็นแบบนั้นเสมอไป ดูได้จากรูปด้านล่าง แกน x เป็นจำนวนครั้งในการรัน และ แกน y เป็นค่า Shape Ratio สูงสุดที่คาดหวังได้

Cr. Dr. Marcos Lopez de Prado

จากรูปจะเห็นว่า ค่า Sharpe Ratio นั้นมีแนวโน้มจะมีค่าสูงขึ้นเมื่อจำนวนการ Backtest (trials) เพิ่มขึ้น ซึ่งก็แน่นอนว่า ทำการรันมากครั้ง optimise ตัวแปรมากครั้ง ค่าที่ได้ก็จะต้องดีขึ้น แต่ในความเป็นจริง ในการลงทุนสนามจริง มันไม่เหมือนกับการ Backtest เราไม่สามารถทำการรันหลายครั้งได้ เพราะฉะนั้นค่า Sharpe Ratio ที่ได้มา ก็ไม่ใช่ค่าที่ “ยึดถือ” ได้ ถ้าจะให้ได้ค่า Sharpe Ratio ที่เชื่อถือได้นั้น เราจะต้องมีการนำจำนวนครั้งของการ Backtest เข้ามาคำนวณด้วย ซึ่งเรียกว่า “Deflated the Sharpe Ratio”

ในการตรวจจับการกลยุทธ์การลงทุนที่ไม่ถูกต้อง เพื่อให้ได้มาซึ่งกลยุทธ์ที่เชื่อถือได้นี้เองที่ ML สามารถก้าวเข้ามามีบทบาทได้! ตัวอย่างเช่น ใช้ ML เพื่อแบ่งกลุ่ม (cluster) กลยุทธ์ที่มีการรัน Backtest หลายๆ ครั้ง ออกจากกัน เพื่อค้นหากลุ่มของกลยุทธ์ที่ใช้งานได้จริง

Cr. Dr. Marcos Lopez de Prado

จากรูป เป็นตัวอย่างการแสดงผลการแบ่งกลุ่มกลยุทธ์จากการรัน Backtest จำนวนมาก และ ค้นพบว่ากลยุทธ์ในกลุ่มที่ 2 เป็นกลยุทธ์ที่มีค่าความน่าจะเป็นที่กลยุทธ์จะมีค่า Sharpe Ratio มากกว่าศูนย์ 100% ดังนั้นจึงสามารถบอกได้ว่า ถ้าเราจะต้องเลือกกลยุทธ์ กลยุทธ์ในกลุ่มที่ 2 ดูจะเป็นทางเลือกที่ดีที่สุด เพราะมีโอกาสที่จะ overfit ในการ Backtest น้อยที่สุด

10. ลดค่าใช้จ่าย (Customization/ Cost Reduction/ Compliance)

Cr. https://unsplash.com/

ข้อสุดท้าย ดูเหมือนว่าคุณ Marcoz จะไม่ได้ให้รายละเอียดวิธีการไว้มากเท่าไหร่ แต่ก็ได้ยืนยันว่า การใช้ ML นี้สามารถลดค่าใช้จ่ายในการลงทุนไปได้มาก ทำการ Trading Fee สามารถลดลงต่ำมากๆ ไม่ว่าจะเป็นเพราะการใช้ ML เข้ามาช่วยทำให้โมเดลในการเทรดสามารถปรับตัวเองได้ ทำให้การลงทุนแต่ละครั้งเป็นประโยชน์สูงสุด และ การลดจำนวนคนทำงานให้เหลือน้อยลง ซึ่งนำไปสู่การลดค่าใช้จ่ายขององค์กรได้ และแน่นอน นำไปสู่การลดค่า Trading Fee ลงได้นั่นเอง

Cr. Dr. Marcos Lopez de Prado


รางวัลการันตี! ขอบคุณ ML ที่ทำให้ทีม 12 คนในบริษัทสามารถจัดการเงินมูลค่ากว่า 13 billion US dollor ได้ และ สามารถทำผลงานได้เยี่ยมยอด ซึ่งในการนี้ถ้าไม่มี ML เข้ามาช่วย คุณ Marcoz คาดว่าจะต้องใช้คนถึง 500 คน เลยทีเดียว ซึ่งแน่นอนว่า ค่าใช้จ่ายในครั้งนี้ กับคน 12 คน เทียบกับ 500 คนกับการลงทุนแบบดั้งเดิม นั้นเทียบกันไม่ติดเลย!

เมื่อลดค่าใช้จ่ายในองค์กรได้แล้ว แน่นอนว่า Trading fee ก็สามารถลดลงจาก 2% เป็น 0.05% ถือ ว่าได้ประโยชน์กันทั้งผู้ลงทุน และ โบรกเกอร์กันเลยทีเดียว

ผู้อ่านท่านใดสนใจดูวีดีโอฉบับเต็มจากคุณ Marcoz ก็ติดตามได้ที่ลิงก์ด้านล่างค่ะ

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s