10 ไอเดียใช้ Machine Learning ในงาน Finance พร้อมแนะนำ paper ไปอ่านกันให้จุใจรับปีใหม่ (part 1)

Cr. https://unsplash.com

เมื่อพูดถึงการใช้ Machine Learning ในงานด้านการลงทุนแล้ว คนส่วนใหญ่มักจะนึกถึง “การทำนาย” ราคาข้องหุ้นเป็นหลัก แต่จริงๆ แล้ว Machine Learning ไม่ได้ทำได้เพียงแค่การทำนายค่าราคาเท่านั้นในการลงทุน บทความนี้จะพาไปดู ไอเดียต่างๆ ในการนำ Machine Learning มาใช้ในการด้านการลงทุน โดยการสรุปของคุณ Marcos Lopez de Prado อดีตหัวหน้าทีมนักวิจัย Machine Learning แห่ง AQR Capital และ CIO แห่ง True Positive Technologies (TPT) CIO of True Positive Technologies (TPT) มาดูกันเลยค่ะว่า 10 ทางเลือกในการใช้ Machine Learning ในการลงทุน จะมีอะไรกันบ้าง

1. Price Prediction (การทำนายราคา)

ปัญหายอดฮิตของ Machine Learning ในงาน Finance เลยค่ะ คือ “How can we make a better price prediction?” หรือ เราจะทำนายราคาให้แม่นยำขึ้น ได้อย่างไร?

ปัญหานี้ มักจะถูกมองใน 2 ด้านด้วยกันคือ

  • มองจากมุมมองในด้าน Machine Learning: นักคอมพิวเตอร์ หรือ ผู้เชี่ยวชาญก็มักจะนึกไปถึงคำถามประเภท
    – ตัวแปรอะไรที่จะเป็นตัวแปรที่มีผลต่อการทำนายที่ถูกต้อง มากที่สุด?
    – เมื่อมีตัวแปรแล้ว สมการล่ะ สมการอะไรที่มีความสามารถในการทำนายค่าราคา ได้ดีที่สุด?
  • มุมมองจากทางฝั่งของนักเศรษฐศาสตร์ กลับจะถึงนึง เหตุการณ์ และ การอธิบายปรากฏการณ์ต่างๆ เพื่อให้เข้าใจ และ ส่งผลไปสู่การคาดการณ์ค่าต่างๆ ในอนาคต

แต่ข้อควรระวังก็คือ “ปรากฏการณ์ที่สามารถอธิบายได้ดีที่สุด ไม่ได้ส่งผลไปสู่การทำนายค่าราคาในอนาคตที่ดีที่สุดเสมอไป” ณ จุดนี้เองที่ Machine Learning มีความได้เปรียบ ตรงที่ มันสามารถค้นหา “ตัวแปร” ที่เหมาะ สำหรับการทำนาย ในสถานการณ์ที่ไม่สามารถอธิบายได้อย่างสมบูรณ์ หรือ จากข้อมูลที่ไม่สมบูรณ์นั่นเอง

ผู้อ่านท่านใดสนใจหัวข้อนี้ สามารถตามอ่าน paper ได้ที่



Machine Learning: An Applied Econometric Approach

2. Portfolio Construction / Risk Analysis (การจัดสร้างพอร์ต และ การจัดการความเสี่ยง)

Modern Portfolio Theory ในหุ้นไทยพร้อมทั้งจุด Sharpe Ratio, Min Volatility และ Max Return

ผู้อ่านท่านใดสนใจทฤษฏี “Modern Portfolio Theory” หรือ “Markowitz Portfolio Theory(MPT) ” สามารถอ่านบทความที่เราเคยเขียนไว้ได้ ที่ “Modern Portfolio Theory หนึ่งในนวตกรรมเปลี่ยนโลกการลงทุน”

การสร้าง และ การวิเคราะห์ Portfolio เป็นอีกหนึ่งแนวทางในการใช้งาน Machine Learning ที่ยังมีพื้นที่ให้วิจัยอีกมาก เนื่องจากถ้าเทียบกับงานวิจัยทางด้านการทำนายราคา แล้ว จำนวนของงานวิจัยด้านการบริหาจัดการ Portfolio ด้วย Machine Learning นั้นยังมีสัดส่วนที่น้อยมาก

เมื่อพูดถึง “การบริหารจัดการพอร์ต” แล้ว นักลงทุนหลายๆ ท่าน คงจะคุ้นกันดีกับชื่อ “Efficient Frontier” หรือ “Markowitz analysis” กันดี เนื่องจากเป็นหลักการในการจัดการบริหารหุ้นในพอร์ตที่รู้จักกันอย่างแพร่หลาย

กล่าวสั้นๆ ก็คือ การจัดการพอร์ต แบบ “Markowitz Portfolio Theory(MPT)” นั้นเป็นการจัดการบริหารพอร์ตเพื่อให้ได้สัดส่วนของหุ้นในพอร์ตที่ให้ค่าตอบแทนสูงที่สุด ณ จุดของความเสี่ยงที่นักลงทุนสามารถรับได้

ถ้าจะให้กล่าวแบบไม่ลำเอียงเลยก็คือ ถึงแม้จะเป็นหลักการที่เป็นที่รู้จักการมาอย่างยาวนาน และ ยังถูกนำมากล่าวถึงกันจนถึงทุกวันนี้ แต่จำนวนของผู้ที่ไม่เห็นด้วยกับทฤษฏี MPT ก็มีไม่น้อยเลยทีเดียว

เนื่องด้วย เหตุผล ต่างๆ นานา อาทิเช่น การบริหารพอร์ตด้วยวิธีนี้มีความไม่มั่นคงสูงมาก เนื่องจากผลลัพธ์ที่ได้นั้นขึ้นอยู่กับตัวแปรที่เป็นค่า “คาดการณ์” และ ค่าคาดการณ์ที่สำคัญที่ก่อให้เกิดปัญหา Error หรือ ความไม่มั่นคง ของวิธีการนี้ก็คือ ค่าคาดการณ์ผลกำไร (Expected Returns) นั่นเองค่ะ ถ้าเราคาดการณ์ผลกำไรผิดพลาดไปเพียงเล็กน้อย การจัดสัดส่วนใน Portfolio ก็อาจจะเปลี่ยนไปจากหน้ามีอเป็นหลังมือได้เลย หรือ อีกตัวอย่างหนึ่งก็คือ ถ้าข้อมูลที่มี “หายไป” เพียงบางส่วนเล็กๆ แค่ส่วนเล็กๆ ของข้อมูลเช่น เพียงแค่ 10% ที่หายไป ก็สามารถส่งผลกระทบให้สัดส่วนของหุ้นใน Portfolio แตกต่างกันอย่างมากได้เช่นกันค่ะ ลักษณะของเหตุการณ์แบบนี้นี่เองที่ทำให้นักวิจัยหลายๆ ท่าน ไม่ค่อยจะพอใจนัก และ พากันตัดสินว่า MPT เป็นโมเดลที่ไม่ค่อยจะ “Robust” หรือ ไม่ทนทาน หรือ อาจจะ เรียกอีกอย่างว่าเป็นโมเดลที่ “Sensitive” ต่อ Input มากเกินไป นั่นเองค่ะ

อีกหนึ่งปัจจัยที่เป็นข้อด้วยของ MPT ก็คือ “Cost” หรือ ค่าใช้จ่าย นั่นเอง เนื่องจากบ่อยครั้งที่ การสร้าง Optimal Portfolio ตาม ทฤษฏี ของ MPT นั้น ไม่สามารถทำได้ภายใต้ ค่าใช้จ่ายที่เหมาะสม

Machine Learning in Portfolio Construction and Risk Analysi

หลังจากได้กล่าวถึงข้อจำกัด และ ความเสี่ยงบางประการที่เกิดขึ้นกับ MPT กันแล้ว ในส่วนนี้เราจะมากล่าวถึง ความได้เปรียบของการใช้ Machine Learning เข้ามาช่วยในการจัดการพอร์ตกัน

รูปด้านล่าง แสดงให้เห็นถึงการจัดการพอร์ตตามทฤษฏี MPT ที่หุ้นที่เราสนใจอยู่เป็นจำนวน 50 หุ้น แน่นอนว่าการสร้าง Optimal Portfolio ขึ้นตามหลักการของ MPT นั้น หนึ่งในค่าที่ต้องใช้ในการคำนวณก็คือ “Covariance” ระหว่างหุ้นทุกๆ คู่ ซึ่งปัญหาที่ใหญ่ของวิธีการนี้ก็คือ แทบจะเป็นไปไม่ได้เลยที่เราจะคาดการณ์ค่า Covariance ของหุ้นทุกคู่ ในจำนวนหุ้นทั้ง 50 ตัวนี้ได้แม่นยำ! และความไม่แม่นยำนี้เอง ที่ทำให้เกิด “ความเสี่ยง” ในการจัดพอร์ตที่ผิดพลาดได้

มาดูแนวทางในการแก้ปัญหากันบ้างดีกว่า หนึ่งในวิธีที่ถูกนำมาใช้ในการแก้ปัญหานี้ก็คือ “Machine Learning” ที่คุณ Marcoz ได้อธิบายไว้ในบทความชื่อ ” BUILDING DIVERSIFIED PORTFOLIOS
THAT OUTPERFORM OUT-OF-SAMPLE”
ที่มีการเปลี่ยนแปลงจากการจับคู่ทุกคู่ เป็นการใช้ Tree Topology ที่สร้างโดยการคิดเลียนแบบมนุษย์ ที่มักมีการวิเคราะห์ ปัญหาแบบ Top-Down-Decision จะทำให้จำนวนคู่ของหุ้นที่จะต้องนำมาประมาณค่า มีจำนวนน้อยลงอย่างมาก ดังกราฟ ด้านล่าง

ซึ่งวิธีการที่คุณ Marcos นำเสนอนี้ ได้มีผลสรุปออกมาอย่างน่าพอใจ ทำให้การจัดการพอร์ตมีความ Robust เพิ่มมากขึ้นเป็นอย่างมาก และ สามารถเพิ่มค่าของ Sharpe Ratio จากวิธีเดิมของ MPT ขึ้นมาสูงถึง 31% เลยทีเดียว (ผลก่อนการคำนวณค่า Transaction fees) จากข้อมูล Out-of-Sample

ผู้อ่านท่านใดสนใจเรื่องนี้ สามารถตามอ่านได้ที่ Paper ด่านล่างเลยค่ะ paper แรก เป็น paper ที่กล่าวถึงปัญหา และ การเปรียบเทียบการจัดการพอร์ต Optimal (MTP) กับการจัดการ Port แบบ Naive diversification (Equal weights) ส่วน Paper ที่สอง เป็น Paper ของคุณ Marcos ที่ใช้ Machine Learning มาใช้ในการสร้าง Tree ในการจัดการพอร์ต ที่กล่าวถึงไปข้างต้น นั่นเองค่ะ


Optimal Versus Naive Diversification: How Inefficient is the 1/N Portfolio Strategy?

Building Diversified Portfolio that Outperform Out-of-Sample

3. Structural Breaks/ Anomaly Detection (การตรวจจับเหตุการณ์ที่ผิดปกติ)

Cr. http://www.information-age.com

หัวข้อนี้ เป็นหัวข้อที่ผู้คนส่วนใหญ่ในสายงาน Finance มักจะไม่เชื่อว่า Machine Learning สามารถทำได้ ก็คือ “การหาจุดของการเปลี่ยนแปลง” ภายในข้อมูล

แต่จริงๆ แล้ว Machine Learning มีประสิทธิภาพมากในการ “รู้จำรูปแบบของข้อมูล” หรือ Pattern Recognition และ สามารถตรวจจับได้อย่างรวดเร็วเมื่อมีข้อมูลที่ “แตกแถว” เข้ามาในระบบ

ดังตัวอย่างในกราฟด้านบน เป็นตัวย่างการแนะนำไอเดียการใช้ Machine Learning ในการตรวจจับ “Flash Crash” หรือ การตกของราคาอย่างรวดเร็ว ของ S & P 500 ในที่นี้ กราฟสีเขียว คือ ราคาปิดของS & P 500 ส่วนกราฟสีฟ้า คือ SADF series ที่สร้างขึ้นจาก time-series ราคาปิดของ S &P 500 ซึ่งจะเห็นได้ว่า เมื่อไหร่ก็ตามที่กราฟสีฟ้าเกิดจุด Peak ขึ้นมา หมายความว่า ณ จุดนั้นคือ จุดของราคาที่มีการตก แบบ Flash Crash ที่อาจจะเกิดเป็นเวลานาน หรือ เพียงแค่ ไม่กี่ชั่วโมงก็ได้ ซึ่งถ้าดูจากกราฟราคาสีเขียว อาจจะไม่ทันได้สังเกตุ แต่ถ้าพิจารณาจากกราฟสีฟ้าแล้ว จะสังเกตุจุดของ Flash Crash ได้ชัดเจนมาก

ข้อมูล SADF series นี้เองที่คุณ Marcos แนะนำว่า สามารถ ใช้เป็นข้อมูลสอน ให้กับ Machine Learning ให้ เรียนรู้ว่าเมื่อไหร่ที่ข้อมูลมีลักษณะที่เปลี่ยนไปจากข้อมูลเดิม หรือ พูดง่ายๆ ก็คือ ใช้ Machine Learning ในการรู้จำว่า ก่อนที่จะเกิดค่า Peak ขึ้นมานั้น ข้อมูลมีลักษณะเฉพาะอย่างไร เพื่อนำไปสู่การตรวจจับการตกของราคาในอนาคตได้อย่างรวดเร็วนั่นเอง

ผู้อ่านท่านใดสนใจหัวข้อนี้ สามารถตามอ่าน paper ได้ที่




Ransac for outlier detection

ช่วงนี้เป็นคริสมาสต์ ผู้เขียนก็จะยุ่งๆ เล็กน้อย เลยขออนุญาติเขียนให้ 3 หัวข้อแรก และ ให้ paper แนะนำไป 4 paper ก่อน แล้ว part 2 จะตามมาเร็วๆ นี้ค่ะ

อัพเดต : บทความ Part 2 สามาถอ่านได้ที่ลิงก์ด้านล่างค่ะ

10 ไอเดียใช้ Machine Learning ในงาน Finance พร้อมแนะนำ paper ไปอ่านกันให้จุใจรับปีใหม่ (part 2)

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s