7 ปัจจัยอันตรายที่ทำให้กองทุนที่ใช้ Machine Learning ต้องพบจุดจบ ในมุมมองของคุณ Marcos Lopez de Prado

❌ 7 ปัจจัยอันตรายที่ทำให้กองทุนที่ใช้ Machine Learning ต้องพบจุดจบ ในมุมมองของคุณ Marcos Lopez de Prado ผู้จัดการกองทุนระดับมหายักษ์ใหญ่ ของโลกอย่าง AQR Capital และ หัวหน้ากลุ่ม วิจัย Machine Learning ของกองทุน ⚠️ เนื้อหาเชิงเทคนิคระดับสูง ในงานวิจัยของ Quants ในองกรใหญ่ อาจจะมีความซับซ้อนไปนิด แอดพยายามเขียนให้เข้าใจง่ายแล้ว ได้แค่นี้จริงๆ ค่ะ ⚠️ 1. The Sisyphean Quants (รูปที่ #1) ปัญหาข้อแรก ได้นำชื่อมาจาก “Sisyphean task” ที่เป็นเรื่องราวของชายชาวกรีกคนหนึ่งที่โดนลงโทษให้เข็ญก้อนหินก้อนมหึมาขึ้นไปบนยอดเขา ซึ่งเป็นงานที่แทบจะเป็นไปไม่ได้ การออกแรงดันทุกครั้ง ก็เพื่อที่จะพบกับการกลิ้งตกลงมาอีกครั่งของก้อนหินเท่านั้น คุณ Marcos พบว่า สาเหตุแรกเลยที่ทำให้กองทุนที่ใช้ Machine Learning ต้องประสบกับความล้มเหลว ก็คือ ปัญหาพื้นๆ ของการบริหารงาน ที่ขาดการทำงานในลักษณะของ “การร่วมมือกัน” เพื่อดึงคุณลักษณะเด่นของแต่ละบุคคลออกมาใช้…

กรองสัญญาณเทรดง่ายๆ ด้วย K-mean clustering

สวัสดีครับ ห่างหายจากการอัพบล๊อคกันไปนานมาก เนื่องจากติดภารกิจหลายเดือน วันนี้จะกลับมาเขียนอัพบล็อคตามปรกติแล้วครับ ขอถือโอกาสมาปัดฝุ่นกันด้วยไอเดียง่ายๆ ที่ใช้ในการกรองสัญญาณเทรดด้วย Machine Learning กันก่อนก็แล้วกันครับ ข้อมูล ในที่นี้เราจะใช้ ขอมูลหุ้น MSFT(microsoft corporation) เป็นตัวอย่างในการทดลองนี้นะครับ โดยใช้ข้อมูลในการทดลองตั้งแค่ปี 2016 จนถึงปี 2018 เริ่มทำงาน โดยแรกเริ่ม เราจะใช้กลยุทธ์อย่าง Trend Following แบบธรรมดาๆ คือ ใช้ Feature หรือ indicator แค่ Simple Moving Average (SMA) 2 เส้น เท่านั้น SMA1 เส้นเร็ว xx วัน โดยผมจะปรับให้สั้นเพื่อให้เกิด noise SMA2 เส้นช้า yy วัน โดยผมจะปรับให้สั้นเพื่อให้เกิด noiseเช่นกัน จากนั้น ก็ประยุกต์ใช้ไอเดียง่ายๆ ที่ทราบกันอยู่แล้วคือ ให้ SMA1…

Startup แบบไหนที่ได้ไปต่อ! ทดสอบด้วย Machine Learning

ปัจจุบันมี Startup ใหม่ๆ เกิดขึ้นทุกวันพร้อมกับไฟแห่งความหวัง แต่ใครจะรู้ว่ามี Startup ไม่น้อยที่ไฟนั้นต้องมอดไปก่อนเวลาอันควร ไม่สามารถไปให้ถึงฝั่งฝันได้ วันนี้เราจะมาดูกันค่ะ ว่าจะมีทางไหนบ้างมั้ยที่เราจะสามารถใช้ Machine Learning เข้ามาทำนายความสำเร็จหรือความอยู่รอดของ Startup หน้าใหม่ได้ ก่อนอื่นเรามาดูแหล่งข้อมูลที่เราจะนำมาใช้กันก่อนค่ะ ข้อมูลที่เราจะนำมาใช้นี้เป็นข้อมูลฟรีจากเว็บไซต์ https://angel.co/companies ซึ่งเป็นเว็บไซต์ที่ใช้ข้อมูลต่างๆ เกี่ยวกับบริษัท Startup ในหลายๆ Sectors ณ วันที่เขียนบทความนี้ (13/5/2020) ในเว็บไซต์นี้มีข้อมูลบริษัทอยู่ถึง 556,000+ บริษัทเลยทีเดียว โดยเว็บไซต์จะให้ข้อมูลรายละเอียดต่างๆ ที่จำเป็นเกี่ยวกับบริษัทในฐานะของ Startup เช่น ชื่อบริษัท วันที่เข้าร่วมในเว็บไซต์ ตำแหน่งที่ตั้ง ประเภทธุรกิน ขนาดบริษัท สถานะ และ จำนวนเงินที่บริษัทระดมทุนถึง ณ ปัจจุบัน เนื่องจากมีจำนวน Startup อยู่เป็นจำนวนมาก เราจึงจะทำการสุ่ม Startup ออกมาใช้ในการวิเคราะห์ข้อมูลเพียงบางส่วนเท่านั้น ก่อนที่จะเริ่มต้นการวิเคราะห์ข้อมูลกัน จะขอกล่าวถึงสถานะของบริษัทกันซักเล็กน้อยก่อน เพื่อให้เข้าใจข้อมูลมากขึ้นค่ะ สถานะ (Stage) ของ…

นักลงทุนคนดัง Marcos Lopez de Prado แจก 10 ไอเดียการใช้ ML ในการลงทุน (ฉบับเต็ม)

เมื่อพูดถึงการใช้ Machine Learning ในงานด้านการลงทุนแล้ว คนส่วนใหญ่มักจะนึกถึง “การทำนาย” ราคาข้องหุ้นเป็นหลัก แต่จริงๆ แล้ว Machine Learning ไม่ได้ทำได้เพียงแค่การทำนายค่าราคาเท่านั้นในการลงทุน บทความนี้จะพาไปดู ไอเดียต่างๆ ในการนำ Machine Learning มาใช้ในการด้านการลงทุน โดยการสรุปของคุณ Marcos Lopez de Prado อดีตหัวหน้าทีมนักวิจัย Machine Learning แห่ง AQR Capital และ CIO แห่ง True Positive Technologies (TPT) CIO of True Positive Technologies (TPT) มาดูกันเลยค่ะว่า 10 ทางเลือกในการใช้ Machine Learning ในการลงทุน จะมีอะไรกันบ้าง 1. การทำนายราคา (Price Prediction) ปัญหายอดฮิตของ Machine…

Machine Learning Life Cycle: 7 ขั้นตอนง่ายๆ ในการสร้างโมเดล ML

บทความนี้ เราจะมาพูดถึงวงจรการทำงานของ Machine Learning หรือ “Machine Learning Life Cycle” กันค่ะ ว่ามีขั้นตอนอะไรเข้ามาเกี่ยวข้องบ้าง และ แต่ละขั้นตอนคืออะไร ตั้งแต่การรวบรวมข้อมูล ไปจนถึงการสร้างแอพลิเคชันกันเลย “Your Idea” หรือ สิ่งที่คุณต้องการสร้าง ก่อนอื่นมาเริ่มกันที่ “idea” หรือ แนวคิด ของสิ่งที่คุณต้องการทำกันก่อนเลยค่ะ คุณมีไอเดียจะสร้าง Application ที่ทำนายอารมณ์ของคน เช่น ถ้าทำนายว่าเศร้า ระบบอาจจะเสนอทางเลือกว่า “Call a friend?” (อยากจะโทรหาเพื่อนมั้ย?) หรือ จะ “See a cute pictures” (อยากดูรูปน่ารักๆ มั้ย?) เพื่อทำให้คนๆ นั้นมีอารมณ์ที่ดีขึ้นได้ ถ้าคุณตัดสินใจใช้ ML เข้ามาช่วยในการทำงาน เราจะพาไปดูว่า คุณจะต้องทำขั้นตอนอะไรบ้าง! มาดูกันเลยค่ะ 1. กำหนดขอบเขตของปัญหา (Problem Definition) ในที่นี้เราวิเคราะห์…

ปรากฏการณ์ 26 กุมภาพันธ์ 2020 หุ้นไทยตก 72 จุดในวันเดียว!!! ใช้ Value-at-Risk ประเมินกันดีกว่า (แจก code Python)

วันที่ 26 ก.พ. 2020 ตลาดหลักทรัพย์แห่งประเทศไทยเกิดอาการ “เทกระจาด” หล่นลงวันเดียว ถึง 72.69 จุดนับเป็น นับเป็นหล่นลงวันเดียวถึง 5.05% นับเป็นความเสี่ยงอย่างหนึ่งที่นักลงทุนต้องแบกรับ แต่โชคดีที่เราที่มีวิธีการประเมินความเสี่ยงในการลงทุนเพื่อวิเคราะห์ความเสี่ยงล่วงหน้าทำให้เราสามารถวางแผนรับมือกับความเสี่ยงนี้ได้อยู่แล้ว คือ การใช้ทฎษี Value at Risk เข้ามาช่วย ดังที่เราได้เคยนำเสนอไปแล้วในบทความสองพาร์ทแรกซึ่งหาอ่านได้ที่ Value at Risk (VaR) Part 1: VaR แต่ละแบบมีข้อดีข้อเสียอย่างไร Value-at-Risk Part 2: Cornish-Fisher Expansion – Deal with Fat-tailed ในบทความนี้เราจะนำตัวอย่าง index ตลาดหลักทรัพย์ไทยมาวิเคราะห์ด้วย value at risk ทั้งสองแบบมาวิเคราะห์ให้ดูว่าเราสามารถคาดการณ์ความเสี่ยงในครั้งนี้ล่วงหน้าได้อย่างไร พร้อมทั้งแจกโค้ด python ไปให้เพื่อนๆลองทดลองดูได้อีกด้วย ก่อนอื่นเราจะอธิบายขั้นตอนคร่าวๆก่อนว่าแต่ละโค้ดแต่ล่ะส่วนที่สำคัญทำงานอย่างไรเพื่ออธิบายหลักการทำงานก่อน จากนั้นเราจะนำโค้ดทั้งหมดมาแจกในตอนท้ายของบทความ อธิบายส่วนสำคัญของโค้ด Python เริ่มต้นเราต้อง Import library…

รวมขุมทรัพย์การเรียนรู้ (ฟรี) จากนักลงทุนผู้ยิ่งใหญ่ “Ray Dalio”

คุณ Ray Dalio เป็นอีกหนึ่งนักลงทุนที่มีอุปนิสัยชื่นชอบ “การจดบันทึก” มากเป็นพิเศษ ถึงกับเคยกล่าวไว้ว่า เป็นเวลานานกว่า 30 ปี มาแล้วที่ตนเองทำการจดบันทึกการเรียนรู้ และ ประสบการณ์ในเรื่องต่างๆ เอาไว้อย่างละเอียด และ ใช้เป็นแนวทางในการดำเนินชีวิตมาตลอด ซึ่งสามารถเห็นได้จากความละเอียดของหนังสือ “Principles” ที่เจ้าตัวเขียนขึ้นเองเพื่อบอกเล่าหลักการในชีวิตของตน ที่มีส่วนนำพาให้ทั้งชีวิตส่วนตัว หน้าที่การงาน รวมไปถึงบริษัท “Bridgewater” ประสบความสำเร็จอย่างสูง โดยหวังว่าหลักการต่างๆ ที่เจ้าตัวค้นพบ และ ยึดถือเป็นแนวทางมาตลอดนี้จะช่วยให้ผู้อ่านประสบความสำเร็จได้เช่นกัน บทความนี้จึงขอรวบรวม ความรู้และหลักการต่างๆ ที่คุณ Ray Dalio นำเสนอเอาไว้ทั้งผ่านสื่อต่างๆ ไม่ว่าจะเป็น หนังสือ วิดีโอ หรือ บทสัมภาษณ์ต่างๆ สามารถหาฟัง หาอ่านได้ฟรี! เอาไว้ให้ผู้ที่สนใจได้ติดตามกันค่ะ 3-VDOs มาเริ่มกันจากวีดีโอกันก่อนค่ะ คุณ Dalio ไม่ใช่คนที่จัดทำวิดีโอออกมามากมายนัก แต่เมื่อทำออกมาแล้ว แต่ละวีดีโอก็ได้รับความสนใจอย่างล้นหลาม มีจำนวนการเข้าชมมากกว่า 17 ล้านครั้ง (นับถึงปีเดือน มิถุนายน 2562)…

10 ไอเดียใช้ Machine Learning ในงาน Finance พร้อมแนะนำ paper ไปอ่านกันให้จุใจรับปีใหม่ (part 2)

เมื่อพูดถึงการใช้ Machine Learning ในงานด้านการลงทุนแล้ว คนส่วนใหญ่มักจะนึกถึง “การทำนาย” ราคาข้องหุ้นเป็นหลัก แต่จริงๆ แล้ว Machine Learning ไม่ได้ทำได้เพียงแค่การทำนายค่าราคาเท่านั้นในการลงทุน บทความนี้จะพาไปดู ไอเดียต่างๆ ในการนำ Machine Learning มาใช้ในการด้านการลงทุน โดยการสรุปของคุณ Marcos Lopez de Prado อดีตหัวหน้าทีมนักวิจัย Machine Learning แห่ง AQR Capital และ CIO แห่ง True Positive Technologies (TPT) CIO of True Positive Technologies (TPT) มาดูกันเลยค่ะว่า 10 ทางเลือกในการใช้ Machine Learning ในการลงทุน จะมีอะไรกันบ้าง บทความที่แล้ว เราได้เขียนเกี่ยวกับไอเดียการใช้ Machine Learning ใน 3…

10 ไอเดียใช้ Machine Learning ในงาน Finance พร้อมแนะนำ paper ไปอ่านกันให้จุใจรับปีใหม่ (part 1)

เมื่อพูดถึงการใช้ Machine Learning ในงานด้านการลงทุนแล้ว คนส่วนใหญ่มักจะนึกถึง “การทำนาย” ราคาข้องหุ้นเป็นหลัก แต่จริงๆ แล้ว Machine Learning ไม่ได้ทำได้เพียงแค่การทำนายค่าราคาเท่านั้นในการลงทุน บทความนี้จะพาไปดู ไอเดียต่างๆ ในการนำ Machine Learning มาใช้ในการด้านการลงทุน โดยการสรุปของคุณ Marcos Lopez de Prado อดีตหัวหน้าทีมนักวิจัย Machine Learning แห่ง AQR Capital และ CIO แห่ง True Positive Technologies (TPT) CIO of True Positive Technologies (TPT) มาดูกันเลยค่ะว่า 10 ทางเลือกในการใช้ Machine Learning ในการลงทุน จะมีอะไรกันบ้าง 1. Price Prediction (การทำนายราคา) ปัญหายอดฮิตของ Machine…

Value-at-Risk Part 2: Cornish-Fisher Expansion – Deal with Fat-tailed

วันนี้เรามาต่อกันที่เรื่อง Value at Risk แบบที่ 3 ที่เรียกว่า “Semi Parameter Approach” กันครับ ผู้อ่านท่านใดสนใจบทความเรื่อง Value-at_Risk: part 1 ซึ่งพูดถึง VaR ใน 2 แบบแรก สามารถตามอ่านได้ที่ลิงก์ด้านล่างครับ ประเมินความเสี่ยงด้วย Value at Risk (VaR) แต่ละแบบมีข้อดีข้อเสียอย่างไร ปัญหาของสองแบบแรก ปัญหาของการประเมินสองแบบแรกที่กล่าวถึงในบทความที่ผ่านมา ประเมินความเสี่ยงด้วย Value at Risk (VaR) ก็คือ แบบ Historical มีปัญหาเรื่องการใช้ดาต้าอย่างเดียวในการอธิบายมันจึงไม่มีการตั้งสมมุติฐานใดๆ การประเมินสามารถกระโดดได้มากช่วงปลายการแจกแจง แบบ Parametric เราจะต้องมีการสร้างโมเดล โดยตั้งสมมุติฐานว่าดาต้ามีการแจกแจงแบบใดซักแบบหนึง สมมุติว่าเราใช้ Gaussian distribution มันก็จะมีการใช้ Parameter ในการประเมิน โดยคิดว่าข้อมูลที่เราประเมินเป็น Gaussian ตลอด ถ้าเราตั้งไว้ว่าเป็น Student distribution…

Deep Learning กับการช่วยอนุรักษ์วาฬ ใน “Saving Whale Project”

บทความนี้ เราจะมาทำความรู้กับอีกหนึ่งโครงการที่มีการนำ Machine Learning มาใช้เพื่อแก้ปัญหาที่เกิดขึั้นจริง เพื่อแก้ปัญหาการสูญพันธ์ของปลาวาฬหายากกัน ก่อนอื่นเรามาดูจุดเริ่มต้นของปัญหากันก่อนค่ะ ปัญหา จะมีซักกี่คนที่รู้ว่า สัตว์เลี้ยงลูกด้วยนมขนาดมหึมาอย่าง “วาฬ” หรือ ที่นิยมเรียกกันติดปากว่า “ปลาวาฬ” ซึ่งจริงๆ แล้ว ไม่ใช่ปลา เพียงแค่อาศัยอยู่ในน้ำเท่านั้น! เป็นสิ่งมีชีวิตที่ “ใกล้” จะสูญพันธ์ โดยเฉพาะวาฬสายพันธ์ที่หายากต่างๆ เช่น Narwhal, North Atlantic Right Whale, Sei Whale มาดูตัวอย่างหน้าตาวาฬที่ได้รับการจัดว่ากำลังเสี่ยงต่อการสูญพันธุ์ โดย WWF (World Wide Fund for Nature) กันก่อนค่ะ ดังนั้น จึงต้องมีกลุ่มนักอนุรักษ์ที่คอยสอดส่องดูแลเจ้าวาฬเหล่านี้อย่างใกล้ชิด แต่ปัญหามันอยู่ที่ว่า เจ้าสัตว์โลกตัวมหึมาเหล่านี้ อาศัยอยู่ในทะเล ถึงแม้จะต้องขึ้นมาหายใจที่ผิวน้ำ แต่ก็ไม่ได้โผล่ขึ้นมาให้เราเห็นทั้งตัว และ ไม่ได้โผล่ขึ้นมาบ่อยๆ แล้วนักอนุรักษ์จะรู้ได้ยังไงล่ะ ว่าตัวไหน เป็นตัวไหน และ จำนวนของพวกมันเพิ่มขึ้น หรือ ลดลงอย่างไร???…

ประเมินความเสี่ยงด้วย Value at Risk (VaR) Part 1: VaR แต่ละแบบมีข้อดีข้อเสียอย่างไร

ความจริงเรื่องนี้ผมเคยเขียนไปเมื่อ 2-3 ปีก่อนแล้ววันนี้มีโอกาสผมขอนำกลับมาเขียนให้เป็นระบบและครอบคลุมขึ้นนะครับ Value at Risk (VaR) คืออะไร VaR คือ “โมเดลที่ใช้ในการประเมินความเสี่ยง” ของพอร์ตฟอลิโอวิธีหนึ่ง ที่ถูกนำมาใช้เพื่อตอบคำถามประเภทที่ ในช่วงเวลาหนึ่งๆ พอร์ตฟอลิโอของเราจะมีโอกาสเสียเงินได้มากเท่าไหร่ ที่ระดับความเชื่อมั่น (Confident Level) แค่ไหน ตัวอย่าง เช่น “จากข้อมูลรายเดือนที่เราของหุ้น ABC เป็นเวลา 30 ปี เรามีความมั่นใจ 95% ว่าถ้าเราถือหุ้นตัวนี้ไว้ในพอร์ตฟอลิโอของเรา หุ้นตัวนี้จะไม่ลดลงเกินกว่า 4% ในช่วงเวลา 1 เดือน” พูดง่ายๆคือ “มีโอกาสแค่ 5% ที่หุ้น ABC จะลดลงเกินกว่า 4% ในช่วง 1 เดือน” นั่นเองเป็น “VaR” เป็นโมเดลที่ใช้กันอย่างแพร่หลายในการวิเคราะห์ความเสี่ยง และวิธีการคำนวณ VaR ก็มีหลายวิธี ซึ่งผมจะแยกประเภท ดังนี้ Non-Parametric วิธีการที่ไม่ต้องใช้ตัวแปรใดๆ ใช้แค่…

การรู้จำรูปแบบสำหรับข้อมูลแบบตามลำดับเวลาด้วย Hidden Markov Model (Pattern Recognition with Sequential Data using HMM)

การค้นพบ “รูปแบบ” หรือ “Patterns” ที่ซ่อนอยู่ภายในข้อมูล เป็นอีกสาขาวิชาที่น่าสนใจ และ มีความท้าทายเป็นอย่างมาก เนื่องจากในปัจจุบันนี้ที่เรากำลังใช้ชีวิตอยู่ในโลกของข้อมูล ซึ่งเรากำลังพูดถึงข้อมูลจำนวนมหาศาล (ต้องขอคุณเทคโนโลยีในการเก็บข้อมูลที่ก้าวล้ำอย่างรวดเร็วไว้ ณ ที่นี้ด้วย!) ข้อมูลถูกเก็บบันทึก แทบจะทุกที่ทุกเวลา ไม่มีใครสามารถวิ่งหนีกระบวนการนี้ได้เลย “Data” หรือ “ข้อมูล” ถือเป็นสิ่งที่มีคุณค่ามหาศาล การมีข้อมูล ถูกเรื่อง ถูกเวลา นั้น ถึงขนาดเปลี่ยนยาจกเป็นเศรษฐี เปลี่ยนขาวเป็นดำ ได้เลยทีเดียว! แต่ถึงอย่างนั้นก็ตาม “ข้อมูล” นี้ จะกลายเป็นแค่ “ขยะไซเบอร์” ทันที ถ้ามันไม่ได้ถูกนำมาใช้งานอย่างถูกต้อง จุดนี้นี่เองที่ทำให้การศึกษาในสาขา “Pattern Recognition” หรือ การระบุรูปแบบที่ซ่อนอยู่ภายในข้อมูล ได้รับความสนใจเป็นอย่างมาก เพราะสามารถขุดค้นเอา “ความรู้” ที่ซ่อนอยู่ในข้อมูล เพื่อนำไปสู่การใช้งานอย่างเหมาะสมได้ “Pattern Recognition” มีด้วยกันมากมายหลากหลายรูปแบบมาก ขึ้นอยู่กับลักษณะการใช้งาน ระบบ Pattern Recognition ยกตัวอย่างระบบที่เราคุ้นเคยกัน เช่น ระบบรู้จำใบหน้า (Face…