กรองสัญญาณเทรดง่ายๆ ด้วย K-mean clustering

สวัสดีครับ ห่างหายจากการอัพบล๊อคกันไปนานมาก เนื่องจากติดภารกิจหลายเดือน วันนี้จะกลับมาเขียนอัพบล็อคตามปรกติแล้วครับ ขอถือโอกาสมาปัดฝุ่นกันด้วยไอเดียง่ายๆ ที่ใช้ในการกรองสัญญาณเทรดด้วย Machine Learning กันก่อนก็แล้วกันครับ ข้อมูล ในที่นี้เราจะใช้ ขอมูลหุ้น MSFT(microsoft corporation) เป็นตัวอย่างในการทดลองนี้นะครับ โดยใช้ข้อมูลในการทดลองตั้งแค่ปี 2016 จนถึงปี 2018 เริ่มทำงาน โดยแรกเริ่ม เราจะใช้กลยุทธ์อย่าง Trend Following แบบธรรมดาๆ คือ ใช้ Feature หรือ indicator แค่ Simple Moving Average (SMA) 2 เส้น เท่านั้น SMA1 เส้นเร็ว xx วัน โดยผมจะปรับให้สั้นเพื่อให้เกิด noise SMA2 เส้นช้า yy วัน โดยผมจะปรับให้สั้นเพื่อให้เกิด noiseเช่นกัน จากนั้น ก็ประยุกต์ใช้ไอเดียง่ายๆ ที่ทราบกันอยู่แล้วคือ ให้ SMA1…

Startup แบบไหนที่ได้ไปต่อ! ทดสอบด้วย Machine Learning

ปัจจุบันมี Startup ใหม่ๆ เกิดขึ้นทุกวันพร้อมกับไฟแห่งความหวัง แต่ใครจะรู้ว่ามี Startup ไม่น้อยที่ไฟนั้นต้องมอดไปก่อนเวลาอันควร ไม่สามารถไปให้ถึงฝั่งฝันได้ วันนี้เราจะมาดูกันค่ะ ว่าจะมีทางไหนบ้างมั้ยที่เราจะสามารถใช้ Machine Learning เข้ามาทำนายความสำเร็จหรือความอยู่รอดของ Startup หน้าใหม่ได้ ก่อนอื่นเรามาดูแหล่งข้อมูลที่เราจะนำมาใช้กันก่อนค่ะ ข้อมูลที่เราจะนำมาใช้นี้เป็นข้อมูลฟรีจากเว็บไซต์ https://angel.co/companies ซึ่งเป็นเว็บไซต์ที่ใช้ข้อมูลต่างๆ เกี่ยวกับบริษัท Startup ในหลายๆ Sectors ณ วันที่เขียนบทความนี้ (13/5/2020) ในเว็บไซต์นี้มีข้อมูลบริษัทอยู่ถึง 556,000+ บริษัทเลยทีเดียว โดยเว็บไซต์จะให้ข้อมูลรายละเอียดต่างๆ ที่จำเป็นเกี่ยวกับบริษัทในฐานะของ Startup เช่น ชื่อบริษัท วันที่เข้าร่วมในเว็บไซต์ ตำแหน่งที่ตั้ง ประเภทธุรกิน ขนาดบริษัท สถานะ และ จำนวนเงินที่บริษัทระดมทุนถึง ณ ปัจจุบัน เนื่องจากมีจำนวน Startup อยู่เป็นจำนวนมาก เราจึงจะทำการสุ่ม Startup ออกมาใช้ในการวิเคราะห์ข้อมูลเพียงบางส่วนเท่านั้น ก่อนที่จะเริ่มต้นการวิเคราะห์ข้อมูลกัน จะขอกล่าวถึงสถานะของบริษัทกันซักเล็กน้อยก่อน เพื่อให้เข้าใจข้อมูลมากขึ้นค่ะ สถานะ (Stage) ของ…

นักลงทุนคนดัง Marcos Lopez de Prado แจก 10 ไอเดียการใช้ ML ในการลงทุน (ฉบับเต็ม)

เมื่อพูดถึงการใช้ Machine Learning ในงานด้านการลงทุนแล้ว คนส่วนใหญ่มักจะนึกถึง “การทำนาย” ราคาข้องหุ้นเป็นหลัก แต่จริงๆ แล้ว Machine Learning ไม่ได้ทำได้เพียงแค่การทำนายค่าราคาเท่านั้นในการลงทุน บทความนี้จะพาไปดู ไอเดียต่างๆ ในการนำ Machine Learning มาใช้ในการด้านการลงทุน โดยการสรุปของคุณ Marcos Lopez de Prado อดีตหัวหน้าทีมนักวิจัย Machine Learning แห่ง AQR Capital และ CIO แห่ง True Positive Technologies (TPT) CIO of True Positive Technologies (TPT) มาดูกันเลยค่ะว่า 10 ทางเลือกในการใช้ Machine Learning ในการลงทุน จะมีอะไรกันบ้าง 1. การทำนายราคา (Price Prediction) ปัญหายอดฮิตของ Machine…

Machine Learning Life Cycle: 7 ขั้นตอนง่ายๆ ในการสร้างโมเดล ML

บทความนี้ เราจะมาพูดถึงวงจรการทำงานของ Machine Learning หรือ “Machine Learning Life Cycle” กันค่ะ ว่ามีขั้นตอนอะไรเข้ามาเกี่ยวข้องบ้าง และ แต่ละขั้นตอนคืออะไร ตั้งแต่การรวบรวมข้อมูล ไปจนถึงการสร้างแอพลิเคชันกันเลย “Your Idea” หรือ สิ่งที่คุณต้องการสร้าง ก่อนอื่นมาเริ่มกันที่ “idea” หรือ แนวคิด ของสิ่งที่คุณต้องการทำกันก่อนเลยค่ะ คุณมีไอเดียจะสร้าง Application ที่ทำนายอารมณ์ของคน เช่น ถ้าทำนายว่าเศร้า ระบบอาจจะเสนอทางเลือกว่า “Call a friend?” (อยากจะโทรหาเพื่อนมั้ย?) หรือ จะ “See a cute pictures” (อยากดูรูปน่ารักๆ มั้ย?) เพื่อทำให้คนๆ นั้นมีอารมณ์ที่ดีขึ้นได้ ถ้าคุณตัดสินใจใช้ ML เข้ามาช่วยในการทำงาน เราจะพาไปดูว่า คุณจะต้องทำขั้นตอนอะไรบ้าง! มาดูกันเลยค่ะ 1. กำหนดขอบเขตของปัญหา (Problem Definition) ในที่นี้เราวิเคราะห์…

10 ไอเดียใช้ Machine Learning ในงาน Finance พร้อมแนะนำ paper ไปอ่านกันให้จุใจรับปีใหม่ (part 2)

เมื่อพูดถึงการใช้ Machine Learning ในงานด้านการลงทุนแล้ว คนส่วนใหญ่มักจะนึกถึง “การทำนาย” ราคาข้องหุ้นเป็นหลัก แต่จริงๆ แล้ว Machine Learning ไม่ได้ทำได้เพียงแค่การทำนายค่าราคาเท่านั้นในการลงทุน บทความนี้จะพาไปดู ไอเดียต่างๆ ในการนำ Machine Learning มาใช้ในการด้านการลงทุน โดยการสรุปของคุณ Marcos Lopez de Prado อดีตหัวหน้าทีมนักวิจัย Machine Learning แห่ง AQR Capital และ CIO แห่ง True Positive Technologies (TPT) CIO of True Positive Technologies (TPT) มาดูกันเลยค่ะว่า 10 ทางเลือกในการใช้ Machine Learning ในการลงทุน จะมีอะไรกันบ้าง บทความที่แล้ว เราได้เขียนเกี่ยวกับไอเดียการใช้ Machine Learning ใน 3…

10 ไอเดียใช้ Machine Learning ในงาน Finance พร้อมแนะนำ paper ไปอ่านกันให้จุใจรับปีใหม่ (part 1)

เมื่อพูดถึงการใช้ Machine Learning ในงานด้านการลงทุนแล้ว คนส่วนใหญ่มักจะนึกถึง “การทำนาย” ราคาข้องหุ้นเป็นหลัก แต่จริงๆ แล้ว Machine Learning ไม่ได้ทำได้เพียงแค่การทำนายค่าราคาเท่านั้นในการลงทุน บทความนี้จะพาไปดู ไอเดียต่างๆ ในการนำ Machine Learning มาใช้ในการด้านการลงทุน โดยการสรุปของคุณ Marcos Lopez de Prado อดีตหัวหน้าทีมนักวิจัย Machine Learning แห่ง AQR Capital และ CIO แห่ง True Positive Technologies (TPT) CIO of True Positive Technologies (TPT) มาดูกันเลยค่ะว่า 10 ทางเลือกในการใช้ Machine Learning ในการลงทุน จะมีอะไรกันบ้าง 1. Price Prediction (การทำนายราคา) ปัญหายอดฮิตของ Machine…

Deep Learning กับการช่วยอนุรักษ์วาฬ ใน “Saving Whale Project”

บทความนี้ เราจะมาทำความรู้กับอีกหนึ่งโครงการที่มีการนำ Machine Learning มาใช้เพื่อแก้ปัญหาที่เกิดขึั้นจริง เพื่อแก้ปัญหาการสูญพันธ์ของปลาวาฬหายากกัน ก่อนอื่นเรามาดูจุดเริ่มต้นของปัญหากันก่อนค่ะ ปัญหา จะมีซักกี่คนที่รู้ว่า สัตว์เลี้ยงลูกด้วยนมขนาดมหึมาอย่าง “วาฬ” หรือ ที่นิยมเรียกกันติดปากว่า “ปลาวาฬ” ซึ่งจริงๆ แล้ว ไม่ใช่ปลา เพียงแค่อาศัยอยู่ในน้ำเท่านั้น! เป็นสิ่งมีชีวิตที่ “ใกล้” จะสูญพันธ์ โดยเฉพาะวาฬสายพันธ์ที่หายากต่างๆ เช่น Narwhal, North Atlantic Right Whale, Sei Whale มาดูตัวอย่างหน้าตาวาฬที่ได้รับการจัดว่ากำลังเสี่ยงต่อการสูญพันธุ์ โดย WWF (World Wide Fund for Nature) กันก่อนค่ะ ดังนั้น จึงต้องมีกลุ่มนักอนุรักษ์ที่คอยสอดส่องดูแลเจ้าวาฬเหล่านี้อย่างใกล้ชิด แต่ปัญหามันอยู่ที่ว่า เจ้าสัตว์โลกตัวมหึมาเหล่านี้ อาศัยอยู่ในทะเล ถึงแม้จะต้องขึ้นมาหายใจที่ผิวน้ำ แต่ก็ไม่ได้โผล่ขึ้นมาให้เราเห็นทั้งตัว และ ไม่ได้โผล่ขึ้นมาบ่อยๆ แล้วนักอนุรักษ์จะรู้ได้ยังไงล่ะ ว่าตัวไหน เป็นตัวไหน และ จำนวนของพวกมันเพิ่มขึ้น หรือ ลดลงอย่างไร???…

ว่าด้วย Recurrent Neural Networks: Part 1

ไม่ได้เขียนบล็อคซะนานเนื่องจากป่วยไปพักใหญ่ ตอนนี้กลับมา จะเริ่มกลับมาเขียนแล้วครับ โดยเรื่องที่ผมคิดไว้คราวนี้จะเป็น “การทำนายอนาคตของข้อมูล Time series” ครับ เพราะเป็นช่วงเวลาที่พอดีกับที่ผมต้องสรุปผลการทดลองส่งแลปพอดีครับ เลยจะขีด ๆ เขียน ๆ ตามไปด้วยเลยก็แล้วกัน ในยุคที่ Deep Learning กำลังครองโลกอยู่นี้ก็คงหลีกเลี่ยงไม่ได้ที่จะต้องกล่าวถึง Recurrent Neural Network (RNN) แต่ก่อนจะไปถึงจุดนั้นเราจะเริ่มจากอะไรที่เบสิก ๆ ก่อน โดยบทความแรกจะเริ่มตั้งแต่เรื่องพื้นฐาน ว่าด้วย Neural Network จาก Linear regression ไปจนถึง Simple Recurrent Neural Network (Simple RNN) Time series และ Simple Neural Network ข้อมูลของเราจะเป็น “Time series” หรือ “อนุกรมเวลา” ได้ ก็ต่อเมื่อ “มีอินเด็กซ์เวลา” มาเกี่ยวข้องนั่นแหละครับ ตัวอย่างเช่น…

Big Data and Machine Learning อนาคตของโลกแห่งการลงทุน!

วันนี้มีบทความจั่วหัวร้อนแรงอย่าง “Go with big data and machine learning, or leave finance to thouse who do!” หรือ ที่แปลเป็นภาษาไทยแบบแสบๆ คัน ว่า “จะใช้ Big data และ Machine Learning ในงานไฟแนนซ์ หรือ ปล่อยเรื่องไฟแนนซ์ให้คนที่ทำได้เค้าทำกัน!” เป็นบทความที่จั่วหัวได้รุนแรงอีกบทความหนึ่งเลยค่ะ เห็นได้ชัดว่าผู้เขียนอย่าง David H Bailey นักวิจัยอาวุโส สาย คณิตศาสตร์ และ คอมพิวเตอร์ ได้แสดงความเชื่อออกมาเต็มที่ว่า Big Data และ Machine Learning จะเป็นอนาคตของงานด้านไฟแนนซ์ รวมถึงการลงทุน อย่างแน่นอน ถึงขนาดที่ว่าใครไม่ลุกขึ้นมาเรียนรู้ ก็จะต้องเดินออกจากสายงานกันไปเลยทีเดียว! เพื่อลดบรรยากาศแห่งความร้อนแรงนี้ ผู้เขียนจึงจะขอเป็นเพียงผู้เล่าให้ฟัง และ เพิ่มเติมข้อมูลในบางส่วนที่น่าสนใจ โดยจะไม่เพิ่มเติมความคิดเห็นส่วนตัวลงไปนะคะ เพียงแค่เห็นว่า…

[Reinforcement Learning 101] ตะลุยคาสิโนด้วย RL: Muti-Armed Bandit (2)- UCB1

จากบทความที่แล้ว เราได้พาไปดูการกำหนดปัญหา การไปเล่น Slot machine ที่คาสิโนของเราและได้หาวิธีการประเมินโอกาสชนะของเครื่อง Slot machine ด้วยวิธีการ Epsilon greedy มาแล้วและได้เปรียบเทียบผลลัพธ์ดู นับว่าทำงานได้ดีประมาณหนึง เอาเข้าจริงๆวิธีการนั้นก็ไม่ได้เป็นอะไรมากไปกว่าการคำนวณ mean ของแต่ละเครื่องผ่านการเล่น Slot machine แต่ละรอบๆเสริมด้วยวิธีการสุ่มเล่นเครื่อง Slot machine บ้างเป็นครั้งคราวเท่านั้นเอง วันนี้เราจะมาดูสมการคณิตศาสตร์ที่ซับซ้อนขึ้นมาอีกนิดหนึง(นิดเดียว) UCB1 ตัวนี้ก็ใช้ในการประเมิน mean ตัวหนึงทำหน้าที่เหมือน Epsilon greedy แต่วิธีการทำนั้นต่างกัน เนื่องจากเราจะแก้ปัญหาเดิม ก่อนอื่นผมขอนำ โอกาสในการชนะของ Slot machine มาแปะกันอีกครั้งนะครับ ​เครื่องที่ 1 มี win rate 10% ต่อการเล่นแต่ละครั้ง เครื่องที่ 2 มี win rate 20% ต่อการเล่นแต่ละครั้ง เครื่องที่ 3 มี win rate 50%…

[Reinforcement Learning 101] ตะลุยคาสิโนด้วย RL: Muti-Armed Bandit (1)- Epsilon Greedy

วันนี้เรามาพูดถึงโมเดลเบื้องต้นของ Reinforcement Learning กันบ้างครับ โดยเราจะเริ่มตั้งแต่แบบเบื้องต้นกันครับ จุดประสงค์ของการไป Casino สมมุติว่าเราไป Casino​ เป้าหมายของเราคืออะไร ก็คงไม่หาเงินจากการเล่นพันให้มากที่สุด แล้วเราเดินไปเล่นเครื่องเล่น Slot Machine ที่ในห้องนั้นมีอยู่ 3 เครื่อง โอกาสชนะ(win rate)ในแต่ละเครื่องไม่เท่ากัน​แต่เราน่ะไม่รู้หรอกว่าเครื่องไหนมี win rate เท่าไหร่บ้าง สมมุติอีกว่าเครื่อง Slot Machine ของ Casino นี้เมื่อเราเข้าไปเล่นแต่ละครั้ง ถ้าชนะเราจะได้เงิน 1 เหรียญ ถ้าแพ้ก็จะได้ 0 เหรียญ  แต่ละเครื่องมี win rate ไม่เท่ากันดังนี้ ​เครื่องที่ 1 มี win rate 10% ต่อการเล่นแต่ละครั้ง เครื่องที่ 2 มี win rate 20% ต่อการเล่นแต่ละครั้ง เครื่องที่ 3 มี win rate 50%…

Decision Tree in Stock market

Decision Tree หรือ ต้นไม้การตัดสินใจ เป็นอีกหนึ่งอัลกอริทึ่มที่ได้รับความสนใจกันอย่างแพร่หลาย เนื่องจากสามารถเข้าใจ และ มองเห็นภาพได้ง่าย ก่อนจะลงไปในรายละเอียดกัน ขอยกตัวอย่างต้นไม้การตัดสินใจในปัญหาทั่วๆ ไป มาให้ดูกันซักหนึ่งตัวอย่างก่อนนะคะ ตัวอย่าง Decision Tree Decision Tree สำหรับการพิจารณาให้เงินกู้ จากรูปด้านบนเป็นตัวอย่าง Decision Tree ง่ายๆ ที่ใช้ในการพิจารณา อนุมัติเงินกู้ (Loan) หรือ ไม่อนุมัติ (No Loan) การสร้างต้นไม้ด้านบน ก็จะเริ่มมาจากการวิเคราะห์ข้อมูลการอนุมัติเงินกู้ในอดีตในรูปของตาราง และทำการคำนวณหาจุดตัดข้อมูลที่ดีที่สุด เพื่อนำมาใช้ในการสร้างเงื่อนไข หรือ โหนด (nodes) เพื่อใช้ในการสร้าง Tree การเลือกโหนดก็จะมีการคำนวณค่าทางคณิตศาสตร์โหนดไหน ถ้าทำการเลือกแล้วจะทำหน้าที่ในการแบ่งข้อมูลได้ดีที่สุด ค่าที่ใช้ในการคำนวณ มีหลายแบบ ตัวอย่างเช่น ค่า Information gain เป็นต้น ในบทความนี้จะไม่ของลงรายละเอียดในการคำนวณนะคะ เนื่องจากเป้าหมายของบทความคือ การนำ Decision Tree มาประยุกต์ใช้กับการเทรด จึงอยากจะขอเน้นในด้านการนำมาประยุกต์ใช้แล้วได้ผลลัพธ์เป็นอย่างไรมากกว่าค่ะ Decision…