7 ปัจจัยอันตรายที่ทำให้กองทุนที่ใช้ Machine Learning ต้องพบจุดจบ ในมุมมองของคุณ Marcos Lopez de Prado

❌ 7 ปัจจัยอันตรายที่ทำให้กองทุนที่ใช้ Machine Learning ต้องพบจุดจบ ในมุมมองของคุณ Marcos Lopez de Prado ผู้จัดการกองทุนระดับมหายักษ์ใหญ่ ของโลกอย่าง AQR Capital และ หัวหน้ากลุ่ม วิจัย Machine Learning ของกองทุน ⚠️ เนื้อหาเชิงเทคนิคระดับสูง ในงานวิจัยของ Quants ในองกรใหญ่ อาจจะมีความซับซ้อนไปนิด แอดพยายามเขียนให้เข้าใจง่ายแล้ว ได้แค่นี้จริงๆ ค่ะ ⚠️ 1. The Sisyphean Quants (รูปที่ #1) ปัญหาข้อแรก ได้นำชื่อมาจาก “Sisyphean task” ที่เป็นเรื่องราวของชายชาวกรีกคนหนึ่งที่โดนลงโทษให้เข็ญก้อนหินก้อนมหึมาขึ้นไปบนยอดเขา ซึ่งเป็นงานที่แทบจะเป็นไปไม่ได้ การออกแรงดันทุกครั้ง ก็เพื่อที่จะพบกับการกลิ้งตกลงมาอีกครั่งของก้อนหินเท่านั้น คุณ Marcos พบว่า สาเหตุแรกเลยที่ทำให้กองทุนที่ใช้ Machine Learning ต้องประสบกับความล้มเหลว ก็คือ ปัญหาพื้นๆ ของการบริหารงาน ที่ขาดการทำงานในลักษณะของ “การร่วมมือกัน” เพื่อดึงคุณลักษณะเด่นของแต่ละบุคคลออกมาใช้…

จัดการข้อมูลอย่าง Quants [Part2: จัดการ Missing Value และ คำนวณ Statistics สำหรับข้อมูลทั้งตลาด]

บทความชุดนี้เราจะมาเอาใจสายลงทุนกัน ด้วยบทความชุด “จัดการข้อมูลอย่าง Quants” ซึ่งจะประกอบไปด้วย 3 บทความด้วยกัน ดังนี้ 1.จัดการข้อมูลอย่าง Quants [Part 1: ดึงข้อมูลหุ้น S&P500 ทั้ง 500 ตัว] 2. หลากหลายวิธีกับการจัดการกับ “Missing Value” 3. จัดการข้อมูลอย่าง Quant [Part2: จัดการ Missing Value และ คำนวณ Statistics สำหรับข้อมูลทั้งตลาด บทความทั้งหมดจะเป็น Tutorial สำหรับผู้ที่สนใจการดึงข้อมูลหุ้นเพื่อการลงทุนแบบไม่เสียค่าใช้จ่าย! อ่านไปด้วย Coding ไปด้วยได้เลยครับ บทความที่ 3 นี้ นี้เป็นตัวต่อจากบทความที่แล้ว ฉะนั้นเราคาดหวังว่าผู้อ่านจะมีไฟล์ “sp500_data.xlsx” ที่เราทำกันมาในบทความที่ 1 กันแล้วนะครับ ถ้าท่านใดยังไม่มีไฟล์ สามารถอ่านวิธีการจัดการดาวน์โหลดข้อมูล และสร้างไฟล์ได้ที่ บทความที่ 1 “จัดการข้อมูลอย่าง Quants [Part…

จัดการข้อมูลอย่าง Quants [Part 1: ดึงข้อมูลหุ้น S&P500 ทั้ง 500 ตัวฟรี!]

บทความชุดนี้เราจะมาเอาใจสายลงทุนกัน ด้วยบทความชุด “จัดการข้อมูลอย่าง Quants” ซึ่งจะประกอบไปด้วย 3 บทความด้วยกัน ดังนี้ บทความทั้งหมดจะเป็น Tutorial สำหรับผู้ที่สนใจการดึงข้อมูลหุ้นเพื่อการลงทุนแบบไม่เสียค่าใช้จ่าย! ซึ่งจะสอนตั้งแต่การหาข้อมูล การเขียนโปรแกรมทุกขั้นตอนจนกระทั่งได้ข้อมูล .CSV พร้อมใช้งาน ไม่เพียงแค่นี้ นอกจากสอนดึงข้อมูลแล้ว เรายังสอนการจัดการกับข้อมูลเบื้องต้น การทำความสะอาดข้อมูล (Data Cleaning) เพื่อเตรียมข้อมูลให้พร้อมสำหรับการวิเคราะห์ในขั้นตอนต่อไปอีกด้วย ไปเริ่มกันเลยครับ อ่านไปด้วย Coding ไปด้วยได้เลยครับ ดึงข้อมูลหุ้นทั้ง 500 ตัวจาก S&P500 Import ไลบารี่ที่จำเป็นกันก่อน เริ่มด้วยไปที่ Wikipedia ที่ List รายชื่อหุ้นในกลุ่ม S&P500 ไว้ทั้งหมด เราใช้ฟังก์ชั่น pd.read_html เพื่ออ่านหน้าเพจจากเว็ปไซต์ https://en.wikipedia.org/wiki/List_of_S%26P_500_companies เราจะได้ list ที่ใส่ ข้อมูลในเว็ปไซต์หลายตัว แต่เราสนใจเฉพาะตารางที่บรรจุชื่อ ที่ตารางแรกเราสนใจ columns ที่ชื่อ Symbol ที่จะให้ชื่อของหุ้นทุกตัว จากนั้นเราทำด้านบนให้เป็นฟังก์ชั่น เรียกใช้ฟังก์ชั่นเก็บชื่อหุ้นใส่ตัวแปรชื่อ…

หลากหลายวิธีกับการจัดการกับ “Missing Value”

หลายวันก่อนผมไมได้รับคำถามจากผู้เรียนในคอร์สมาว่า “ถ้ามีข้อมูลที่ Missing Value แล้วเราสามารถทำอะไรได้บ้างนอกจากลบวันที่มีค่า Drop มันทิ้งไป เราสามารถ Forward Fill (เติม Missing Value ด้วยค่าล่าสุดที่เรารู้) ได้ไหม” โดยปกติ Tutorial ทั้งไทย และต่างประเทศส่วนใหญ่ มักจะนำเสนอก็คือ การดึงข้อมูลมาจากผู้ให้บริการซักเจ้า จากชั้น Check ว่ามี Missing Value aka N.A. อยู่ในข้อมูลนั้นไหม ถ้ามี ก็ Drop มันทิ้ง ซึ่งใช่ครับในคอร์ส Python for Finance เราก็สอนแค่นั้น เพราะนั่นคือ คอร์สเบื้องต้นสอนความรู้กว้างๆ ถ้าในคอร์ส AI for Investment เราสอนอีกแบบโดยการใช้ Forward Fill ซึ่งก็เป็นอีกวิธีในการจัดการกับข้อมูล Missing Value เหล่านั้นเพื่องานเฉพาะสำหรับ Project ในคอร์สนั้นๆ แต่คำถามนั้นทำให้ผมคิดได้ ว่ามันเราลืมพูดถึงเรื่องนี้ไปสนิทเลย…

ไขข้อข้องใจ “ChatGPT” เก่งขนาดนั้นจริงหรือ?

Q: “ChatGPT คือจุดเริ่มต้นของจุดจบ! โลกยังไม่พร้อมกับมัน! มันจะแย่งงานเรา! มันจะเขียนโค้ดแทนเรา! มันจะมาแทน StackOverflowหรือไม่ในการช่วยเราตอบคำถามเรื่องการเขียนโค้ด? ช่วยเราเขียนโค้ดลงทุนเก่งกว่าเราแล้ว?” A : ไม่!!! ChatGPT ไม่ใช่จุดเริ่มต้นของจุดจบอะไรทั้งนั้น เหมือนกับที่ Alpha Go ไม่ใช่ จุดเริ่มต้นของ Reinforcement Learning ฉันใด ChatGPT ก็ไม่ใช่จุดเริ่มต้นของ NLP ฉันนั้น หากแต่เป็นโมเดลต่อยอดขนาดใหญ่(GPT3)ที่น่าสนใจทั้งฉลาดมาก แต่ในขณะเดียวกันก็สามารถทำตัวโง่อวดฉลาดมากในเวลาเดียวกันเช่นครับ ถ้า ChatGPT เป็นคนซักคนหนึ่ง จินตนาการว่าเค้าจะเหมือนอะไร? ลองนึกถึงคนซักคน ที่พยายามทำตัวเป็นพหูสูตรเก่งไปทุกเรื่องซึ่งบางเรื่องก็เก่งจริง บางเรื่องไม่รู้ก็มั่วออกมาเละเทะ และสามารถพูดเรื่องที่ตัวไม่มีความเข้าใจจริงๆ ออกมาได้อย่างมั่นใจ ดูดีมีความรู้ จนใครๆต่างพากันหลงเชื่อดูซักคนครับ ผมไม่ได้มาแซะใครนะ แต่คนๆนั้นมันคือ ChatGPT เนี่ยแหละครับ ฮา ภาษาชาวบ้าน ก็คือ … “ChatGPT มันก็เหมือนคนอ่านหนังสือเล่มใหญ่ๆมา จากนั้นฟังเราถาม พยายามแปลคำถามเราเป็นภาษาตัวเอง ละก็ตอบจากหนังสือที่เค้าอ่านมาครับ“ ตั้งแต่ ChatGPT เปิดตัวออกมาเมื่อไม่นานมานี้…

สอนวิเคราะห์ข้อมูล [ฉบับจับมือทำ] ตั้งแต่เบื้องต้น ถึงการสร้างโมเดล Machine Learning ผ่านข้อมูล การ ซื้อ-ขาย ผลไม้เพื่อสุขภาพยอดฮิตอย่าง Avocado {Part 2: EDA}

บทความนี้เป็นบทความที่ 2 ของบทความชุด “สอนวิเคราะห์ข้อมูล [ฉบับจับมือทำ] ตั้งแต่เบื้องต้นถึงการสร้างโมเดล Machine Learning ผ่านข้อมูลการซื้อขายผลไม้เพื่อสุขภาพยอดฮิตอย่าง Avocado” เนื่องจากบทความชุดนี้เป็นบทความที่มีเนื้อหาต่อเนื่องกัน! ดังนั้น เพื่อให้เกิดความเข้าใจ และเป็นประโยชน์สูงสุด ขอแนะนำให้ผู้อ่านเริ่มจากบทความแรกก่อน โดยสามาถอ่านได้ที่ลิงก์ด้านล่างค่ะ บทความที่ 1 อ่านบทความแรกกันไปแล้ว ก็พร้อมแล้วสำหรับเนื้อหาของบทความที่ 2 นี้ ไปเริ่มกันเลยค่ะ อะไรคือ EDA EDA หรือ Exploratory Data Analysis คือ กระบวนการสำรวจข้อมูลเบื้องต้นที่จำเป็น ก่อนที่จะเริ่มการวิเคราะห์ข้อมูลในเชิงลึกแบบอื่นๆ เช่น การทำนายข้อมูล (Predictive) การทำ EDA จะทำการสำรวจข้อมูลในหลายๆ แง่มุม ทั้งในรูปแบบการสำรวจโดยแยกเป็นแต่ละประเภทของข้อมูล และ นำไปสู่การสำรวจความสัมพันธ์ระหว่างตัวแปรที่เกี่ยวข้องในข้อมูลนั้นๆ โดยประโยชน์ของ EDA คือ การมีความเข้าใจข้อมูล และความสำพันธ์ของตัวแปรที่เกี่ยวข้องมากขึ้น หรือ เรียกว่าการหา Insights ของข้อมูล นั่นเอง การทำ EDA…

สอนวิเคราะห์ข้อมูล [ฉบับจับมือทำ] ตั้งแต่เบื้องต้น ถึงการสร้างโมเดล Machine Learning ผ่านข้อมูล การ ซื้อ-ขาย ผลไม้เพื่อสุขภาพยอดฮิตอย่าง Avocado {Part 1: Descriptive Analysis}

อะโวคาโด้ (Avocado) เป็นผลไม้เพื่อสุขภาพที่กำลังได้รับความนิยมเป็นอย่างมาก ทานก็อร่อย เอาข้อมูลมาวิเคราะห์ก็สนุก 🙂 จากการที่เป็นหนึ่งในผลไม้ยอดฮิต ที่มีราคาสูงเป็นอันดับต้นๆ จึงมีการเก็บข้อมูลผลผลิต ข้อมูลราคา และการซื้อขาย อย่างแพร่หลาย เพื่อให้ได้ประโยชน์จากการค้าอะโวคาโด้มากที่สุด เราจึงจับเอาข้อมูลราคา และการซื้อขายเจ้าอะโวคาโด้มาเป็นตัวแทน เพื่อสอนการวิเคราะห์ข้อมูลตั้งแต่เบื้องต้น ไปจนถึงสามารถสร้างโมเดลเพื่อทำนายข้อมูลด้วย Machine Learning ได้ เนื่องจากการวิเคราะห์ข้อมูลมีรายละเอียดค่อนข้างมาก จึงจัดแบ่งหัวข้อ และ บทความออกเป็นส่วนๆ ดังนี้ Part 1: การอ่านข้อมูล ทำความสะอาดเบื้องต้น และการวิเคราะห์ข้อมูลเชิงบรรยาย (Descriptive Analysis) Part 2: การวิเคราะห์ข้อมูลเพื่อสำรวจข้อมูลในเชิงความสัมพันธ์ EDA (Exploratory data analysis) เพื่อค้นหาลักษณะเฉพาะของข้อมูล และทดสอบสมมุติฐานเบื้องต้น Part 3: การวิเคราะห์ข้อมูลเชิงลึก และการสร้างโมเดลในการทำนายข้อมูลด้วย Machine Learning มาเริ่มกันเลยดีกว่าค่ะ 1. โหลด Library ที่จำเป็น General libraries ไลบรารี่พื้นฐานต่างๆ…

ยาวไป ไม่อ่าน! มาใช้ “Transformer Model” ย่อข่าวสารการลงทุนให้เรากันดีกว่า

ในยุคของข้อมูลข่าวสารที่กว้างใหญ่และมีการเชื่อมต่อกันมากมายขนาดนี้ สิ่งที่เราหลีกหนีไม่ได้เลยก็คือ “ข้อมูลท่วม” ครับ ไม่ว่าเราอยากจะศึกษาอะไรซักอย่างหนึง เราไปหาในกูเกิลก็จะเห็นว่า ผลการค้นหามันเยอะเหลือเกิน เช่น ถ้าเราอยากจะตามดราม่าในทวิตเตอร์ มันก็เยอะเหลือเกิน เราอยากจะประเมินข่าวเกี่ยวกับบริษัทที่เราสนใจ ข่าวมันก็ท่วมหัว สุดวิสัยที่เราจะมานั่งอ่านมันให้หมดได้จริงๆ สุดท้ายข้อมูลที่เราอุส่าไปค้นหามารวมกัน ก็มากองทับกับเป็น “กองดอง” อันเป็นที่รู้กันของคนชอบอ่านหนังสือ มันจะดีกว่าไหม ถ้าเราสามารถตัดสินใจได้ว่า อะไรกันแน่ที่สำคัญต่อเราจริงๆ ทำให้ข้อมูลมันสั้นๆ กระชับ แต่ได้ใจความ เพื่อให้เราได้นำไปใช้ตัดสินใจในเรื่องที่เราสนใจต่อไป วันนี้เราเลยอยากแนะนำโมเดล Deep Learning Model ตัวหนึงที่ใช้ Mechanic ของ “Self-Attention model” มาช่วยเราสรุปย่อข้อความที่มันสำคัญจริงๆกันครับ Import Library ที่จำเป็นตัวใหม่ที่เพิ่มขึ้นมาคือ transformers ซึ่งเป็นโมเดล attention model ซึ่งเป็น deep learning model ที่ใช้งานได้ดีในข้อมูลภาษา ดึงข้อมูล GE_news.csv ซึ่งเป็นข้อมูลรวมข่าวของบริษัท General Electric: GE จำนวน 335 ข่าว…

Backtest และ Optimization ด้วย Backtesting.py

วันนี้เราจะมาทดลองใช้ Library Backtestในการเขียนแบบจำลองการซื้อขายหุ้นอย่างง่ายกันนะครับ ที่จริงแล้วมันก็เหมือนที่เราเคยเขียนกันเองแบบไม่ใช้ Library ในคอร์ส Python for Finance แต่เมื่อเราเข้าพื้นฐานแล้วมันก็จะสะดวกกว่าที่เราจะทดลองไอเดียของเราแบบเร็วๆ โดยไม่ต้องเขียนทุกอย่างขึ้นมาเองให้เสียเวลา!!!(แต่ถ้าเรามีเวลา ผมคิดว่าเราควรเขียนขึ้นมาเองเพื่อจะความเข้าใจได้คุม environment ได้แบบสมบูรณ์ครับ) จริงๆแล้ว Library ที่ใช้ในการ Backtest มีหลายตัว ตัวที่โด่งดังอย่าง Backtrader, PyAlgotrade, bt, Zipline(อดีตเคยดังแต่ตอนนี้ไม่มีคนดูแลแล้วข้ามได้ก็ข้ามครับ) แต่เราจะขอยกตัวที่เราคิดว่ามีความเรียบง่ายที่สุดมาให้ทดลองใช้กันครับ ซึ่งก็คือ Backtesting.py นี่เอง Backtesting.py นั้นมีความเรียบง่ายมากเหมือนกับเป็นการตัดเอาฟีเจอร์ที่สำคัญของ Backtest ตัวอื่น เช่น Backtrader  ออกมาและทำให้มันมีขนาดเล็กที่สุดมีเฉพาะฟีเจอร์ที่สำคัญจริงๆเท่านั้น แต่ก็ยังทำงานได้ครบถ้วนพอสมควรครับ ติดตั้ง ก่อนอื่นถ้าเรายังไม่มี Backtesting.py ในเครื่อง เราก็ลง Library การเปิด ใน Anaconda prompt และพิมพ์คำสั่ง หรือเปิด Notebook ของเราละใช้คำสั่ง เราสามารถเข้าไปเยี่ยมชมเว็บไซต์ได้ที่ https://kernc.github.io/backtesting.py/ เริ่มโค้ด Import Library ที่ต้องใช้…

ตลาดหุ้นฮ่องกงเทกระจาดในมุมมองของ Value at Risk แบบต่างๆ

เมื่อวานนี้ตลาดหุ้นฮ่องกงเทกระจาดไป 6% ซึ่งเป็นเหตุการณ์ที่เราจะไม่ค่อยได้เห็นกันบ่อยนะ แต่การทำงานของข้อมูลการลงทุนนะครับโดยเฉพาะหุ้นหรือสินทรัพย์อื่นๆเนี่ย  Characteristics ของมันก็มีความ Random อยู่มาก แต่ไอ้การ Random นี้เราสามารถประเมินได้ (ในคอร์ส Python for Finance คงจำได้ว่าเรามีวิธีการประเมินเหตุการณ์แบบนี้อยู่แล้วด้วยสิ่งที่ชื่อว่า Value At Risk)  ซึ่งเป็นวิธีการประเมินความเสี่ยงที่ค่อนข้างจะคลาสสิคนะครับแล้วมันก็จะมีหลักๆอยู่ 2 แบบ  เหตุการณ์ที่ไม่เกิดบ่อยแบบ ทั้งตลาดตกวันเดียว -6% แบบนี้มันจะเป็นเหตุการณ์ที่เกิดด้านปลายของการแจกแจง ฉะนั้นเราจะมาดูข้อดีข้อเสียของ Value At Risk แต่ละแบบกันครับ แบบไหนที่จะประเมินได้สมจริงสมจังกว่าในกรณีที่เกิดปัญหาการแจกแจงเกิดที่ปลายด้านของการแจกแจงแบบนี้ แบบไหนที่มีจุดอ่อนกับการเหตุการณ์แบบตลาดฮ่องกงเมื่อวานโดยเฉพาะ Data ที่ใช้ Data ใช้ เป็นดัชนีฮังเซงตลาดหุ้นฮ่งกงตั้งแต่ปี ถึงปี 2022 วันที่ 24 เดือน 10 ซึ่งก็คือเมื่อวานนี้นะครับ ก็เป็นเวลากว่า35 ปี มีข้อมูลใน observe ทั้งหมด 8844 วัน แบบแรก Non parametric Value…

ประเมินโอกาสชนะพนันด้วย Monte Carlo Simulation

ห่างหายกันไปนานเหมือนกันนะครับสำหรับบทความวันนี้เราจะมาเราจะมาเข้าบ่อนพนันกันบ้างแต่ว่าไม่ใช่บ่อนพนันจริงๆนะครับ มันคือบ่อนพนัน Simulation ของเราเองนะครับเพื่อการศึกษาเท่านั้น โดยเราจะใช้เทคนิค Monte Carlo Simulation ซึ่งเป็นหลักการทางคณิตศาสตร์ Stochastic process เพื่อมาช่วยเราประเมินโอกาสการชนะหรือโอกาสการแพ้จากการเดิมพันในบ่อนคาสิโนกัน โดยเรามาประเมินโอกาสชนะจากการทอยเต๋า, โอกาสถูกรางวัลที่ 1 ซึ่งเราจะเห็นความเชื่อมโยงระหว่างโลกการพนันกับโลกไฟแนนซ์ เราจะเห็น characteristics การสุ่มของมันที่โลกไฟแนนซ์มีมากกว่านี้เยอะ ทำให้เรารู้ว่าทำไม “การ backtest ด้วย indicator เทพ ซักตัวแล้วได้ผลดีมากๆๆ อาจะเป็นแค่เรื่องไร้สาระจากมุมมอง Stochastic ก็ได้” โดยมีวีดีโอการทำโปรเจ็คเล็กๆตัวนี้อยู่ในคอร์สฟรี Python programming ของเรา(กำลังอยู่ในขั้นตอนอัพเดตอยู่ครับ) Stochastic process vs Deterministic  process Monte Carlo Simulation ก็เป็น stochastic process ตัวหนึง คำว่า “stochastic” ถ้าเราไปดูใน google เราจะเห็นว่า stochastic   แปลว่า “สุ่ม” ต่างกับด้านตรงข้ามของมันคือ…

อยากลงทุน แต่ไม่รู้จะเอาข้อมูลจากไหน? มาทางครับ “ชี้เป้า Python API แหล่งรวมข้อมูลการลงทุนที่น่าสนใจ”

เราจะเอาข้อมูลหุ้นข้อมูลการลงทุนจากไหนดีครับ? คำถามนับว่าเป็นคำถามที่ได้รับหลังไมค์บ่อยต้นๆ เลยคิดว่าควรจะรวบรวม Python Library ดึงข้อมูลมารวมๆกันไว้ที่เดียวกันพร้อมข้อดีข้อเสียของแต่ละที่ครับ 1.Yfinance (Yahoo Finance) source: https://github.com/ranaroussi/yfinance ตัวนี้น่าจะโด่งดังที่สุดตัวนึง เค้าแจกข้อมูลอะไรบ้าง? ง่ายๆ ก็คือ แจกที่ Yahoo Finance แจกนั่นแหละครับ เช่น ราคาหุ้นย้อนหลัง คริปโต งบการเงิน ข้อมูลบริษัท ทุกอย่างที่ Yahoo เค้าปล่อยให้เราเข้าถึงได้ฟรีเลย แต่ถึงอย่างไรก็ตาม แม้จะชื่อ Yfinance แต่นี่ไม่ใช่ของ Yahoo เองนะครับ แต่เป็น Open Source Tool ที่ช่วยเราดึงข้อมูลจาก Yahoo Finance เท่านั้นเอง ฉะนั้นถ้าเกิดเหตุการณ์ Yahoo อัพเดตเปลี่ยนแปลงอะไร ก็อาจจะต้องใช้เวลาอยู่บ้างกว่าที่ Lib ตัวนี้จะถูกแก้ไขกลับมาใช้งานได้ และก็ข้อมูลจะมี Delay อยู่นะครับ แต่ก็ฟรีอะนะ ก็ต้องอดทนกันซักเล็กน้อย 2. Pandas-datareader source:…

รายละเอียดคอร์ส AI for Investment: from AI to Fundamental Investing

คอร์สนี้เป็นคอร์ส “ประยุกต์ใช้ศาสตร์ Artificial Intelligence ในการลงทุน” ภายในคอร์ส เราจะเขียนโปรแกรมที่สามารถ “เลือกหุ้น” ที่จะลงทุนในระยาว ตั้งแต่ 1 ปีขึ้นไป โดยการใช้เทคนิค Machine learning เพื่อคัดแยกหุ้นที่น่าลงทุนมาให้เรา เป้าหมายของคอร์ส สร้างโปรเจคเพื่อ“คัดแยกหุ้นที่น่าสนใจด้วย Machine Learning” เราจะพาทุกท่านมาสร้าง ตะแกรงร่อนหุ้น เพื่อเฟ้นหาหุ้นที่น่าสนใจท่ามกลางหุ้นนับพันตัว!!! รายละเอียดหัวข้อต่างๆ ที่เราจะได้เรียนรู้จากการเรียนคอร์สนี้ เรียนรู้วิธีการหาข้อมูลหุ้น ข้อมูลงบการเงิน ประเภทข้อมูล ข้อมูลสูงระดับล้านแถว เรียนรู้วิธีการจัดการข้อมูลงบการเงิน และการสร้าง Financial Feature ที่ส่งผลต่อการทำนายด้วย โมเดล Machine Learning การทำความสะอาดข้อมูล (Data Cleaning) เพื่อเตรียมพร้อมสำหรับการสร้างโมเดล AI ความรู้เบื้องต้นเกี่ยวกับ Machine Learning เช่น การแบ่งข้อมูล Train-Test Set ปัญหา Overfittingการหาจุดสมดุลของโมเดล (Bias Variance Tradeoff) Machine…