Deep Learning กับการช่วยอนุรักษ์วาฬ ใน “Saving Whale Project”

cr. https://www.fisheries.noaa.gov

บทความนี้ เราจะมาทำความรู้กับอีกหนึ่งโครงการที่มีการนำ Machine Learning มาใช้เพื่อแก้ปัญหาที่เกิดขึั้นจริง เพื่อแก้ปัญหาการสูญพันธ์ของปลาวาฬหายากกัน ก่อนอื่นเรามาดูจุดเริ่มต้นของปัญหากันก่อนค่ะ

ปัญหา

จะมีซักกี่คนที่รู้ว่า สัตว์เลี้ยงลูกด้วยนมขนาดมหึมาอย่าง “วาฬ” หรือ ที่นิยมเรียกกันติดปากว่า “ปลาวาฬ” ซึ่งจริงๆ แล้ว ไม่ใช่ปลา เพียงแค่อาศัยอยู่ในน้ำเท่านั้น! เป็นสิ่งมีชีวิตที่ “ใกล้” จะสูญพันธ์ โดยเฉพาะวาฬสายพันธ์ที่หายากต่างๆ เช่น Narwhal, North Atlantic Right Whale, Sei Whale

มาดูตัวอย่างหน้าตาวาฬที่ได้รับการจัดว่ากำลังเสี่ยงต่อการสูญพันธุ์ โดย WWF (World Wide Fund for Nature) กันก่อนค่ะ

Narwhal วาฬ ที่มีลักษณะพิเศษเหมือน วาฬ + ยูนิคอร์น ที่กำลังขึ้นมาหายใจที่ผิวน้ำ ในมหาสมุทรอาร์กติก cr. https://ocean.si.edu
North Atlantic Right Whale วาฬขนาดใหญ่แห่งมหาสมุทแอตแลนติกเหนือ ที่มีลักษณะหัวแปลกเป็นเอกลักษณ์ cr. https://www.worldwildlife.org
Sei Whale หนึ่งในวาฬที่ว่ายน้ำได้เร็วที่สุด โดยทำความเร็วได้สูงสุดถึง 30 ไมล์ ต่อ ชั่วโมงเลยทีเดียว cr. https://www.worldwildlife.org

ดังนั้น จึงต้องมีกลุ่มนักอนุรักษ์ที่คอยสอดส่องดูแลเจ้าวาฬเหล่านี้อย่างใกล้ชิด แต่ปัญหามันอยู่ที่ว่า เจ้าสัตว์โลกตัวมหึมาเหล่านี้ อาศัยอยู่ในทะเล ถึงแม้จะต้องขึ้นมาหายใจที่ผิวน้ำ แต่ก็ไม่ได้โผล่ขึ้นมาให้เราเห็นทั้งตัว และ ไม่ได้โผล่ขึ้นมาบ่อยๆ แล้วนักอนุรักษ์จะรู้ได้ยังไงล่ะ ว่าตัวไหน เป็นตัวไหน และ จำนวนของพวกมันเพิ่มขึ้น หรือ ลดลงอย่างไร???

cr. Piotr Niedźwiedź – Strata+Hadoop World 2016 London

วาฬ บางตัวก็มีลักษณะที่ชัดเจน บางทีก็ชัดเจนจนนักอนุรักษ์สามารถตั้งชื่อให้พวกมันได้กันเลยทีเดียว อย่างเช่นเจ้า Clover กับ Quasimodo สองตัวขึ้น ขึ้นมาทีไร ใครๆ ก็รู้จัก

ในขณะที่ วาฬ หลายๆ ตัว ไม่ได้มีลักษณะเฉพาะที่โดดเด่น อีกทั้งยังไม่ได้โผล่ขึ้นมาให้เห็นแบบเต็มๆ ตาอีกด้วย แบบนี้ ก็ต้องมีนับผิด นับถูก นับซ้ำ กันมั่งล่ะ!

cr. Piotr Niedźwiedź – Strata+Hadoop World 2016 London

รูปด้านบน คือ ตัวอย่างวาฬที่ดูยาก เห็นแบบนี้ เดากันถูกมั้ยคะว่า 3 รูปนี้ มี วาฬ ทั้งหมดกี่ตัว???

.
.
.
.
.
.
.
.
v
v
ลองมาดูเฉลยกันค่ะ

cr. Piotr Niedźwiedź – Strata+Hadoop World 2016 London

ตอบถูกกันมั้ยคะ? สารภาพเลยค่ะ ว่าผู้เขียนตอบถูก ว่ามี 2 ตัว แต่ผิดตัว! เห็นมั้ยคะว่ามันยากแค่ไหน ดังนั้น ปัญหานี้ เจ้าหน้าที่จึงต้องคิดหาทางออกค่ะ ว่าจะมีวิธีการอะไรที่จะใช้ติดตาม และ แยกแยะ เจ้าวาฬเหล่านี้

นักอนุรักษ์วาฬ กับ วิธีการแก้ปัญหาสุดล้ำ

ข้อมูล ณ ปี 2011 มี วาฬ สายพันธ์ North Atlantic Right Whale อยู่ประมาณเกือบๆ 500 ตัว ถึงจำนวนจะไม่เยอะ เทียบกับมหาสมุทรอันกว้างใหญ่ไพศาล แต่แหม ใครจะไปจำได้ และ แยกแยะ ได้หมดล่ะ ถ้าแยกผิดๆ ถูกๆ ก็จะส่งผลถึงการพยากรณ์จำนวน การเกิด การตาย การผสมพันธุ์ ที่ผิดพลาด การอนุรักษ์ก็จะไม่ได้ผลเท่าที่ควร งานหนักจึงตกอยู่กับ องค์กรอย่าง NOAA Fisheries (National Oceanic and Atmospheric Administration – Fisheries) ที่ต้องทำหน้าที่ในการเฝ้าติดตาม และ ช่วยเหลือ วาฬ เหล่านี้

cr. Piotr Niedźwiedź – Strata+Hadoop World 2016 London

Christine Khan หนึ่งในทีมอนุรักษ์วาฬ แห่ง NOAA และ เธอนี่แหละที่เป็นคนต้นคิดหาวิธีการในการแก้ปัญหา

โดยเธอนั้น ได้ไอเดียมาจาก การที่วันหนึ่ง เธอนั่งเล่น Computer และ ทำการ log-in เข้าใช้งาน Facebook และ Facebook ได้มีการโชว์รูปภาพขึ้นมา แล้วให้เธอยืนยันว่า คนในรูปที่ Facebook คิดว่าเป็นตัวเธอ นั้นใช่เธอจริงหรือไม่? เธอจึงเกิดไอเดียขึ้นมาว่า ในเมื่อ มนุษย์มี Fackbook ที่สามารถรู้จำหน้าตาของผู้ใช้ได้ แล้วทำไม วาฬ ของเธอ จึงจะมี “Whalebook” บ้างไม่ได้ล่ะ!

cr. Piotr Niedźwiedź – Strata+Hadoop World 2016 London

ได้ไอเดียแล้ว แต่ใครล่ะ ที่จะเป็นคนมาทำงานนี้ จะให้นักอนุรักษ์มาเขียนโปรแกรมรู้จำวาฬ ก็อาจจะไม่สะดวกเท่าไหร่นัก! งานแบบนี้ มันต้องเป็น นักคอมพิวเตอร์สิ …. แล้วจะไปหาพวกเขาเหล่านั้นได้ที่ไหนล่ะ นักคอมพิวเตอร์ที่เก่งพอที่จะสามารถพัฒนาระบบรู้จำวาฬ ให้กับเธอได้ งานนี้ไม่หมูนะ เพราะอย่างที่บอกว่า เจ้าวาฬ ที่ว่าลักษณะคล้ายๆ กัน จำยาก แถมยังไม่ค่อยอยากจะขึ้นมาเหนือน้ำซักเท่าไหร่ ซ้ำเวลาขึ้นมาทีนึง ก็ขี้อายซะ จนโผล่มานิดๆหน่อยๆ ดังนั้น ข้อมูลรูปภาพที่มี ก็แน่นอนว่าไม่สมบูรณ์ หรือ จัดเจนซักเท่าไหร่นัก แล้วใครล่ะ จะช่วยเธอได้

ในที่สุด เธอก็ตัดสินใจตั้ง โปรเจ็ก ” Right Whale Recognition ” ขึ้นบนเว็บไซต์ที่ชื่อว่า Kaggle ซึ่งถ้าใครไม่คุ้น เว็บไซต์นี้เป็นเว็บที่มีการให้บริการข้อมูลในการทำ Machine Learning และ มีการจัดการแข่งขันต่างๆ มากมาย โดยที่เปิดโอกาสให้ผู้ที่สนใจ มาโหลดข้อมูลตัวอย่างไป แล้วทำการพัฒนาโมเดล ในการรู้จำ ทำนาย หรือ แยกแยะ เพื่อแก้ปัญหานั้นๆ แล้วมาแข่งขันกัน ว่า ใครทำได้ดีที่สุด โดยที่ผู้ชนะก็จะได้รับรางวัลไปครอง เช่น ได้เงินรางวัล เป็นต้น ไม่เพียงแค่นั้น ผู้ชนะ แน่นอนว่าจะต้องได้รับการยอมรับ จากนักวิทยาศาสตร์คอมพิวเตอร์ที่เป็นสมาชิกเว็บไซต์นั้นอยู่ และ ก็มีไม่น้อยเลยที่ผู้ชนะจะได้รับการติดต่อเพื่อเข้าทำงานในบริษัทชั้นนำของโลก!

โปรเจ็ก Right Whale Recognition บนเว็บไซต์ Kaggle

โปรเจ็คนี้ เริ่มต้นในเดือน สิงหาคม ปี 2015 และ สิ้นสุดลงเมื่อเดือน กรกฏาคม ปี 2016 โดยมีรางวัลชนะเลิศเป็นจำนวน $5,000 (ประมาณ 150,000 บาท) รางวัลที่สอง $3,000 (ประมาณ 91,000 บาท ) และรางวัลที่ 3 จำนวน $2,000 (ประมาณ 60,000 บาท)

รู้จักกับผู้ชนะการแข่งขัน

การแข่งขันครั้งนี้มีผู้เข้าร่วมทั้งหมด 364 ทีม ด้วยกัน และ ผู้ชนะได้แก่ ทีม Deepsense.io (Big Data Science) ซึ่งมีผู้ร่วมทีมทั้งหมด 6 ท่านด้วยกัน วิธีการที่พวกเขาใช้กันก็คือ Deep Learning ซึ่งเป็นอัลกอริทึ่มที่คล้ายคลึงกับอัลกอริทึม การรู้จำใบหน้าบุคคลนั่นเอง โดยวิธีการของพวกเขา แบ่งเป็น 3 ขั้นตอนหลัก คือ 1) ระบุส่วนหัวของวาฬ 2) ระบุตำแหน่งของใบหน้า 3) เริ่มกระบวนการรู้จำ

cr. Piotr Niedźwiedź – Strata+Hadoop World 2016 London

พวกเขาชนะการแข่งขันด้วยระบบที่มีความถูกต้องในการรู้จำวาฬสูงถึง 87% เลยทีเดียว!

แน่นอนว่า สำหรับระบบนี้มีความสำคัญต่อโครงการอนุรักษ์วาฬมาก และ จะเป็นกำลังสำคัญในการอนุรักษ์วาฬหายากจากทั่วทุกมุมโลก และ นอกเหนือจากนี้ ทางทีมงาน Deepsense.io (Big Data Science) ยังได้กล่าวอีกว่า การที่พวกเขาเข้าร่วมการแข่งขันในครั้งนี้ ยังเป็นการยืนยันว่า ยังมีปัญหาอีกมากมายในหลายๆ แขนง ในโลกนี้ เช่น Banking, Insurance, Medicine และ Engineering ที่ต้องการหาวิธีการแก้ปัญหา แต่ไม่ทราบว่าจะทำอย่างไร หรือ ติดต่อใครดี

ในทางกลับกัน ก็ยังมีนักวิทยาศาสตร์ด้านข้อมูล (Data Scientists) ที่เชี่ยวชาญในด้าน Data Analytics, Machine Learning และ Reinforcement Learning อีกจำนวนมาก ที่มีความสามารถในการจัดการกับข้อมูลที่ซับซ้อนได้ แต่ยังไม่ทราบว่าปัญหาคืออะไร และ ยังยืนรอแก้ปัญหาอยู่

ถ้าคนจากสองฝั่งนี้ สามารถโคจรมาเจอ และ ทำงานร่วมกันได้ ปัญหาต่างๆ ก็จะได้รับการแก้ปัญหาที่มีประสิทธิภาพมากขึ้นอย่างแน่นอน

ผู้อ่านท่านใดสนใจรับชมวีดีโอฉบับเต็ม สามารถตามไปรับชมได้ที่ :

Saving Whales With Deep Learning – Piotr Niedźwiedź – Strata+Hadoop World 2016 London

รายละเอียดการแข่งขัน และ ข้อมูลที่ใช้ สามารถหาได้ที่ :

https://www.kaggle.com/c/noaa-right-whale-recognition/overview

สุดท้ายนี้ ถ้าใครสนใจศึกษาเกี่ยวกับองค์กรที่เป็นตัวตั้งตัวตีในการทำงาน สามารถอ่านรายละเอียดของพวกเค้าได้ที่ :

https://www.fisheries.noaa.gov/about-us

หวังว่าบทความนี้จะเป็นประโยชน์แก่ผู้ที่สนใจ ไม่มากก็น้อย และ หวังเป็นอย่างยิ่งว่า มันจะสามารถจุดประกายความคิดให้กับผู้อ่านทุกท่านในการทำเทคโนโลยีมาประยุกต์ใช้ในการแก้ปัญหาต่างๆ ต่อไปค่ะ

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s