version thai language วัตถุประสงค์ในการพัฒนาโปรเจค
- หนึ่งเป็นการฝึกฝนด้าน Quant และ Deep learning ของตัวเอง
- สองเป็นแนวคิดที่จะดึงเงินลงทุนจากต่างชาติมาลงตลาดหุ้นไทย ดังนั้นตัวหุ้นที่นำมาวิเคราะห์จะไม่มีหุ้นไทยเลย
โปรเจคนี้ทำอะไรได้บ้าง
- หนึ่ง ทำนายเปอร์เซ็นที่ราคาของหุ้นจะเพิ่ม เช่น อีก 7 วันหุ้น AMD จะมีโอกาสที่ราคาหุ้นจะเพิ่ม 2%
- สอง วิเคราะห์กลุ่มของหุ้นที่ราคามีโอกาสเพิ่มขึ้นเช่น หุ้นกลุ่ม ecommerce มีโอกาสที่ราคาจะเพิ่มขึ้น 2 เปอร์เซ็น
- สาม วิเคราะห์ความแม่นยำของหุ้นรายตัวและรายกลุ่มเช่น หุ้น AMD มีความแม่นยำอยู่ที่ 20% จากหุ้นทั้งหมดและกลุ่มของ ecommerce มีความแม่นยำเพียง 10%
คำอธิบายด้านเทคนิค
- หนึ่ง ด้านข้อมูล ภายในโปรเจคมีข้อมูลที่นำมาใช้ในการ train model เพือทำนายจะแยกเป็นหลากหลายประเภทเช่นค่าจากสินค้าโภคภัณฑ์, ราคาหุ้น, ราคาสินค้าพื้นฐานของโลกเช่นราคาทองเป็นต้น, ค่าที่ได้จากการตรวจจจับ pattern ของแท่งเทียน, ค่าที่ได้จาก indicator หลากหลายตัว และค่าเปอร์เซ็นของราคาที่เพิ่มขึ้นตามวันที่กำหนด (default เป็น 7 วัน)
- สอง ด้านการ normalize ทั้งหมดจะใช้ log transformation
- สาม ตัว model ที่สามารถใช้งานได้ในตอนนี้จะ 6 model ซึ่ง model ที่แม่นยำมากที่สุดจะเป็น BiLSTM+Multi-head attention จะมีความแม่นยำอยู่ที่ 81% จากหุ้น 133 ตัว
- สี่ ผลที่ได้จาก benchmark จะแบ่งเป็นความแม่นยำที่ทำนายว่าหุ้นขึ้นหรือลงถูกหรือไม่และความแม่นยำของเปอร์เซ็นที่วัดจาก std (สองค่านี้ใช้วิเคราะห์ได้ทั้งแบบกลุ่มของหุ้นและหุ้นรายตัว)
คำถาม
- ทำไมต้องใช้เป็นเปอร์เซ็นแทนที่จะทำนายเป็นราคาไปเลย ตอบ
- ผู้พัฒนามองว่าการทำนายเป็นเปอร์เซ็นเราสามารถประเมินค่า error และวิเคราะห์ค่าที่ทำนายได้เช่นเวลาที่เราจะวิเคราะห์ว่าเราควรจะลงเงินกับหุ้นตัวนี้มากน้อยแค่ไหนโดยอ้างอิงจากเปอร์เซ็นของระบบที่ทำนายได้ ถ้า % ที่ระบบทำนายได้มีค่าน้อย จำนวนเงินที่จะลงกับหุ้นนั้นๆควรจะน้อยตามเพราะค่า % น้อยทำใหใ้มีโอกาสที่ราคาของหุ้นตัวนั้นจะติดลบมากกว่าบวกกลับกันถ้าเปอร์เซ็นสูงก็จะทำให้เห็นว่าระบบมีความแม่นใจว่าหุ้นตัวนี้จะขึ้นแน่ๆ คำถาม
- ทำไมตัว normalize ถึงใช้แค่ตัวเดียว ตอบ
- ทางผู้พัฒนามองว่าการ norm ข้อมูลมากเกินไปทำให้สูญเสียคุณค่าบางอย่างของข้อมูลไป
สิ่งที่จะทำต่อไป
- หนึ่ง การดึงผลประกอบการของบริษัทในแต่ละปีมาเป็นข้อมูลในการ train model
- สอง การเพิ่ม bias เกี่ยวกับข่าวสารในแต่ละวันว่าหุ้นแต่ละตัวมีข่าวสารไปในทางที่ดีหรือไม่เพื่อใช้ในการวิเคราะห์ว่าควรลงทุนไหม