โพสต์ที่แล้วเกี่ยวกับ Linear Regression เราพอจะรู้ concept คร่าวๆ แล้วสิ่งที่เราต้องสนใจคือ
- สมการ hypothesis
- การ represent ข้อมูลกับ cost function
- และเป้าหมายของเราคือการ minimize cost function
ถึงจะกากแต่ก็อยากเล่าให้ฟัง
โพสต์ที่แล้วเกี่ยวกับ Linear Regression เราพอจะรู้ concept คร่าวๆ แล้วสิ่งที่เราต้องสนใจคือ
Linear Regression เป็น predictive model แบบหนึ่ง ใช้ทำนายข้อมูลแบบ continuous เป็นช่วงของตัวเลข เช่น 1-100, 0.01-0.99 ซึ่งต่างจาก classification model ที่ผลลัพธ์เป็นแบบ discrete เป็นคลาสหรือเลเบิล เช่น 0, 1 ; สัตว์, พืช แค่ 2 คลาส หรือหลายคลาสก็ได้ เช่น หนังแนวแอคชั่น, คอมเมดี้, สารคดี, ไซไฟ ฯลฯ อะไรก็ว่าไปแล้วแต่ข้อมูล
สมมุติเรามีข้อมูล 2 ชุดที่มีความสัมพันธ์กัน เช่น ราคาบ้านกับพื้นที่บ้าน, คะแนนของเทอมต้นกับคะแนนของเทอมปลาย, จำนวนคนกับชั่วโมงที่ทำงานเสร็จ ฯลฯ เมื่อให้สิ่งที่เราต้องการทำนายเป็นแกน y (ผลลัพธ์) และข้อมูลอีกชุดคือแกน x (ฟีเจอร์) เมื่อนำข้อมูลทั้ง 2 ชุดมาพล็อตกราฟจะได้จุดที่เพิ่มขึ้นหรือลดลงเป็นเชิงเส้น (linear) ดังรูป