machine learning

One-class Classification (Ep 1/2)

One-class Classification (Ep 1/2)

Outliers หรือ Anomalies คือ Data Points ส่วนน้อย ที่ไม่สอดคล้องกับข้อมูลที่มีอยู่ * การระบุค่า Outliers หรือ Anomalies ในข้อมูล เรียกว่า "Anomaly Detection" และ สาขาย่อยของ Machine Learning ที่เน้นไปที่ปัญหานี้ เรียกว่า
Narut Soontranon
Dimensionality Reduction คือ อะไร

Dimensionality Reduction คือ อะไร

เป็นเทคนิคหนึ่งในทาง Data Science และ Machine Learning ที่ใช้ในการลด Input Features ของ Dataset  นิยาม ทำ Dataset ที่มีความซับซ้อนให้ง่ายขึ้น โดยลดจำนวน Features (Dimensions) ลง และมีการสูญเสีย Information น้อยที่สุด เป้าหมาย เพื่อหลีกเลี่ยง Curse of Dimensionality
Narut Soontranon
Parametric vs. Non-parametric ML Algorithms

Parametric vs. Non-parametric ML Algorithms

ใน Blog นี้ จะพูดถึงความแตกต่างระหว่าง Parametric และ Non-parametric Machine Learning (ML) Algorithmในภาพรวมของการทำ Machine Learning Models คือ การพยายามหา Mapping Function ระหว่าง ตัวแปร Input X และ ตัวแปร Output Y y = f(X) Parametric ML Algorithms สมมติฐาน ทำให้กระบวนการเรียนรู้ง่ายขึ้น แต่ก็
Narut Soontranon
Random Forest คือ อะไร

Random Forest คือ อะไร

* ถือเป็น Supervised Machine Learning Algorithm ที่อยู่บนพื้นฐานของ Tree * เป็นการรวมเอา Decision Trees แบบสุ่มหลายๆ ต้น (อาจเป็นหลัก 100 ขึ้นกับ Use cases) จึงมีชื่อว่า Random Forest  * มีวัตถุประสงค์ เพื่อเพิ่มประสิทธิภาพในการทำนาย เรียกวิธีการแบบนี้ว่
Narut Soontranon
SVM คือ อะไร

SVM คือ อะไร

SVM ย่อจาก Support Vector Machine เป็น Machine Learning Algorithm ประเภท Supervised Learning มีเป้าหมาย คือ หา Hyperplane ใน N-dimensional Space โดยที่ N คือ จำนวน Features เพื่อใช้ในการ Classify Data Points  ทำไมถึงใช้ SVM 1. มีประสิทธิภาพใน High-dimensional Space 2. ยังคงมีประสิ
Narut Soontranon
Linear Regression คือ อะไร

Linear Regression คือ อะไร

เป็น Supervised Learning Algorithm ที่ใช้ในการ Model และวิเคราะห์ความสัมพันธ์ระหว่าง ตัวแปรอิสระ (Dependent Variable) และ ตัวแปรตาม (Independent Variables) มีเป้าหมาย คือ หาเส้นตรงที่ Fit กับข้อมูลได้ดีที่สุด ภายในช่วง (Range) ที่พิจารณา ในทางคณิตศาสตร์
Narut Soontranon
Pros & Cons ของ Machine Learning Algorithms ที่นิยมใช้

Pros & Cons ของ Machine Learning Algorithms ที่นิยมใช้

ใน Blog นี้ จะพูดถึง Pros (ข้อดี) และ Cons (ข้อเสีย) ของ Machine Learning Algorithms ต่างๆ ที่นิยมนำมาใช้งาน Linear Regression 🟢 ข้อดี * ง่ายในการ Implement และ มีประสิทธิภาพในการ Train * สามารลด Overfit ได้ โดยใช้ Regularization * ใช้งานได้ดี เมื่อ Dataset มีความสั
Narut Soontranon