Sign in Subscribe

machine learning

One-class Classification (Ep 1/2)

One-class Classification (Ep 1/2)

Outliers หรือ Anomalies คือ Data Points ส่วนน้อย ที่ไม่สอดคล้องกับข้อมูลที่มีอยู่ * การระบุค่า Outliers หรือ Anomalies ในข้อมูล เรียกว่า "Anomaly Detection" และ สาขาย่อยของ Machine Learning ที่เน้นไปที่ปัญหานี้ เรียกว่า

Dimensionality Reduction คือ อะไร

Dimensionality Reduction คือ อะไร

เป็นเทคนิคหนึ่งในทาง Data Science และ Machine Learning ที่ใช้ในการลด Input Features ของ Dataset นิยาม ทำ Dataset ที่มีความซับซ้อนให้ง่ายขึ้น โดยลดจำนวน Features (Dimensions) ลง และมีการสูญเสีย Information น้อยที่สุด เป้าหมาย เพื่อหลีกเลี่ยง Curse of Dimensionality

Parametric vs. Non-parametric ML Algorithms

Parametric vs. Non-parametric ML Algorithms

ใน Blog นี้ จะพูดถึงความแตกต่างระหว่าง Parametric และ Non-parametric Machine Learning (ML) Algorithmในภาพรวมของการทำ Machine Learning Models คือ การพยายามหา Mapping Function ระหว่าง ตัวแปร Input X และ ตัวแปร Output Y y = f(X) Parametric ML Algorithms สมมติฐาน ทำให้กระบวนการเรียนรู้ง่ายขึ้น แต่ก็

Random Forest คือ อะไร

Random Forest คือ อะไร

* ถือเป็น Supervised Machine Learning Algorithm ที่อยู่บนพื้นฐานของ Tree * เป็นการรวมเอา Decision Trees แบบสุ่มหลายๆ ต้น (อาจเป็นหลัก 100 ขึ้นกับ Use cases) จึงมีชื่อว่า Random Forest * มีวัตถุประสงค์ เพื่อเพิ่มประสิทธิภาพในการทำนาย เรียกวิธีการแบบนี้ว่

SVM คือ อะไร

SVM คือ อะไร

SVM ย่อจาก Support Vector Machine เป็น Machine Learning Algorithm ประเภท Supervised Learning มีเป้าหมาย คือ หา Hyperplane ใน N-dimensional Space โดยที่ N คือ จำนวน Features เพื่อใช้ในการ Classify Data Points ทำไมถึงใช้ SVM 1. มีประสิทธิภาพใน High-dimensional Space 2. ยังคงมีประสิ

Linear Regression คือ อะไร

Linear Regression คือ อะไร

เป็น Supervised Learning Algorithm ที่ใช้ในการ Model และวิเคราะห์ความสัมพันธ์ระหว่าง ตัวแปรอิสระ (Dependent Variable) และ ตัวแปรตาม (Independent Variables) มีเป้าหมาย คือ หาเส้นตรงที่ Fit กับข้อมูลได้ดีที่สุด ภายในช่วง (Range) ที่พิจารณา ในทางคณิตศาสตร์

Pros & Cons ของ Machine Learning Algorithms ที่นิยมใช้

Pros & Cons ของ Machine Learning Algorithms ที่นิยมใช้

ใน Blog นี้ จะพูดถึง Pros (ข้อดี) และ Cons (ข้อเสีย) ของ Machine Learning Algorithms ต่างๆ ที่นิยมนำมาใช้งาน Linear Regression 🟢 ข้อดี * ง่ายในการ Implement และ มีประสิทธิภาพในการ Train * สามารลด Overfit ได้ โดยใช้ Regularization * ใช้งานได้ดี เมื่อ Dataset มีความสั