machine learning

Feature Engineering อาวุธลับของ Data Scientist

Feature Engineering อาวุธลับของ Data Scientist

จินตนาการถึงหินก้อนใหญ่จากธรรมชาติ สามารถถูกนำไปแกะสลักสร้างผลงานชิ้นเอกได้ แต่ต้องใช้ทักษะและความรู้ของประติมากรในการเปลี่ยนวัตถุดิบให้กลายเป็นประติกรรมที่น่าทึ่ง ในทำนองเดียวกัน นักวิทยาศาสตร์ข้อมูล ทำงานกับข้อมูลดิบ แต่เพื่อปลดล็อกศักยภาพที่แท้จริง
Narut Soontranon
จากการพัฒนาไปสู่การใช้งานจริงด้วย MLOps

จากการพัฒนาไปสู่การใช้งานจริงด้วย MLOps

MLOps เป็นสิ่งเติมเต็มระหว่าง Machine Learning Development (Dev) และ Production (Prod) MLOps ย่อมาจาก Machine Learning Operations หมายถึง แนวทางปฏิบัติที่ ทำให้กระบวนการนำโมเดล Machine Learning มาใช้ใน Production แบบอัตโนมัติ รวมถึงการปรับ Parameters และบำรุงรักษาให้มีประสิทธิภาพ โดยมีความท้าทายในการจั
Narut Soontranon
เปิดเผยความลับของ Bias และ Variance

เปิดเผยความลับของ Bias และ Variance

ทำความเข้าใจระหว่าง Bias (อคติ) และ Variance (ความแปรปรวน) ในการพัฒนา Machine Learning Models การทำให้ได้ผลการคาดการณ์ที่แม่นยำ ทั้งในขั้นตอนการพัฒนา (Development) และ การใช้งานจริง (Deployment) ถือเป็นเป้าหมายสำคัญ มี 2 แนวคิดพื้นฐาน เรียกว่า Bias (อคติ) และ Variance (ความแปรปรวน) หากเข้าใจความสัมพั
Narut Soontranon
One-class Classification (Ep 2/2)

One-class Classification (Ep 2/2)

อ่าน Ep 1 ที่นี่ -> https://www.nerd-data.com/one-class-classification-ep1/ 3. Isolation Forest หรือ เขียนย่อว่า iForest เป็น Tree-based Anomaly Detection Algorithm Model สร้างบนพื้นฐานของ Normal Data ในแนวทางที่จะ Isolate Anomalies ซึ่งมีจำนวนน้อนและมีค่าที่แตกต่างไปจากค่า Normal ใน
Narut Soontranon
One-class Classification (Ep 1/2)

One-class Classification (Ep 1/2)

Outliers หรือ Anomalies คือ Data Points ส่วนน้อย ที่ไม่สอดคล้องกับข้อมูลที่มีอยู่ * การระบุค่า Outliers หรือ Anomalies ในข้อมูล เรียกว่า "Anomaly Detection" และ สาขาย่อยของ Machine Learning ที่เน้นไปที่ปัญหานี้ เรียกว่า
Narut Soontranon
Dimensionality Reduction คือ อะไร

Dimensionality Reduction คือ อะไร

เป็นเทคนิคหนึ่งในทาง Data Science และ Machine Learning ที่ใช้ในการลด Input Features ของ Dataset  นิยาม ทำ Dataset ที่มีความซับซ้อนให้ง่ายขึ้น โดยลดจำนวน Features (Dimensions) ลง และมีการสูญเสีย Information น้อยที่สุด เป้าหมาย เพื่อหลีกเลี่ยง Curse of Dimensionality
Narut Soontranon
Parametric vs. Non-parametric ML Algorithms

Parametric vs. Non-parametric ML Algorithms

ใน Blog นี้ จะพูดถึงความแตกต่างระหว่าง Parametric และ Non-parametric Machine Learning (ML) Algorithmในภาพรวมของการทำ Machine Learning Models คือ การพยายามหา Mapping Function ระหว่าง ตัวแปร Input X และ ตัวแปร Output Y y = f(X) Parametric ML Algorithms สมมติฐาน ทำให้กระบวนการเรียนรู้ง่ายขึ้น แต่ก็
Narut Soontranon