Latest

Data Science Project แบบครบวงจร

Data Science Project แบบครบวงจร

การทำ Data Science Project แบบ end-to-end (ครบวงจร) เกี่ยวข้องกับขั้นตอนต่างๆ ตั้งแต่การแปลงข้อมูลดิบให้เป็น Solution ที่จัดการกับปัญหาเฉพาะ มีกระบวนการทั่วไปดังนี้ 1) กำหนดปัญหาและเป้าหมาย (Define Problem & Goal) * ระบุ Problem Statement: กำหนดอย่างชัดเจนถึงสิ่งที่จะทำให้สำเร็จ
Narut Soontranon
จากการพัฒนาไปสู่การใช้งานจริงด้วย MLOps

จากการพัฒนาไปสู่การใช้งานจริงด้วย MLOps

MLOps เป็นสิ่งเติมเต็มระหว่าง Machine Learning Development (Dev) และ Production (Prod) MLOps ย่อมาจาก Machine Learning Operations หมายถึง แนวทางปฏิบัติที่ ทำให้กระบวนการนำโมเดล Machine Learning มาใช้ใน Production แบบอัตโนมัติ รวมถึงการปรับ Parameters และบำรุงรักษาให้มีประสิทธิภาพ โดยมีความท้าทายในการจั
Narut Soontranon
เปิดเผยความลับของ Bias และ Variance

เปิดเผยความลับของ Bias และ Variance

ทำความเข้าใจระหว่าง Bias (อคติ) และ Variance (ความแปรปรวน) ในการพัฒนา Machine Learning Models การทำให้ได้ผลการคาดการณ์ที่แม่นยำ ทั้งในขั้นตอนการพัฒนา (Development) และ การใช้งานจริง (Deployment) ถือเป็นเป้าหมายสำคัญ มี 2 แนวคิดพื้นฐาน เรียกว่า Bias (อคติ) และ Variance (ความแปรปรวน) หากเข้าใจความสัมพั
Narut Soontranon
ปฏิวัติการศึกษาด้วยวิทยาศาสตร์ข้อมูล

ปฏิวัติการศึกษาด้วยวิทยาศาสตร์ข้อมูล

Data Science กำลังทำให้มีการเปลี่ยนแปลงที่สำคัญในภาคการศึกษา โดยการใช้ข้อมูลเชิงลึกและเครื่องมืออย่างมีประสิทธิภาพ จะสามารถปรับปรุงประสบการณ์การเรียนรู้และผลลัพธ์ของผู้เรียนได้ มีตัวอย่าง Use cases การใช้ Data Science ในภาคการศึกษา ดังนี้ 1) Personalized Learning (การเรียนรู
Narut Soontranon
One-class Classification (Ep 2/2)

One-class Classification (Ep 2/2)

อ่าน Ep 1 ที่นี่ -> https://www.nerd-data.com/one-class-classification-ep1/ 3. Isolation Forest หรือ เขียนย่อว่า iForest เป็น Tree-based Anomaly Detection Algorithm Model สร้างบนพื้นฐานของ Normal Data ในแนวทางที่จะ Isolate Anomalies ซึ่งมีจำนวนน้อนและมีค่าที่แตกต่างไปจากค่า Normal ใน
Narut Soontranon
One-class Classification (Ep 1/2)

One-class Classification (Ep 1/2)

Outliers หรือ Anomalies คือ Data Points ส่วนน้อย ที่ไม่สอดคล้องกับข้อมูลที่มีอยู่ * การระบุค่า Outliers หรือ Anomalies ในข้อมูล เรียกว่า "Anomaly Detection" และ สาขาย่อยของ Machine Learning ที่เน้นไปที่ปัญหานี้ เรียกว่า
Narut Soontranon
ANOVA คือ อะไร

ANOVA คือ อะไร

ANOVA ย่อจาก Analysis of Variance เป็นวิธีการทางสถิติ ถูกนำมาใช้ในการวิเคราะห์ความแตกต่างระหว่างกลุ่มของ Means (ค่าเฉลี่ย) ในกลุ่มตัวอย่าง โดยจะตรวจสอบค่าของ Variance ของแต่ละกลุ่ม ทำไมต้องใช้ ANOVA * Feature Selection สามารถใช้ในกระบวนการเลือก Feature เพื่อระบุว่า Feature ใดมีความสำคัญในเชิ
Narut Soontranon