Latest

Z-score, Standardization, Normalization

Z-score, Standardization, Normalization

1) Z-score: Z-score แสดงถึงจำนวนส่วนเบี่ยงเบนมาตรฐานที่จุดข้อมูลห่างจากค่าเฉลี่ยของการกระจาย คำนวณได้ดังนี้: z = (x - μ) / σ โดยที่: x = จุดข้อมูล μ = ค่าเฉลี่ยของการกระจาย σ = ส่วนเบี่ยงเบนมาตรฐานของการกระจาย 2) การทำมาตรฐาน (Standardization): เป็นกระบวนการแปลงข้อมูลให้มีค่าเฉลี่ยเป็น 0 และส่
Narut Soontranon
Log transformation

Log transformation

การทำ Log transformation เป็นเทคนิคที่ใช้ในการแปลงข้อมูลที่เบ้เพื่อให้ได้การกระจายที่ใกล้เคียงกับการกระจายแบบปกติมากขึ้น (Normal distribution) ทำได้โดยการนำ logarithm ของข้อมูลแต่ละจุด ซึ่งถูกนำมาใช้ประโยชน์เมื่อต้องจัดการกับข้อมูลที่เบ้ขวา เพราะช่วยบีบส่วนบนของการกระจายในขณะที่ยืดส่
Narut Soontranon
SHAP (SHapley Additive exPlanations)

SHAP (SHapley Additive exPlanations)

เป็นวิธีการที่ใช้ในการพัฒนา Machine Learning Model สำหรับการอธิบายผลลัพธ์ของ Model มีรายละเอียดดังนี้ 1) ค่า Shapley: SHAP อิงตามค่า Shapley จาก Game theory ในบริบทของ Machine Learning คุณลักษณะ (features) ถูกมองว่าเป็น "Players" ในเกมที่การทำนายคือ
Narut Soontranon
Machine Learning Model Deployment

Machine Learning Model Deployment

การนำ Machine Learning (ML) Model ไปใช้งานจริงบน Production มีกระบวนการในการนำ ML Model ที่ผ่านการ Train แล้วไปใช้ใน Production Environment เพื่อใช้ในการคาดการณ์หรือตัดสินใจจากข้อมูลใหม่ ๆ ดังนี้ 1) การเตรียม Model: * ข้อสรุปสถาปัตยกรรมของ Model และ Hyper-parameters * การตรวจสอบให้แน่ใจว่า Model
Narut Soontranon
DA / BA / DS ต่างกันอย่างไร

DA / BA / DS ต่างกันอย่างไร

นักวิเคราะห์ข้อมูล (Data Analyst หรือ DA): * มุ่งเน้นการรวบรวม ประมวลผล และวิเคราะห์ข้อมูล * ใช้วิธีการทางสถิติในการตีความชุดข้อมูล * สร้าง Dashboards และ Reports * โดยทั่วไปทำงานกับข้อมูลที่มีโครงสร้าง (Structured data) * ใช้เครื่องมือเช่น
Narut Soontranon
Graph Networks

Graph Networks

เป็นโครงสร้างข้อมูลอันทรงพลังที่ถูกนำมาใช้ใน Data Science และ Machine Learning เพื่อวิเคราะห์ความสัมพันธ์ที่ซับซ้อนระหว่าง Entities ต่างๆ Graph Networks ประกอบด้วย: 1. Nodes (Vertices): แทน Entities 2. Edges: แทนความสัมพันธ์ระหว่าง Entities คุณลักษณะสำคัญ:
Narut Soontranon
Imbalance Dataset

Imbalance Dataset

เป็นปัญหาที่พบบ่อยใน Machine Learning และ Data Science โดยที่ Class ของ Target ไม่ได้มีจำนวนที่เท่าเทียมกัน หมายความว่า Class หนึ่ง มีจำนวน Samples มากกว่า (Majority) Class อื่น ๆ (Minority) อย่างมีนัยสำคัญ 1. นิยาม: * ในปัญหา Binary Classification
Narut Soontranon