machine learning

Machine Learning Pipeline

Machine Learning Pipeline

คือ วิธีการแบบอัตโนมัติสำหรับขั้นตอนการทำงานของ Machine Learning Model ตั้งแต่การเตรียมข้อมูลไปจนถึงการประเมิน Model (Evaluation) เป็นลำดับของขั้นตอนต่างๆ ในการประมวลผลข้อมูล โดยผลลัพธ์ของขั้นตอนก่อนหน้า จะกลายเป็นข้อมูล Input ของส่วนถัดไป โดย Pipeline จะช่วยให้ 1.
Narut Soontranon
Next Best Offer (NBO)

Next Best Offer (NBO)

เป็นวิธีการวิเคราะห์เชิงคาดการณ์ที่ใช้เพื่อทราบถึงผลิตภัณฑ์หรือบริการที่เหมาะสมที่สุดที่จะเสนอให้กับลูกค้าในครั้งถัดไป โดยอิงจากคุณลักษณะและพฤติกรรมของลูกค้า ในบริษัทประกันภัย NBO สามารถช่วยบริษัทแนะนำผลิตภัณฑ์ประกันภัยที่เกี
Narut Soontranon
SHAP (SHapley Additive exPlanations)

SHAP (SHapley Additive exPlanations)

เป็นวิธีการที่ใช้ในการพัฒนา Machine Learning Model สำหรับการอธิบายผลลัพธ์ของ Model มีรายละเอียดดังนี้ 1) ค่า Shapley: SHAP อิงตามค่า Shapley จาก Game theory ในบริบทของ Machine Learning คุณลักษณะ (features) ถูกมองว่าเป็น "Players" ในเกมที่การทำนายคือ
Narut Soontranon
Machine Learning Model Deployment

Machine Learning Model Deployment

การนำ Machine Learning (ML) Model ไปใช้งานจริงบน Production มีกระบวนการในการนำ ML Model ที่ผ่านการ Train แล้วไปใช้ใน Production Environment เพื่อใช้ในการคาดการณ์หรือตัดสินใจจากข้อมูลใหม่ ๆ ดังนี้ 1) การเตรียม Model: * ข้อสรุปสถาปัตยกรรมของ Model และ Hyper-parameters * การตรวจสอบให้แน่ใจว่า Model
Narut Soontranon
Graph Networks

Graph Networks

เป็นโครงสร้างข้อมูลอันทรงพลังที่ถูกนำมาใช้ใน Data Science และ Machine Learning เพื่อวิเคราะห์ความสัมพันธ์ที่ซับซ้อนระหว่าง Entities ต่างๆ Graph Networks ประกอบด้วย: 1. Nodes (Vertices): แทน Entities 2. Edges: แทนความสัมพันธ์ระหว่าง Entities คุณลักษณะสำคัญ:
Narut Soontranon
Imbalance Dataset

Imbalance Dataset

เป็นปัญหาที่พบบ่อยใน Machine Learning และ Data Science โดยที่ Class ของ Target ไม่ได้มีจำนวนที่เท่าเทียมกัน หมายความว่า Class หนึ่ง มีจำนวน Samples มากกว่า (Majority) Class อื่น ๆ (Minority) อย่างมีนัยสำคัญ 1. นิยาม: * ในปัญหา Binary Classification
Narut Soontranon
Precision & Recall ในโลกแห่งความจริง

Precision & Recall ในโลกแห่งความจริง

มี Metrics สำคัญที่ Data Scientist ใช้ในการวัดประสิทธิภาพของ Classification models นั่นคือ 1) Precision และ 2) Recall มีสูตร ดังนี้ Precision = True Positive / (True Positive + False Positive) Recall = True Positive / (True Positive + False Negative) ตัวอย่างในโลกแห่งความจริง 1) การตรวจคัดกรองทางการแพทย์ จินตนาการถึ
Narut Soontranon