Latest

การทำ Data Science Project

การทำ Data Science Project

1) Project Setup (เริ่มต้นโครงการ) * กำหนด Use case ที่จะทำ Data Science  * ร่วมกับผู้มีส่วนได้ส่วนเสีย (Stakeholders) ในการกำหนดเป้าหมายทางธุรกิจ เช่น ทีมการตลาดการขาย  * ระบุประเภทของ Analytics เช่น Predictive Analytics  * ระบุวิธีการในการวัดประสิทธิภาพของโมเดล 2) Data Collection (การรวบรวมข้อมู
Narut Soontranon
มูลค่าทางธุรกิจ กับ Confusion Matrix

มูลค่าทางธุรกิจ กับ Confusion Matrix

หากต้องการทำความเข้าใจ Confusion Matrix ก่อน สามารถอ่านได้ ที่นี่ ในกรณี การทำนายลูกค้าที่จะ Churn หรือ Churn Prediction Model 💸 มูลค่าทางธุรกิจ ที่เกิดขึ้นสำหรับทั้ง 4 ค่า ของ Confusion Matrix  1) True Positive - ลูกค้าที่ Churn และโมเดลทำนายถูกว่า
Narut Soontranon
Confusion Matrix

Confusion Matrix

Classification Model เป็นการพยายามทำนาย Class ถือเป็น Machine Learning ประเภท Supervised Learning หากค่าที่ต้องการทำนายมี 2 Classes เรียกว่า Binary Classification เช่น การทำนายลูกค้าที่จะ Churn หรือ Churn Prediction Model วิธีการวัดประสิทธิภาพของ Model สามารถพิจารณาได้จาก Confusion Matrix สิ่งที
Narut Soontranon
เทคนิคการสัมภาษณ์งานด้าน Data

เทคนิคการสัมภาษณ์งานด้าน Data

ในการสัมภาษณ์งานตำแหน่ง Data Scientist, Data Analyst หรือ ตำแหน่งงานในทีม Data อื่นๆ นอกจากความรู้พื้นฐานที่เกี่ยวข้องกับงานนั้นๆ แล้ว เราสามารถเตรียมตัวก่อนเข้าสัมภาษณ์ได้ มี 3 สิ่งที่จำเป็นต้องรู้ 1) รู้จักกับผู้สัมภาษณ์ (Know the interviewer)
Narut Soontranon
3 ปัจจัยในการพิจารณาคุณภาพข้อมูล

3 ปัจจัยในการพิจารณาคุณภาพข้อมูล

1) ความถูกต้องของข้อมูล (ดูเพิ่มเติมได้ที่ -> 5 คุณลักษณะ ของ Data Quality) * ความถูกต้อง (Accuracy) * ความสมบูรณ์ (Completeness) * ความน่าเชื่อถือได้ (Reliability) * ความเกี่ยวข้อง (Relevant) * ทันต่อเวลา (Timeliness) 2) กฎหมายและจริยธรรม * การปฏิบัติตามความเป็นส่วนตัว
Narut Soontranon
ETL Pipeline คืออะไร

ETL Pipeline คืออะไร

การมีข้อมูลคุณภาพดี มีความสำคัญมากสำหรับ Data Science Project แต่ข้อมูลมักมาจากหลายแหล่งและอยู่ในรูปแบบที่ไม่เป็นระเบียบ ข้อมูลบางส่วนมาจากฐานข้อมูล ในขณะที่บางส่วนมาจากไฟล์หรือเว็บไซต์ ข้อมูลดิบ (Raw data) เหล่านี้จึงไม่สามารถใช้งานในทันทีได้
Narut Soontranon
10 แหล่งข้อมูล ใช้ทำ Data Science

10 แหล่งข้อมูล ใช้ทำ Data Science

แหล่งข้อมูลที่เป็นไปได้สำหรับโครงการ Data Science 1) ข้อมูลภายในองค์กร * ข้อมูลธุรกรรม * ระบบ CRM * ERP Platform * ข้อมูลการบริการลูกค้า * ข้อมูลการขาย * ข้อมูลจากเว็บไซต์ * ข้อมูลจาก Mobile App * ข้อมูลจาก Marketing Email * เอกสารภายใน * ข้อมูลพนั
Narut Soontranon