Latest

Decision Tree & Ensemble Methods

Decision Tree & Ensemble Methods

หากจะพูดถึง Machine Learning Algorithm ที่รู้จักกันเป็นอย่างดี นั่นก็คือ Decision Tree และ Ensemble Methods  ใช้สำหรับการทำ Supervised Learning ได้ทั้ง Regression (ทำนายตัวเลข) และ Classification (ทำนาย Class) . CART ย่อจาก Classification and Regression Tree รู้จักกันในชื่อ Decision
Narut Soontranon
เทคนิคการ Prompt เพื่อให้ได้คำตอบที่ดีจาก LLMs

เทคนิคการ Prompt เพื่อให้ได้คำตอบที่ดีจาก LLMs

💬 LLMs (Large Language Models) ถือเป็น Gen AI (Generative AI) ที่ถูกนำไปประยุกต์ใช้อย่างแพร่หลาย และช่วยเพิ่ม Productivity ในงานต่างๆ มี Applications ที่รู้จักกันเป็นอย่างดี เช่น ChatGPT (โดย OpenAI), Gemini (โดย Google), Claude (โดย Anthropic) การใช้งาน LLMs ให้เกิ
Narut Soontranon
การทำ Data Science Project

การทำ Data Science Project

1) Project Setup (เริ่มต้นโครงการ) * กำหนด Use case ที่จะทำ Data Science  * ร่วมกับผู้มีส่วนได้ส่วนเสีย (Stakeholders) ในการกำหนดเป้าหมายทางธุรกิจ เช่น ทีมการตลาดการขาย  * ระบุประเภทของ Analytics เช่น Predictive Analytics  * ระบุวิธีการในการวัดประสิทธิภาพของโมเดล 2) Data Collection (การรวบรวมข้อมู
Narut Soontranon
มูลค่าทางธุรกิจ กับ Confusion Matrix

มูลค่าทางธุรกิจ กับ Confusion Matrix

หากต้องการทำความเข้าใจ Confusion Matrix ก่อน สามารถอ่านได้ ที่นี่ ในกรณี การทำนายลูกค้าที่จะ Churn หรือ Churn Prediction Model 💸 มูลค่าทางธุรกิจ ที่เกิดขึ้นสำหรับทั้ง 4 ค่า ของ Confusion Matrix  1) True Positive - ลูกค้าที่ Churn และโมเดลทำนายถูกว่า
Narut Soontranon
Confusion Matrix

Confusion Matrix

Classification Model เป็นการพยายามทำนาย Class ถือเป็น Machine Learning ประเภท Supervised Learning หากค่าที่ต้องการทำนายมี 2 Classes เรียกว่า Binary Classification เช่น การทำนายลูกค้าที่จะ Churn หรือ Churn Prediction Model วิธีการวัดประสิทธิภาพของ Model สามารถพิจารณาได้จาก Confusion Matrix สิ่งที
Narut Soontranon
เทคนิคการสัมภาษณ์งานด้าน Data

เทคนิคการสัมภาษณ์งานด้าน Data

ในการสัมภาษณ์งานตำแหน่ง Data Scientist, Data Analyst หรือ ตำแหน่งงานในทีม Data อื่นๆ นอกจากความรู้พื้นฐานที่เกี่ยวข้องกับงานนั้นๆ แล้ว เราสามารถเตรียมตัวก่อนเข้าสัมภาษณ์ได้ มี 3 สิ่งที่จำเป็นต้องรู้ 1) รู้จักกับผู้สัมภาษณ์ (Know the interviewer)
Narut Soontranon
3 ปัจจัยในการพิจารณาคุณภาพข้อมูล

3 ปัจจัยในการพิจารณาคุณภาพข้อมูล

1) ความถูกต้องของข้อมูล (ดูเพิ่มเติมได้ที่ -> 5 คุณลักษณะ ของ Data Quality) * ความถูกต้อง (Accuracy) * ความสมบูรณ์ (Completeness) * ความน่าเชื่อถือได้ (Reliability) * ความเกี่ยวข้อง (Relevant) * ทันต่อเวลา (Timeliness) 2) กฎหมายและจริยธรรม * การปฏิบัติตามความเป็นส่วนตัว
Narut Soontranon
ETL Pipeline คืออะไร

ETL Pipeline คืออะไร

การมีข้อมูลคุณภาพดี มีความสำคัญมากสำหรับ Data Science Project แต่ข้อมูลมักมาจากหลายแหล่งและอยู่ในรูปแบบที่ไม่เป็นระเบียบ ข้อมูลบางส่วนมาจากฐานข้อมูล ในขณะที่บางส่วนมาจากไฟล์หรือเว็บไซต์ ข้อมูลดิบ (Raw data) เหล่านี้จึงไม่สามารถใช้งานในทันทีได้
Narut Soontranon
10 แหล่งข้อมูล ใช้ทำ Data Science

10 แหล่งข้อมูล ใช้ทำ Data Science

แหล่งข้อมูลที่เป็นไปได้สำหรับโครงการ Data Science 1) ข้อมูลภายในองค์กร * ข้อมูลธุรกรรม * ระบบ CRM * ERP Platform * ข้อมูลการบริการลูกค้า * ข้อมูลการขาย * ข้อมูลจากเว็บไซต์ * ข้อมูลจาก Mobile App * ข้อมูลจาก Marketing Email * เอกสารภายใน * ข้อมูลพนั
Narut Soontranon
Data Science Use Cases ในองค์กร

Data Science Use Cases ในองค์กร

1. วิเคราะห์ลูกค้า (Customer Analytics) * แบ่งกลุ่มลูกค้า (Customer Segmentation) * หามูลค่าที่ลูกค้าสร้างให้ (Customer Lifetime Value) * ทำลูกค้าค้าที่จะย้ายออก (Churn Prediction) * วิเคราะห์การเดินทางของลูกค้า (Customer Journey Analysis) * วิเคราะห์ความรู้สึก (Sentiment Analysis) * ระบบแนะนำสิ
Narut Soontranon
การพัฒนา AI และ Data Science Model

การพัฒนา AI และ Data Science Model

🤖 กระบวนการพัฒนา AI A. ขั้นตอนการวางแผน * กำหนดวัตถุประสงค์ * ระบุกรณีการใช้งาน * ประเมินความเป็นไปได้ * เลือกแนวทาง AI B. การเตรียมข้อมูล * การเก็บรวบรวมข้อมูล * การทำความสะอาดข้อมูล * การติดป้ายข้อมูล * การเพิ่มข้อมูล C. การพัฒนาโมเดล * การเลือกอัลกอริทึม * การออกแบบสถาปัตยกรรมโมเดล
Narut Soontranon
ความแตกต่างระหว่าง AI และ Data Science

ความแตกต่างระหว่าง AI และ Data Science

AI และ Data Science เป็นคำที่ถูกพูดถึงอยู่บ่อยครั้ง แม้ทั้ง 2 เรื่อง จะมีสิ่งที่ซ้อนทับกันอยู่มาก แต่สามารถแยกความแตกต่างได้ดังนี้ 1) คำจำกัดความและสิ่งที่มุ่งเน้น 🤖 AI (ปัญญาประดิษฐ์) * เน้นการสร้างระบบอัจฉริยะที่เลียนแบบพฤติ
Narut Soontranon
AB Test ในกระบวนการผลิต

AB Test ในกระบวนการผลิต

Data Science ถูกนำไปใช้ในหลายอุตสาหกรรม รวมถึงการเพิ่มประสิทธิภาพในกระบวนการผลิตของโรงงาน (Manufacturing) เพื่อให้แน่ใจว่าผลลัพธ์จาก Data Science Modelได้ดีกว่ากระบวนการเดิม จึงต้องมีการทดสอบเปรียบเทียบ (AB Test) การทำ AB Test สำหรับ Data Science Models ในกระบวนการผลิต 1. กำหนดสมมติฐาน: ระบุให้
Narut Soontranon
ความท้าทายของ AI Journey

ความท้าทายของ AI Journey

องค์กรต่างๆ กำลังปรับตัวไปสู่ AI-Driven Organization เพื่อใช้ประโยชน์จากความก้าวหน้าของ AI ในการสนับสนุนธุรกิจ แต่ก็มีความท้าทายหลากหลายมิติ ที่ต้องคำนึงถึง ความท้าทายหลักๆ ในการพัฒนาและใช้งาน AI ดังนี้ 1. ด้านข้อมูล * คุณภาพและปริมาณข้อมู
Narut Soontranon