การเขียน Prompt สำหรับวิเคราะห์ข้อมูล

1. เข้าใจพื้นฐานของการวิเคราะห์ข้อมูล
ก่อนจะเขียน Prompt ได้ดี เราต้องเข้าใจพื้นฐานของการวิเคราะห์ข้อมูลก่อน ซึ่งประกอบด้วย
- การทำความสะอาดข้อมูล (Cleaning): ลบข้อมูลที่หายไป ซ้ำ หรือแก้ไขชนิดข้อมูล
- การสำรวจข้อมูล (Exploration): สรุปข้อมูล ดูแนวโน้มต่าง ๆ
- การแปลงข้อมูล (Transformation): กรองข้อมูล, รวมกลุ่ม, รวมตาราง
- การสร้างโมเดล: เช่น การถดถอยเชิงเส้น, การจำแนกประเภท
- การแปลความหมายข้อมูล: หาข้อสรุปและนำไปใช้ตัดสินใจ
2. เรียนรู้รูปแบบของ Prompt ตามประเภทของงาน
เราสามารถสร้าง “คลัง Prompts” ไว้ใช้กับงานต่าง ๆ ได้ โดยแบ่งเป็น
Prompt สำหรับทำความสะอาดข้อมูล
- “ลบข้อมูลที่ซ้ำกันและค่าที่หายไปจากชุดข้อมูลนี้”
- “แปลงคอลัมน์วันที่ให้เป็นรูปแบบ datetime แล้วจัดเรียงตามวันที่”
Prompt สำหรับการสำรวจข้อมูล
- “แสดงการกระจายของยอดขายแยกตามภูมิภาค”
- “สรุปข้อมูลที่มีค่าเฉลี่ย มัธยฐาน และส่วนเบี่ยงเบนมาตรฐานของคอลัมน์ตัวเลขทั้งหมด”
Prompt สำหรับการแปลงข้อมูล
- “รวมกลุ่มข้อมูลตามหมวดหมู่และหาผลรวมของรายได้”
- “กรองเฉพาะแถวที่อายุ > 30 และรายได้ > 50,000”
Prompt สำหรับการสร้างกราฟ
- “วาดกราฟเส้นของรายได้รายเดือน”
- “สร้าง box plot สำหรับเงินเดือน แยกตามแผนก”
Prompt สำหรับการสร้างโมเดล
- “สร้างโมเดลการถดถอยเชิงเส้นเพื่อพยากรณ์ราคา โดยใช้ขนาดและทำเลเป็นตัวแปร”
- “Train โมเดล decision tree classifier บนข้อมูลที่มีป้ายกำกับนี้”
3. Train กับชุดข้อมูลจริง
ลองใช้ Prompt กับชุดข้อมูลจาก
เริ่มจากงานง่าย ๆ เช่น
- สรุปข้อมูล
- การทำความสะอาด
- การสร้างกราฟ
- การทำนาย
4. เครื่องมือที่ช่วยในการเรียนรู้
- ChatGPT หรือ GitHub Copilot: ใช้ภาษามนุษย์ (Natural Language) ในการขอให้ช่วยเขียนโค้ด Python หรือ SQL
- Jupyter Notebooks: ใช้ฝึกวิเคราะห์ข้อมูลพร้อมเขียนคำอธิบาย
- Pandas & Matplotlib: เรียนรู้ว่าไอเดียใน Prompt แปลงเป็นโค้ดได้อย่างไร
5. รับฟีดแบคและพัฒนา
- ลองขอให้ AI “อธิบายว่าโค้ดนี้ทำอะไร”
- Prompt: “ฉันวิเคราะห์แบบนี้แล้ว ควรดูอะไรเพิ่มเติมอีก?”
- ศึกษา Notebooks ของคนอื่นใน Kaggle เพื่อดูตัวอย่างการเขียน Prompts
ตัวอย่างโครงสร้าง Prompts
สามารถใช้โครงสร้าง Prompt แบบนี้ได้
“จากชุดข้อมูลเกี่ยวกับ [ประเภทข้อมูล] วิเคราะห์ [สิ่งที่ต้องการวัด] โดย [การจัดกลุ่มหรือเงื่อนไข] พร้อมสร้างกราฟและอธิบายผลลัพธ์”
ตัวอย่าง
“จากชุดข้อมูลการซื้อของลูกค้า วิเคราะห์ค่าใช้จ่ายเฉลี่ยตามกลุ่มอายุ พร้อมสร้างกราฟแท่งและอธิบายแนวโน้ม”
Blog นี้ เขียน ✍🏼 ร่วมกับ ChatGPT โดยใช้ Prompt
Please explain how to learn prompts for data analysis