การเขียน Prompt สำหรับวิเคราะห์ข้อมูล

การเขียน Prompt สำหรับวิเคราะห์ข้อมูล
By Leonardo.ai

1. เข้าใจพื้นฐานของการวิเคราะห์ข้อมูล

ก่อนจะเขียน Prompt ได้ดี เราต้องเข้าใจพื้นฐานของการวิเคราะห์ข้อมูลก่อน ซึ่งประกอบด้วย

  • การทำความสะอาดข้อมูล (Cleaning): ลบข้อมูลที่หายไป ซ้ำ หรือแก้ไขชนิดข้อมูล
  • การสำรวจข้อมูล (Exploration): สรุปข้อมูล ดูแนวโน้มต่าง ๆ
  • การแปลงข้อมูล (Transformation): กรองข้อมูล, รวมกลุ่ม, รวมตาราง
  • การสร้างโมเดล: เช่น การถดถอยเชิงเส้น, การจำแนกประเภท
  • การแปลความหมายข้อมูล: หาข้อสรุปและนำไปใช้ตัดสินใจ

2. เรียนรู้รูปแบบของ Prompt ตามประเภทของงาน

เราสามารถสร้าง “คลัง Prompts” ไว้ใช้กับงานต่าง ๆ ได้ โดยแบ่งเป็น

Prompt สำหรับทำความสะอาดข้อมูล

  • “ลบข้อมูลที่ซ้ำกันและค่าที่หายไปจากชุดข้อมูลนี้”
  • “แปลงคอลัมน์วันที่ให้เป็นรูปแบบ datetime แล้วจัดเรียงตามวันที่”

Prompt สำหรับการสำรวจข้อมูล

  • “แสดงการกระจายของยอดขายแยกตามภูมิภาค”
  • “สรุปข้อมูลที่มีค่าเฉลี่ย มัธยฐาน และส่วนเบี่ยงเบนมาตรฐานของคอลัมน์ตัวเลขทั้งหมด”

Prompt สำหรับการแปลงข้อมูล

  • “รวมกลุ่มข้อมูลตามหมวดหมู่และหาผลรวมของรายได้”
  • “กรองเฉพาะแถวที่อายุ > 30 และรายได้ > 50,000”

Prompt สำหรับการสร้างกราฟ

  • “วาดกราฟเส้นของรายได้รายเดือน”
  • “สร้าง box plot สำหรับเงินเดือน แยกตามแผนก”

Prompt สำหรับการสร้างโมเดล

  • “สร้างโมเดลการถดถอยเชิงเส้นเพื่อพยากรณ์ราคา โดยใช้ขนาดและทำเลเป็นตัวแปร”
  • “Train โมเดล decision tree classifier บนข้อมูลที่มีป้ายกำกับนี้”

3. Train กับชุดข้อมูลจริง

ลองใช้ Prompt กับชุดข้อมูลจาก

เริ่มจากงานง่าย ๆ เช่น

  • สรุปข้อมูล
  • การทำความสะอาด
  • การสร้างกราฟ
  • การทำนาย

4. เครื่องมือที่ช่วยในการเรียนรู้

  • ChatGPT หรือ GitHub Copilot: ใช้ภาษามนุษย์ (Natural Language) ในการขอให้ช่วยเขียนโค้ด Python หรือ SQL
  • Jupyter Notebooks: ใช้ฝึกวิเคราะห์ข้อมูลพร้อมเขียนคำอธิบาย
  • Pandas & Matplotlib: เรียนรู้ว่าไอเดียใน Prompt แปลงเป็นโค้ดได้อย่างไร

5. รับฟีดแบคและพัฒนา

  • ลองขอให้ AI “อธิบายว่าโค้ดนี้ทำอะไร”
  • Prompt: “ฉันวิเคราะห์แบบนี้แล้ว ควรดูอะไรเพิ่มเติมอีก?”
  • ศึกษา Notebooks ของคนอื่นใน Kaggle เพื่อดูตัวอย่างการเขียน Prompts

ตัวอย่างโครงสร้าง Prompts

สามารถใช้โครงสร้าง Prompt แบบนี้ได้

“จากชุดข้อมูลเกี่ยวกับ [ประเภทข้อมูล] วิเคราะห์ [สิ่งที่ต้องการวัด] โดย [การจัดกลุ่มหรือเงื่อนไข] พร้อมสร้างกราฟและอธิบายผลลัพธ์”

ตัวอย่าง

“จากชุดข้อมูลการซื้อของลูกค้า วิเคราะห์ค่าใช้จ่ายเฉลี่ยตามกลุ่มอายุ พร้อมสร้างกราฟแท่งและอธิบายแนวโน้ม”


Blog นี้ เขียน ✍🏼 ร่วมกับ ChatGPT โดยใช้ Prompt

Please explain how to learn prompts for data analysis