วันศุกร์ที่ 22 พฤษภาคม พ.ศ. 2552

Data mining



Data Mining คือ ชุด software วิเคราะห์ข้อมูลที่ได้ถูกออกแบบมาเพื่อระบบสนับสนุนการตัดสินใจของผู้ใช้ มันเป็น software ที่สมบรูณ์ทั้งเรื่องการค้นหา การทำรายงาน และโปรแกรมในการจัดการ ซึ่งเราคุ้นเคยดีกับคำว่า Executive Information System ( EIS ) หรือระบบข้อมูลสำหรับการตัดสินใจในการบริหาร ซึ่งเป็นเครื่องมือชิ้นใหม่ที่สามารถค้นหาข้อมูลในฐานข้อมูลขนาดใหญ่หรือข้อมูลที่เป็นประโยชน์ในการบริหาร ซึ่งเป็นการเพิ่มคุณค่าให้กับฐานข้อมูลที่มีอยู่

Data Mining เป็นกระบวนการ (Process) ที่กระทำกับข้อมูลขนาดใหญ่เพื่อค้นหารูปแบบ แนวทาง และความสัมพันธ์ที่ซ่อนอยู่ในชุดข้อมูลนั้นโดยอาศัยหลักสถิติ การรู้จำ การเรียนรู้ของเครื่อง และหลักคณิตศาสตร์เพื่อให้ได้สารสนเทศที่เราไม่รู้ออกมา โดยสารสนเทศที่ได้จะมีเหตุผลและสามารถนำไปใช้ประโยชน์ได้

เทคนิคต่าง ๆ ของ Data Mining

1. Association rule Discovery

หลักการทำงาน คือ การค้นหาความสัมพันธ์ของข้อมูลจาก
ข้อมูลขนาดใหญ่ที่มีอยู่ เพื่อนำไปวิเคราะห์ หรือทำนาย
ปรากฎการณ์ต่าง ๆ เช่น การวิเคราะห์การซื้อสินค้าของลูกค้า
เรียกว่า “Market Basket Analysis”

2. Classification & Prediction

ป็นการแบ่งประเภทของข้อมูล โดยจะหากฎเพื่อระบุประเภทวัตถุจากคุณสมบัติของวัตถุ เช่น
การหาความสัมพันธ์ระหว่างผลการตรวจร่างกายต่างๆ กับการเกิดโรค โดยใช้ข้อมูลผู้ป่วยและการวินิจฉัยของแพทย์ที่
เก็บไว้เพื่อนำมาช่วยในการวินิจฉัยโรคของผู้ป่วย

3. Database Clustering Or Segmentation

เป็นเทคนิคการลดขนาดของข้อมูล ด้วยการรวมกลุ่มตัวแปร
ที่มีลักษณะเดียวกันไว้ด้วยกัน เพื่อนำข้อมูลที่ได้ไปวิเคราะห์
เช่นตัวอย่าง
บริษัทจำหน่วยรถยนต์ได้แยกกลุ่มลูกค้าออกเป็น 3 กลุ่ม
1. กลุ่มผู้มีรายได้สูง (> 80,000)
2. กลุ่มผู้มีรายได้ปานกลาง (25,000 - 80,000)
3. กลุ่มผู้มีรายได้ต่ำ (<>

4. Deviation Detection

เป็นกรรมวิธีในการหาค่าที่แตกต่างไปจากมาตรฐาน หรือค่า
ที่คาดคิดไว้ว่าต่างไปมากน้อยเพียงใด โดยทั่วไปมักใช้วิธีทาง
สถิติ หรือการแสดงให้เห็นภาพ (Visualization)
ตัวอย่างการนำเทคนิคนี้ใช้
การตรวจสอบลายเซ็นปลอม
บัตรเครดิตปลอม
การหาจุดบกพร่องของชิ้นงานในโรงงานอุตสาหกรรม

5. Link Analysis

จุดมุ่งหมายของ Ling Analysis คือ การสร้าง Link ที่เรียกว่า
“associations” ระหว่าง Recode เดียว หรือ กลุ่มของ
Record ในฐานข้อมูล
Link Analysis สามารถแบ่งออกเป็น 3 ชนิด
- associations discovery
- sequential pattern discovery
- similar time sequence discovery

การประยุกต์ใช้งาน Data Mining

การวิเคราะห์ผลิตภัณฑ์
ธุรกิจค้าปลีก
การวิเคราะห์บัตรเครดิต
การวิเคราะห์การขาย
E-Commerce
ด้านการศึกษา

ไม่มีความคิดเห็น:

แสดงความคิดเห็น