View on GitHub

prosss

My GitHub Page

Uniqueness

DataCamp

ChatGPT

Gemini

Summary

Uniqueness ในด้าน Data Quality หมายถึงการที่ข้อมูลแต่ละรายการในชุดข้อมูลต้องมีความเป็นเอกลักษณ์ไม่ซ้ำกัน Uniqueness สามารถทำได้หลายวิธี เช่น การใช้ Primary Keys, Unique Constraints หรือ Deduplication tools รวมถึงการมีกระบวนการตรวจสอบและทำความสะอาดข้อมูลที่ดี ซึ่งจะช่วยเพิ่มความน่าเชื่อถือและประสิทธิภาพในการจัดการข้อมูล

Sample in Daily Life

  1. Employee Database:
    พนักงานแต่ละคนจะได้รับ รหัสพนักงานที่ไม่ซ้ำกัน (เช่น EMP001, EMP002) เพื่อป้องกันไม่ให้มีข้อมูลซ้ำกัน แม้ว่าจะมีพนักงานที่มีชื่อเหมือนกันก็ตาม

  2. E-Commerce Orders:
    ทุกคำสั่งซื้อบนแพลตฟอร์มอีคอมเมิร์ซจะมี หมายเลขคำสั่งซื้อที่ไม่ซ้ำกัน (เช่น ORD12345, ORD12346) เพื่อให้มั่นใจว่าไม่มีข้อมูลซ้ำสำหรับการติดตามและการจัดส่งสินค้า