[IQ]Executing DQ Project : #2 Analyze Information Environment

Executing DQ Project : #2 Analyze Information Environment

Step 2 : Analyze Information Environment

– เป็นส่วนของการวิเคราะห์ Information Environment
– ทำให้เราเข้าใจและช่วยในการวิเคราะห์ root cause ของปัญหา
– ทำให้เข้าใจกระบวณการในการทำงาน คนหรือองค์กรที่เกี่ยวข้อง เทคโนโลยีที่เค้าใช้ ที่ส่งผลกระทบต่อคุณภาพหรือจำนวนข้อมูล
– สามารถแตกย่อยออกมาเป็น 7 ขั้นตอน

Process_flow_for_Step_2___Analyze_Information_Environment.jpg

  • 2.1 Understand Relevant Requirements: ดูความต้องการ

– หาความต้องการก่อน โดยมีวิธีการดังนี้

  1. get ความต้องการมา
    – โดย requirement คือสิ่งซึ่งสำคัญต่อธุรกิจ
    – บางครั้งความต้องการมาจากนอกองค์กรเช่น กฏเกณฑ์ กฏหมาย
    – ในการที่จะหาความต้องการก็จะเกี่ยวข้องกับธุรกิจหรือกิจการของสิ่งที่เราศึกษา
    – ข้อมูลที่อาจจะเกี่ยวข้องกับกฏหมาย เช่น ข้อมูลโรงพยาบาล HIPAA ของอเมริกากำหนดว่าถ้าจะเอาข้อมูลมาใช้จะต้อง De-identification คือต้องทำให้ไม่รู้ว่าข้อมูลเป็นของคน เช่นชื่อ นามสกุล เลขประชาชน ที่อยู่ รหัสประจำตัวคนไข้
  2. ระบุขั้นตอนหรือสิทธิ์ในการเข้าถึงข้อมูล
  3. วิเคราะห์และสรุปความต้องการ เราก็จะได้ dta specification
  4. ทำเอกสาร
  • 2.2 Understand Relevant Data and Specifications

– เอาข้อมูลที่ได้มาทำความเข้าใจ โดยมีวิธีการดังนี้

  1. รวบรวมข้อมูลมาจากหลายแหล่งและกำหนดข้อมูลให้เป็นเรื่องๆ เช่นโรงพยาบาล ก็มีเรื่องของคนไข้ โรค วิธีการรักษา ตาม business term
    – จากนั้นก็มาประเมินเอกสาร
    – ทำความเข้าใจ data model
  2. ระบุส่วนของซอฟต์แวร์ แอพพลิเคชั่นที่ใช้
  3. หาความสัมพันธ์ของ business term กับ data subject area
  4. สร้าง detailed data list ของข้อมูลในสนใจ : บางครั้งข้อมูลที่ถูกตั้งชื่อในฐานข้อมูลจะไม่ตรงกับข้อมูลทางธุรกิจ
  5. ข้อมูล ทีเกี่ยวข้องอื่นๆ โดยจะได้มาจาก business analysts, data analysts, data modelers คนที่ออกแบบระบ, developer, database admin, ผู้เชี่ยวชาญเฉพาะโดยตรง
    – ขอเอกสารมาดูเช่น data dictinoaries
    – ดูข้อมูลใน relational database directory
  6. หลังจากรวบรวมข้อมูลมาแล้วก็ทำการบันทึกเป็นเอกสารและทำความเข้าใจ
  7. ถ้าข้อมูลมาจากหลายแหล่งก็ต้องทำการเปรียบเทียบกัน
  8. รวมดึงข้อมูลอื่นๆ เช่น ถ้าจะวัดข้อมูล โดยสอบถามความรู้สึก ก็ดูว่าจะถามกี่คน ใช้เวลาแ่ค่ไหน
  9. ให้บันทึกผลกระทบที่เป็นไปได้หรือผลกระทบทางธุรกิจที่คิดว่าน่าจะเกิด เช่นไปปรับปรุงข้อมูลจะส่งผลกระทบกับใครได้บ้าง


  • 2.3 Understand Relevant Technology

– เทคโนโลยีที่เกี่ยวข้อง
– ข้อมูลได้ถูกจัดเก็บอยู่ในฐานข้อมูลอะไร อยู่ในรูปแบบไหน
– ส่วนที่เกี่ยวข้องหลักๆ มีซอฟต์แวร ฮาร์ดแวร์ เน็ตเวิร์ค
– ขั้นตอน

  1. ชื่อซอฟต์แวร์ โดยจะต้องเป็นชื่อที่ถูกต้องไม่ใช่ชื่อที่เรียกกันในองค์กรเท่านั้น
    – ทีมที่สนับสนุนฮาร์ดแวร์นี้มีใครบ้าง
    – กา่รแชร์ข้อมูลเช่น เน็ตเวิร์คต่างๆ
  2. ศึกษาข้อมูลที่มีอยู่แล้วจากเอกสาร รวมทั้งศึกษา information lift cycle ว่ามีผลกระทบกับใคร เกี่ยวข้องกับใคร
  3. ดูว่ามีเรื่องอื่นที่มีผลกระทบอีกไหม
  4. ทำเอกสาร

– Informatation Life cycle

– ปกติมีแค่ CRUD : Create, Update, Read, Delete
– ตอนนี้ต้องมามองตั้งแต่เริ่มสร้างฐานข้อมูลจนกระทั่งลบทั้งไปเลย POSMAD :
Plan วางแผนในทุกส่วนที่จะได้ข้อมูลมา
Obtain เมื่อวางแผนแล้ว ก็ทำการสร้างข้อมูล โดยอาจจะได้มาจากหน่วยงานอื่น หรือได้จากลูกค้าโดยตรง
Store and Share จัดเก็บข้อมูลและสามารถให้ผู้ใช้ค้นหาข้อมูลได้
Maintain ทำให้มั่นใจว่าข้อมูลมีการอัพเดต backup คือทำให้ข้อมูลอยู่ในสภาพที่ดี
Apply การนำข้อมูลไปใช้ให้เกิดประโยชน์ในการตัดสินใจ หรือทำรายงาน
Dispose เมื่อข้อมูลไม่ได้ใช้แล้วก็ต้องจัดการไม่ว่าจะลบ หรือ backup ข้อมูล

  • 2.4 Understand Relevant Processes

– ดูที่กระบวณการที่่ส่งผล

  1. ลิสต์ว่ากระบวณการอะไรที่เกี่ยวข้องบ้าง, กระบวณการอะไรที่ทำให้เกิดความเสียหาย
    – มีหลายเลเวล Business function > processes> Activities
  2. ดูว่ามี business function และกระบวณการอะไรที่อยู่ในขอบเขตของเรา
    – ดู activities ในรายละเอียดเพื่อวิเคราะห์ว่ามันเกี่ยวข้องอะไรกับคุณภาพข้อมูล
    – ใช้การวิจัยหรือเอกสารที่มีอยู่ที่เกี่ยวข้อง เช่นรายงานประจำปี
    – output ของแต่ละหน่วยงานย่อยๆ
  3. หาความสัมพันธ์ระหว่างข้อมูลกับกระบวณการที่เกี่ยวข้องกัน
  4. วิเคราะห์ข้อมูล
    – ควรจะดูความเหมือน ความแตกต่าง ความสัมพันธ์ ความเกี่ยวข้องของข้อมูล
  • 2.5 Understand Relevant  People/Organizations
  1. ระบุหน้าที่ของคนและองค์กรที่เกี่ยวข้อง
  2. หาความสัมพันธ์กับข้อมูล
  3. วิเคราะห์และทำรายงานผลสรุป
  • 2.6 Define the Information Life Cycle

– ดู information life cycle : ช่วยเราวิเคราะห์ได้ว่าแต่และขั้นตอนมีใครเข้ามาเกี่ยวข้อง
– ช่วยตอบคำถาม

  1. มีการเปลี่ยนแปลงอะไรบ้างในเรื่องของบทบาท
  2. ความต้องการเปลี่ยนแปลงไหม
  3. คนที่รับบทบาทหน้าที่ต่างๆ เปลี่ยนแปลงไหม
  • 2.7 Design Data Capture and Assessment Plan

– ช่วยให้เราวางแผนที่จะทำการวัดคุณภาพข้อมูลได้
– ปรับแผนเมื่อทำการวิเคราะห์เจาะลึกแล้ว เพื่อให้เหมาะสมในการดำเนินงาน
– วางแผนการวัดคุณภาพข้อมูล ก็ต้องรู้ว่าวัดอย่างไร วัดจากใคร ด้วยวิธีไหน กี่คน

Leave a comment