ในการเรียนรู้เรื่องบิ้กเดต้า ไม่เพียงเเต่เป็นการเรียนรู้คอนเซ็ปต์หรือภาพรวมเท่านั้น แต่รวมถึงเรื่องของเครื่องมือที่จะนำมาใช้จัดการกับข้อมูลมหาศาลและกรอบการทำงานถือเป็นเรื่องสำคัญที่ควรรู้เช่นกัน OPEN-TEC เองในบทบาทของ Knowledge Sharing Platform จึงอยากแบ่งปันความรู้ที่ได้จากการศึกษาผ่านออนไลน์คอร์สของ The University of Adelaide ประเทศออสเตรเลีย ซึ่งรวบรวมองค์ความรู้ด้านเทคโนโลยีหลากหลายแขนงไว้ในที่เดียว และเพิ่มเติมจากการเรียนรู้จากงานสัมมนา IT Trends 2018 Asia’s Rising Power จัดโดย IMC Institute ร่วมกับ Optimus
บิ้กเดต้าคืออะไร
คำอธิบายค่อนข้างชัดเจนและแปลตรงตัวตามความหมาย บิ้กเดต้านั้นเป็นที่ที่ระบบการจัดการข้อมูลแบบเดิมซึ่งไม่สามารถจัดการข้อมูลที่ซับซ้อนและมีขนาดมหาศาลได้ ดังนั้นบิ้กเดต้าจึงประกอบไปด้วยความท้าทายต่างๆ เช่น การเก็บข้อมูล การวิเคราะห์ และการสร้างภาพที่เข้าใจและตรงตามวัตถุประสงค์
รู้หรือไม่ บิ้กเดต้าสร้างการเปลี่ยนแปลงที่ดีได้
การสร้างข้อมูลจำนวนมหาศาล ทำให้เราได้ทราบความท้าทายและอุปสรรคมากมายในการจัดการข้อมูลในชีวิตประจำวัน โดยกระแสของบิ๊กเดต้ากระตุ้นให้เกิดเทคโนโลยีใหม่ๆ พร้อมจัดการด้วยซอฟท์เเวร์ และ/หรืออัลกอริทึม ในทางนามธรรม “บิ้กเดต้า” สามารถทำให้เราตัดสินใจได้ดีขึ้น โดยเฉพาะในฝั่งธุรกิจหรือแม้กระทั่งหน่วยงานรัฐ ยกตัวอย่างการใช้บิ้กเดต้าเพื่อพัฒนาด้านสาธารณสุขในประเทศสหรัฐอเมริกา มีหลายกรณีที่เกิดความเสียหายจากในอุตสาหกรรมสาธารณสุข อาทิ การฉ้อโกง การสูญเสีย หรือการละเมิดกฎหมาย ซึ่งปัญหาเหล่านี้ถือเป็นปัญหาหลักในอุตสาหกรรมเลยทีเดียว ทั้งนี้ การนำบิ้กเดต้าและการวิเคราะห์ข้อมูลมาใช้ในกระบวนการทำให้ระบุข้อมูลเท็จหรือกระบวนการที่ผิดกฎหมายได้ นอกจากนี้ บิ้กเดต้ายังสามารถทำให้ผู้ให้บริการทางสาธารณสุขตรวจสอบหลักฐานการขอเคลมได้ เนื่องจากมีข้อมูลการเคลมในอดีตที่สามารถเชื่อมถึงกัน ในปัจจุบัน ยังได้ใช้อัลกอริทึม และ machine learning มาช่วยตรวจสอบความผิดปกติและแผนการดำเนินงานอีกด้วย ซึ่งการใช้เทคโนโลยีบิ้กเดต้านี้ ทำให้ผู้ให้บริการสาธารณสุขตรวจสอบกระบวนการได้ตั้งเเต่ต้นจนจบและสามารถจับกรณี การฉ้อโกง การสูญเสีย หรือการละเมิดกฎหมาย ได้มากถึงร้อยละ 20 อีกด้วย
4 องค์ประกอบพื้นฐานของบิ้กเดต้า
Volume
ประเภทของข้อมูลที่นิ่ง ไม่วิ่งตามธุรกรรมใดๆ เพื่อรอการดำเนินการวิเคราะห์
Velocity
ประเภทข้อมูลที่เกิดจากการ steaming เช่น ไลฟ์วีดีโอ หรือออนไลน์ สตรีมมิ่ง ซึ่งส่วนใหญ่เป็นข้อมูลด้านตลาดหุ้นที่ข้อมูลมีการเคลื่อนไหวตลอดเวลา
Variety
ประเภทข้อมูลที่มีโครงสร้างและไม่มีโครงสร้าง มีหลากหลายรูปแบบ อาทิ มีเดีย วีดีโอ ตัวอักษร ฯลฯ
Veracity
ประเภทข้อมูลที่ไม่สมบูรณ์ ไม่สอดคล้อง หรือไม่มีส่วนเกี่ยวข้องใดๆ กับธุรกรรม
บทความต่อไปเราจะมาเรียนรู้ บิ้กเดต้ากับสถานการณ์ในชีวิตประจำวัน
ขอบคุณข้อมูล: edX platform, IT Trends 2018 Asia’s Rising Power จัดโดย IMC Institute ร่วมกับ Optimus