โครงการฝึกอบรมเชิงปฏิบัติการเรื่อง“การใช้งานโปรแกรมระบบบริหารจัดการสหบรรณานุกรม สำหรับห้องสมุดสถาบันอุดมศึกษา” วันที่ 1-2 สิงหาคม 2556 ณ มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ
  • ส่งข่าวสาร
  • แกลเลอรี่
  • สมาชิก
  • แสดงตามหมวด
  • วีดีโอ
  • บทความได้รับความนิยม
  • News RSS Feeds
  • Oracle กับ Big Data
    manus
    manus เมื่อ Monday, November 5, 2012, 11:08:33
    ความเห็น [0]
    3.สกู๊ป/บทความ [26]

    จากการเติบโตอย่างรวดเร็วของการใช้บริการ Social Media การมีปฏิสัมพันธ์ผ่านทาง Social Network ในประเภทต่างๆ นั้น ทำให้ข้อมูลประเภทหนึ่งเติบโตอย่างมากควบคู่ไปกับบริการในลักษณะนี้ด้วย ซึ่งเรียกรวมๆ ว่า “Big Data” ข้อมูลแบบนี้มีลักษณะที่เห็นได้ชัดเจนอยู่ 3 อย่างคือ ขนาดมหาศาล (Large) ไม่มีรูปแบบหรือโครงสร้างที่แน่นอน (Unstructured) และมีข้อมูลใหม่ป้อนเข้ามาอยู่ตลอดเวลา (Real-time) ต่อมาเมื่อนำข้อมูลประเภทนี้ไปผ่านการประมวลผลแล้ว จะสามารถดึงลักษณะที่ซ่อนอยู่ออกมาได้นั่นคือ คุณค่าหรือประโยชน์ของข้อมูลกลุ่มนี้

    ถ้าพิจารณาจากลักษณะของ Big Data ข้างต้นแล้ว ข้อมูลประเภทนี้จะไม่ได้จำกัดอยู่เฉพาะในบริการประเภท Social Media หรือผ่าน Social Network เท่านั้น ข้อมูลที่เกิดจากการทำธุรกิจ ข้อมูลจากระบบงานหรืออุปกรณ์ตรวจจับ/ตรวจนับ (sensors)  ก็ถูกจัดว่าเป็น Big Data ได้ด้วยเช่นกัน ซึ่งถ้าได้นำข้อมูลเหล่านี้มาทำการประมวลผลได้อย่างรวดเร็ว จะทำให้องค์กรที่เป็นเจ้าของได้รับประโยชน์กลุ่มนี้ได้อย่างรวดเร็ว

    ต่อไปจะขอพูดถึงการจัดการข้อมูลประเภทนี้ว่ามีลักษณะอย่างไร โดยผ่านตัวผลิตภัณฑ์ที่มีชื่อว่า

    Oracle Big Data Appliance Oracle Big Data Appliance แบ่งการจัดการข้อมูลประเภท Big Data ออกเป็น 3 ขั้นตอนได้แก่ ขั้นตอนการรวบรวมและจัดเก็บข้อมูล (Data Acquisition) ขั้นตอนการจัดเตรียมข้อมูล (Data Organization) และขั้นตอนการวิเคราะห์ข้อมูล (Data Analysis)

    ขั้นตอนการรวบรวมและจัดเก็บข้อมูล

    จากลักษณะของข้อมูลที่มีปริมาณมากและมีความหลากหลาย ส่วนจัดเก็บข้อมูลจึงต้องมีความยืดหยุ่นสูงในการจัดเก็บข้อมูลที่มีลักษณะหลากหลายแบบ มีสถาปัตยกรรมที่สามารถรองรับปริมาณการใช้งานที่สูงได้ ซึ่งทาง Oracle ได้เลือกใช้ผลิตภัณฑ์ NoSQL Database ในการรองรับบริการตรงส่วนนี้ โดย NoSQL Database มีความยืดหยุ่นมากสำหรับการสนับสนุนลักษณะข้อมูลแบบต่างๆ และสามารถขยายตัวเพื่อรองรับปริมาณงานได้สูงโดยการขยายในแนวราบ (Scale out)

    ขั้นตอนการจัดเตรียมข้อมูล

    ขั้นตอนนี้เป็นการแปลงข้อมูลปริมาณมากที่อยู่ในรูปแบบที่ไม่มีโครงสร้าง (Unstructured Data) ไปสู่ข้อมูลที่มีโครงสร้าง (Structured Data) โดยสามารถจัดการได้โดยไม่ต้องโยกย้ายข้อมูลไปมา ช่วยให้ประหยัดเวลาในการทำงาน

    Oracle ได้เลือกเอา Hadoop ของ Apache มาเป็นโครงสร้างพื้นฐานในการจัดเก็บข้อมูล และการประมวลผลในขั้นตอนนี้ โดยทำงานอยู่บนระบบปฏิบัติการ Oracle Linux

    Hadoop ประกอบด้วยองค์ประกอบ 2 ส่วนคือ HDFS (Hadoop Distributed File System) และ MapReduce (Fault-Tolerant Distributed Processing) ซึ่งอาจจะกล่าวได้อีกนัยหนึ่งว่า Hadoop เป็นส่วนพื้นฐานที่ทำหน้าที่ทั้งประมวลผลแบบคู่ขนาน (Parallel Processing) และจัดเก็บข้อมูลแบบกระจาย ด้วยโครงสร้างการทำงานของ Hadoop นี้เองที่เป็นหัวใจสำคัญของขั้นตอนนี้ ผลลัพธ์จากขั้นตอนนี้คือข้อมูลปริมาณมากถูกเปลี่ยนไปอยู่ในรูปแบบที่มีความหมายต่อธุรกิจ หรือการนำไปใช้งานต่อมากขึ้น มีโครงสร้าง พร้อมจะนำไปวิเคราะห์เพื่อเป็นประโยชน์ต่อองค์กรต่อไป

    ขั้นตอนการวิเคราะห์ข้อมูล

    ภายหลังจากที่ได้จัดเตรียมข้อมูลแล้ว ก็ถึงขั้นตอนของการวิเคราะห์ โดยการใช้เครื่องมือหรือโปรแกรมวิเคราะห์ทางสถิติ หรือทางด้าน Data Mining ที่มีความสามารถในการตอบสนองต่อการเปลี่ยนแปลงข้อมูล ได้เร็ว และมีความสามารถในการตัดสินใจตามผลการเคราะห์ได้โดยอัตโนมัติ ซึ่งทาง Oracle ได้ใช้โปรแกรม Oracle R Enterprise ซึ่งได้มาจากซอฟต์แวร์ฟรีชื่อ “R” ที่ใช้กันแพร่หลายในการคำนวณทางด้านสถิติและกราฟิก

    สรุปในส่วนของซอฟต์แวร์ที่ให้มากับ Oracle Big Data Appliance จะมีทั้งส่วนที่เป็นโอเพนซอร์ซ (ซอฟต์แวร์ฟรี) และซอฟต์แวร์ของ Oracle เองดังต่อไปนี้

    - Apache Hadoop โดยเป็นเวอร์ชั่นที่ได้นำมาจากบริษัท Cloudera ภายใต้ชื่อว่า CDH ซึ่งประกอบด้วย Apache Hadoop และซอฟต์แวร์โอเพนซอร์สอื่นๆ ที่จำเป็น

    - Cloudera Manager เป็นซอฟต์แวร์เพื่อใช้ในการบริหารจัดการ Cloudera CDH ทั้งหมดในลักษณะ End-to-End

    - R Statistical Package สำหรับการวิเคราะห์ข้อมูล

    - Oracle NoSQL Database Community Edition

    - Oracle Linux และ JVM (Java Virtual Machine)

    จากขั้นตอนการทำงานต่างๆ ที่นำไปสู่ผลลัพธ์สุดท้าย จะเห็นว่ามีความคล้ายกับขั้นตอนของระบบคลังข้อมูล หรือ Data Warehouse

     

    นอกจากนี้ Oracle ได้ทำการต่อยอดโซลูชั่นของ Big Data ด้วยการต่อเชื่อมกับผลิตภัณฑ์ของ Oracle ที่มีอยู่เดิมเช่น Oracle Database 11g  Oracle Exadata  Oracle Exalytics  โดยผ่านเครื่องมือที่ได้พัฒนาขึ้นมาใหม่ในกลุ่มที่เรียกว่า Oracle Big Data Connectors เพื่อตอบโจทย์โดยเฉพาะ ได้แก่

     

    Oracle Loader for Hadoop

    เครื่องมือที่จะช่วยให้นำข้อมูลที่อยู่ในกระบวนการ Hadoop MapReduce เข้าไปจัดเก็บใน Oracle Database 11g ได้ทันที โดยทำหน้าที่เสมือนเป็นโปรแกรม MapReduce อีกตัวหนึ่งที่จะแปลงข้อมูลไปอยู่ในรูปแบบที่ Oracle Database รับได้

    Oracle Direct Connector for HDFS

    ตัวเชื่อมต่อที่ช่วยให้ Oracle Database สามารถค้นหาข้อมูลใน HDFS ได้ตลอดเวลาโดยผ่าน ภาษา SQL

    Oracle Data Integrator Adapter for Hadoop

    ซอฟต์แวร์เสริมสำหรับผลิตภัณฑ์ Oracle Data Integrator (ODI) ที่ช่วยให้ Oracle Business Intelligence สามารถเข้าถึงข้อมูลใน Hadoop

     

    สรุป

    ปัจจุบัน Big Data อาจจะเริ่มเป็นที่สนใจของหลายองค์กร ส่วนหนึ่งถูกผลักดันมาจากโลกของ Social Network ที่แสดงให้เห็นถึงศักยภาพในการทำประโยชน์จากข้อมูลปริมาณมหาศาล อีกส่วนหนึ่งถูกผลักดันมาจากเทคโนโลยีที่ขับเคลื่อนกลไกของ Big Data ซึ่งมีผู้ผลิตซอฟต์แวร์รายใหญ่หลายรายรวมถึง Oracle ที่ให้การสนับสนุนสถาปัตยกรรมนี้

    ดังนั้นเพื่อให้ได้ประโยชน์ต่อธุรกิจที่แท้จริงจาก Big Data นี้ องค์กรจำเป็นต้องรู้และเข้าใจในคุณค่าที่ซ่อนอยู่ในข้อมูลเหล่านั้น วิธีการแปลงและแปลข้อมูล รวมถึงเครื่องมือที่สามารถตอบโจทย์ได้ตั้งแต่การนำข้อมูลเข้าจนถึงการวิเคราะห์ข้อมูล รวมถึงการต่อเชื่อมกับระบบคลังข้อมูล หรือระบบงานหลักอื่นๆ ขององค์กร

    (แหล่งข้อมูล “Oracle: Big Data for the Enterprise” เดือนมกราคม 2555)

    สนใจสอบถามข้อมูลเพิ่มเติมได้ที่ ฝ่ายการตลาด โทร +66 (0) 2685-9000 ต่อ 3425

     

     

    ที่มา : http://www.g-business.co.th/portal/page/portal/gbiz/thai/solutions/oracle/Big_Data

                               
      ความคิดเห็น
    » Not yet reviewed by any member. You can be the first one to write a review.
    » You must be logged in to post a comment.
    Related Articles
    เมื่อเวลา 10.00 น. นางสาวชฎารัตน์ สิงหเดชากุล ผู้ช่วยเลขาธิการคณะกรรมการการอุดมศึกษา พร้อมด้วย รศ. ดร.สมศักดิ์ มิตะถา.... เรียน สมาชิกเครือข่าย UniNet เนื่องจากโหนดมหาวิทยาลัยนเรศวร มีการปรับปรุงห้อง Data Center และระบบไฟฟ้า จึงมีความจำเป็นปิดระบบการบริการเครือข่าย UniNet.... The Information and Communication Technology (ICT) Ministry informed the cabinet that IPv4, which currently carries the vast majority of Internet traffic allows only 4 billion....                สัปดาห์นี้ (23-27 พฤษภาคม 2559) สำนักงานบริหารเทคโนโลยีสารสนเทศเพื่อพัฒนาการศึกษา.... เมื่อวันที่ 22 – 26 กรกฎาคม 2562  ดร.นพ.ปฐม สวรรค์ปัญญาเลิศ รองปลัดกรทรวงการอุดมศึกษา วิทยาศาสตร์ วิจัยและนวัตกรรมพร้อมด้วย รศ.ดร.สมศักดิ์....