เมื่อ Big Data หลุดโผ Gartner 2015 Hype Cycle

04fb9cf

Gartner ออกรายงาน Hype Cycle สำหรับปี 2015 เมื่อช่วงกลางเดือนสิงหาคมที่ผ่านมา และที่น่าแปลกใจสำหรับหลายๆ คนคือ Big Data หลุดออกจากรายการเทคโนโลยีที่น่าจับตามอง หลังจากอยู่ในรายงานนี้มาหลายปี

หลายคนใช้ Gartner Hype Cycle เป็นเครื่องมือเพื่อจับตามองเทคโนโลยีใหม่ๆ มานานหลายปี ซึ่งทำให้เราเข้าใจได้ว่าเทคโนโลยีใหม่ๆ ตัวไหน ที่สามารถฟันฝ่าพ้นช่วง “ตื่นกระแส” มาได้และจะส่งผลอย่างจริงจังต่อชีวิตและการทำงาน

เราได้เห็น Big Data อยู่ในรายงานนี้มาหลายปีแล้ว ปี 2014 ที่ผ่านมาเป็นจุดที่เทคโนโลยี Big Data ก้าวข้ามจากสถานะที่เรียกว่า Peak of Inflated Expectations และเริ่มเข้าสู่ช่วง Trough of Disillusionment ตอนแรกก็คาดว่ามันจะไหลลงไปอยู่จุดต่ำสุดหรือถ้าดีหน่อยก็คงเริ่มย้อนกลับมาเข้าช่วง Slope of Enlightenment

Hype-Cycle_2015_1

แต่ปรากฎว่าคำว่า Big Data หายไปจาก Hype Cycle ของ 2015 นี้เลย รวมถึงเทคโนโลยีที่เกี่ยวข้องบางตัวอย่างเช่น Prescriptive Analytics และ Data Science วิดีโอสัมภาษณ์ผู้เขียนรายงาน ให้เหตุผลว่า เป็นเพราะ Big Data ใช้กันอย่างแพร่หลายมากขึ้นและหมดสภาพการเป็น emerging technology แล้ว

ที่น่าสังเกตอีกประการหนึ่งก็คือ จำนวนเทคโนโลยีที่แสดงอยู่ในรายงานลดลง เหลือแค่ 37 เทคโนโลยี ในปี 2015 จากที่แต่เดิมมีถึง 44 ในปี 2014, 43 ในปี 2013 และ 46 ในปี 2012

อย่างไรก็ตามมีรายการเทคโนโลยีใหม่ ที่เกี่ยวข้องกับการวิเคราะห์ข้อมูลเพิ่มมาในปีนี้หลายรายการ เช่น Machine Learning, Citizen data science และ Advanced Analytics with Self-Service Delivery และเทคโนโลยีอื่นที่เกี่ยวข้องกับ Big Data Analytics ก็ยังคงอยู่ อย่างเช่น Autonomous Vehicles, Internet of Things และ Natural Language Process Question Answering

ที่มา:

Gartner’s 2015 Hype Cycle for Emerging Technologies Identifies the Computing Innovations That Organizations Should Monitor

Why Gartner Dropped Big Data Off the Hype Curve
Gartner 2015 Hype Cycle: Big Data is Out, Machine Learning is in

ถอดรหัสการใช้ข้อมูลเพื่อการป้องกันและปราบปรามอาชญกรรม

รายการเจาะข่าวเด่นเมื่อวันที่ 26 สิงหาคม 2558 ได้มีการสัมภาษณ์ ผช.ผบ.ตร. เกี่ยวกับความคืบหน้าระเบิดราชประสงค์และท่าเรือสาทร มีประเด็นที่น่าสนใจเกี่ยวกับการใช้เทคโนโลยีด้านข้อมูลในการสอบสวนดังนี้

  • มีการใช้ข้อมูลจากหลากหลายแหล่งร่วมกัน เช่น การสอบสวนพยานบุคคล ภาพจากกล้องวงจรปิด และการใช้โทรศัพท์มือถือ
  • มีข้อมูลเพิ่มเติมที่เก็บไว้แล้วจากคดีนี้ แต่จำเป็นต้องมีฐานข้อมูลเปรียบเทียบ เช่น DNA และลายนิ้วมือ
  • การใช้โทรศัพท์มือถือ พยายามตรวจดู call log ว่ามีรูปแบบการใช้ผิดปกติในจังหวะเวลานั้นหรือไม่ เช่นโทรเข้าหาให้ดัง 3-4 ครั้ง แล้ววางสาย ณ เวลานั้นพอดี (โดยมีสมมติฐานว่าการจุดระเบิดใช้โทรศัพท์มือถือ)
  • ประเทศไทยเรายังไม่มีฐานข้อมูล DNA (และน่าสงสัยว่าฐานข้อมูลลายนิ้วมือที่เรามีครบถ้วนครอบคลุมเพียงใด)
  • ทางตำรวจไม่มีกล้องวงจรปิดของตัวเอง จำเป็นต้องใช้จากหน่วยงานอื่น
  • ในงานตรวจคนเข้าเมือง เรายังใช้แค่ชื่อ หมายเลขพาสปอร์ตและรูปถ่าย (เข้าใจว่าใช้ดุลพินิจเจ้าหน้าที่ดู) ในการระบุผู้เข้าเมือง
  • ในอนาคตจะมีการใช้ Facial Identification ร่วมกับลายนิ้วมือ
  • มีการพูดถึงศักยภาพในการทำ data sharing ระหว่างหน่วยงาน ทั้งในระดับประเทศ และในระดับหน่วยงาน เพื่อป้องกันและปราบปรามอาชญากรรม

คงเห็นได้ว่าทั้งเทคโนโลยี Big Data และ Data Analytics มีบทบาทมากขึ้นในการป้องกันและปราบปรามอาชญากรรม และก็ดูเหมือนจะมีแผนงานหรือแนวทางกำหนดไว้แล้ว ก็ต้องรอดูกันต่อไปว่าจะสามารถนำมาปฎิบัติได้เร็วและมีประสิทธิภาพมากน้อยเพียงใด

อนาคตการตลาดกับ Big Data, Customer Analytics และ IoT

เริ่มเห็นสัมนาด้านการตลาดที่เกี่ยวข้องกับ Big Data และ Customer Analytics เพิ่มมากขึ้น และก็ได้เห็นคนที่ทำงานด้านการตลาดตื่นเต้นกับไอเดียที่ว่าเอาข้อมูลจากโซเชี่ยลเน็ตเวิร์คมาวิเคราะห์ร่วมกับข้อมูลอื่นๆ จะว่าไปแล้ว นี่เรายังแค่เริ่มๆ เท่านั้นเองนะ อนาคตของ Big Data และ Customer Analytics ยังไปได้อีกไกล

Read more

ทำความรู้จักกับ Data Governance

 

Data Governance ซึ่งอยากจะเรียกเป็นภาษาไทยว่า “ธรรมาภิบาลข้อมูล” เป็นองค์ประกอบสำคัญอย่างหนึ่ง ที่จะช่วยส่งเสริมศักยภาพขององค์กรในการนำข้อมูลไปใช้ได้อย่างเต็มประสิทธิภาพ แต่เนื่องจากมีลักษณะเป็นนามธรรมค่อนข้างสูง เวลาคุยกับผู้บริหาร หลายท่านอาจจะยังนึกไม่ออกว่า การทำธรรมาภิบาลข้อมูล มันคืออะไร ทำแล้วได้อะไร

Data Governance มีหลายนิยาม แต่ที่อยากยกมาเป็นตัวอย่าง คือนิยามของ The Data Governance Institute ซึ่งมีแนวคิดตามภาพ (คลิ้กที่นี่เพื่อดาวน์โหลดภาพต้นฉบับ)

DGI-Data-Governance-Framework-Image

กล่าวโดยย่อที่สุด ธรรมาภิบาลข้อมูล คือการกำหนดและบังคับใช้ กฎ กติกา มารยาท เกี่ยวกับงานด้านข้อมูลในองค์กร

การทำ data governance อาจมีแรงผลักดันจากหลายด้าน เช่น จำเป็นต้องทำเพื่อให้รองรับตามกฎหมายข้อบังคับ ทำเพราะมีปัญหาคุณภาพข้อมูล เพราะมีปัญหาด้านความปลอดภัยข้อมูล เพราะเตรียมตัวผนวกระบบ (อาจจะผ่านการซื้อหรือขายกิจการ) หรือเพราะต้องการพัฒนาระบบ Business Intelligence เป้าหมายแต่ละแบบก็มี focus area แตกต่างกัน

โดยหลักๆ แล้วงาน data governance มักประกอบไปด้วย

  • กำหนดหน่วยงานหรือองค์กรที่ทำหน้าที่กำกับดูแลข้อมูล รวมถึงอำนาจในการตัดสินใจสำหรับข้อมูลแต่ละชนิด
  • กำหนดนิยาม นโยบาย และมาตรฐานข้อมูล (data definition, policy and standards)
  • กำหนดกฎเกณฑ์ทางธุรกิจ หรือ Business Rules ในการสร้าง แก้ไข หรือลบข้อมูล
  • กำหนดเกณฑ์วัดคุณภาพข้อมูล (data quality and measurements)
  • กำหนดกระบวนการในการจัดการควบคุมข้อมูล ซึ่งอาจส่งผลให้มีการแก้ไขระบบ IT ในหลายๆ ระบบ
  • กำหนดวิธีการในการรับมือ เมื่อเกิดปัญหา รวมถึงขั้นตอนในการขอแก้ไขกฎเกณฑ์ที่กำหนดไว้ก่อน

 

งาน data governance โดยส่วนมากแล้ว ปัญหาทางเทคนิคค่อนข้างตรงไปตรงมา แต่ที่ท้าทายกว่ามาก คือปัญหาในด้านองค์กร โดยเฉพาะองค์กรใหญ่ ที่แต่ละหน่วยงานมีอำนาจหน้าที่ (และงบประมาณ) เป็นของตัวเอง ระบบงานต่างๆ โดยมากมักอิงตามความต้องการของหน่วยงานหลักที่ระบบนั้นๆ สนับสนุนอยู่

 

การจัดทำธรรมาภิบาลข้อมูล เป็นงานสำคัญที่มักไม่ค่อยได้รับความสนใจเท่าใดนัก แต่หากดำเนินการอย่างถูกต้องเหมาะสม จะช่วยให้การใช้งานข้อมูลในองค์กร เป็นไปได้อย่างราบรื่นและมีประสิทธิภาพ เครื่องไม้เครื่องมือหรือโครงการใดๆ ไม่ว่าจะทำ Enterprise Data Warehouse, Business Intelligence หรือแม้แต่ Big Data ก็จะสะดวกราบรื่น มีปัญหาน้อยกว่าองค์กรที่ไม่ได้มีการทำ data governance มาก่อนเลย

ไมโครซอฟต์ประกาศเปิดตัวบริการ Azure Data Lake

azure_data_lakeในงาน Build 2015 Microsoft ประกาศเปิดตัวบริการ Azure Data Lake บริการเก็บข้อมูลบน Cloud สำหรับ Big Data Analytics

แนวคิด Data Lake เป็นเรื่องค่อนข้างใหม่ หลักการง่ายๆ ก็คือเป็นแหล่งรวบรวมข้อมูล “ดิบ” ขององค์กร คือเก็บไว้ในรูปแบบดั้งเดิมให้มากที่สุด แล้วจะนำไปใช้อย่างไรค่อยว่ากันอีกที ซึ่งแตกต่างกับแนวคิด data warehouse แต่สามารถใช้งานร่วมกันได้

Azure Data Lake มีฟีเจอร์หลักดังนี้

  • Compatible กับ HDFS (Hadoop File System) ทำให้สามารถใช้งานร่วมกับ Hadoop distribution อย่าง HortonWorks หรือ Cloudera ได้เลย
  • เก็บข้อมูลได้ไม่จำกัด เน้น throughput สูง ไม่มีการกำหนดลิมิตขนาดข้อมูลที่เก็บได้ หรือแม้แต่ขนาดของไฟล์
  • พร้อมสำหรับใช้งานสำคัญในองค์กร

วีดีโอแนะนำบริการ ซึ่งอธิบายภาพรวมได้ดีทีเดียว


แหล่งข้อมูลเพิ่มเติม:

Microsoft Azure Blog : Introducing Azure Data Lake

TechCrunch : Microsoft Announces Azure Data Lake, A Data Repository For Big Data Analytics

 

ตัวอย่างการใช้งาน Big Data แบบไม่ธรรมดา

parking_lotเราอาจเคยอ่านบทความเกี่ยวกับการใช้งาน Big Data Analytics กันมาบ้างแล้วว่ามันทำอะไรได้บ้าง อย่างเช่น ใช้ทำความเข้าใจลูกค้ามากขึ้น ปรับปรุงแผนการตลาด หรือ ค้นหาและป้องกันการทุจริต ลองมาดูตัวอย่างการใช้งาน Big Data แบบไม่ธรรมดาเหล่านี้ดูบ้าง

Read more

Process Mining เมื่อ Big Data เข้ามาช่วยปรับปรุงกระบวนการทำงาน

process_miningหนึ่งในตัวอย่างที่เห็นได้ชัดของการนำ Big Data มาช่วยในงานธุรกิจ โดยทำการวิเคราะห์ข้อมูลจากระบบการทำงานขององค์กร (โดยใช้ข้อมูลที่เกิดขึ้นจริง) แล้วนำมาหาโอกาสที่จะปรับปรุงให้กระบวนการทำงานดีขึ้นได้ เรียกง่ายๆ ก็คือการทำ business process improvement โดยใช้ประโยชน์จาก big data นั่นเอง

ข้อมูลเพิ่มเติม : www.processmining.org
มี course สอนใน coursera ด้วย : Process Mining: Data science in Action

Microsoft เข้าซื้อกิจการ Datazen

datazen-dashboardsMicrosoft ประกาศใน blog ถึงการเข้าซื้อกิจการ Datazen ซึ่งเป็นผู้ให้บริการ Mobile Business Intelligence โดยมีแผนที่จะนำมาเสริมทัพ Power BI ผู้ใช้ที่เป็นลูกค้า SQL Server Enterprise Edition เวอร์ชันตั้งแต่ 2008 เป็นต้นมา สามารถดาวน์โหลดและใช้งาน Datazen server ได้โดยไม่เสียค่าใช้จ่าย

Datazen เป็นผู้พัฒนา business intelligence แบบ Mobile-first โดยมีผลิตภัณฑ์เป็น Datazen Server ซึ่งถูกปรับแต่งให้เหมาะสมกับการใช้ร่วมกับ MS SQL Server และ Analysis Services และมี client viewer app อยู่บน mobile OS หลักๆ ทั้ง iOS, Android, Windows และ HTML5

ผลิตภัณฑ์และทีมงานของ Datazen จะกลายมาเป็นส่วนหนึ่งของ Power BI โซลูชั่น

 

การทำ data preparation อย่างมืออาชีพ

big-numbers1-500x198

การเตรียมข้อมูล หรือ data preparation หรือบางทีเราอาจจะเรียกว่า data cleaning เป็นงานที่อาจจะน่าเบื่อสำหรับหลายๆ คน ทั้งๆ ที่ถือเป็นกระบวนการที่สำคัญมากอย่างหนึ่งในงาน business intelligence หากการเตรียมข้อมูลทำได้ไม่ดี มีโอกาสสูงที่จะก่อให้เกิดความเสียหายในขั้นตอนอื่นๆ ที่ตามมาได้ อย่างน้อยที่สุดก็อาจทำให้เสียเวลา ต้องทำใหม่ หรือถ้าแย่กว่านั้น อาจส่งผลให้ผลการวิเคราะห์ หรือการตีความจากการนำข้อมูลไปใช้ ผิดเพี้ยนไปจากที่ควรจะเป็น ข้อแนะนำง่ายๆ ในบทความนี้จะช่วยให้คุณสามารถทำการเตรียมข้อมูลได้อย่างมีประสิทธิภาพมากขึ้น ลดงานในอนาคต และได้ประโยชน์สูงสุดจากการเตรียมข้อมูลของคุณ

Read more

เมื่อ Big Data ช่วยลดต้นทุนค่าใช้จ่าย

intelตัวอย่าง business case ที่มีการนำ Big Data และ Predictive Analysis มาช่วยในการลดต้นทุนค่าใช้จ่ายในองค์กร

  • Intel ประหยัดค่าใช้จ่ายในปี 2012 ได้กว่า 3 ล้านเหรียญ จากการนำข้อมูลที่รวบรวมไว้ในระหว่างขั้นตอนการผลิต มาใช้ในการเลือกทดสอบชิปบางตัว แทนที่จะต้องทดสอบชิปทั้งหมด ทำให้สามารถนำชิปออกสู่ตลาดได้เร็วขึ้น
  • Tesco ลดค่าใช้จ่ายในการทำความเย็นตู้แช่ สำหรับสาขาในอังกฤษและไอร์แลนด์ โดยร่วมมือกับศูนย์วิจัย IBM เพื่อวิเคราะห์ข้อมูลเกี่ยวกับการทำความเย็นตลอดทั้งปี และพบว่าหลายสาขากำหนดอุณหภูมิทำความเย็นต่ำกว่าที่จำเป็น
  • MIT ใช้เซ็นเซอร์ลักษณะต่างๆ ติดตั้งในอาคารนับสิบหลังภายในวิทยาลัย แล้วรวบรวมข้อมูลมาเฝ้าระวังอัตราการใช้พลังงาน อาคารแต่ละหลังจะถูกทำเครื่องหมายด้วยสี แสดงอัตราการใช้พลังงานที่เป็นอยู่ อาคารหลังไหนขึ้นสีแดง อาจหมายถึงมีไฟฟ้าหรือน้ำรั่ว หรือมีปัญหาด้านระบบทำความร้อน ซึ่งนอกจากช่วยแก้ปัญหาได้แล้ว ยังนำไปช่วยวางแผนการบำรุงรักษาได้อีกด้วย

การใช้ Big Data ช่วยลดต้นทุนค่าใช้จ่าย เกิดขึ้นในหลายองค์กร และเริ่มมีตัวอย่างให้เห็นมากขึ้นเรื่อยๆ

ที่มา:  Big data’s latest selling point: It’s a strategic cost cutter | TechRepublic

1 2 3 4 5 6