ไมโครซอฟต์ประกาศเปิดตัวบริการ Azure Data Lake

azure_data_lakeในงาน Build 2015 Microsoft ประกาศเปิดตัวบริการ Azure Data Lake บริการเก็บข้อมูลบน Cloud สำหรับ Big Data Analytics

แนวคิด Data Lake เป็นเรื่องค่อนข้างใหม่ หลักการง่ายๆ ก็คือเป็นแหล่งรวบรวมข้อมูล “ดิบ” ขององค์กร คือเก็บไว้ในรูปแบบดั้งเดิมให้มากที่สุด แล้วจะนำไปใช้อย่างไรค่อยว่ากันอีกที ซึ่งแตกต่างกับแนวคิด data warehouse แต่สามารถใช้งานร่วมกันได้

Azure Data Lake มีฟีเจอร์หลักดังนี้

  • Compatible กับ HDFS (Hadoop File System) ทำให้สามารถใช้งานร่วมกับ Hadoop distribution อย่าง HortonWorks หรือ Cloudera ได้เลย
  • เก็บข้อมูลได้ไม่จำกัด เน้น throughput สูง ไม่มีการกำหนดลิมิตขนาดข้อมูลที่เก็บได้ หรือแม้แต่ขนาดของไฟล์
  • พร้อมสำหรับใช้งานสำคัญในองค์กร

วีดีโอแนะนำบริการ ซึ่งอธิบายภาพรวมได้ดีทีเดียว


แหล่งข้อมูลเพิ่มเติม:

Microsoft Azure Blog : Introducing Azure Data Lake

TechCrunch : Microsoft Announces Azure Data Lake, A Data Repository For Big Data Analytics