วิดีโอชุด Data Science for Beginners จาก Microsoft

microsoft-azureทาง Microsoft Azure ได้เผยแพร่วิดีโอสั้นๆ ความยาว 5-7 นาที เป็นชุดสำหรับผู้สนใจอยากเริ่มเรียนรู้เกี่ยวกับ Data Science ประกอบด้วย

Video 1: The 5 questions data science answers
Video 2: Is your data ready for data science? (4 min 56 sec)
Video 3: Ask a question you can answer with data (4 min 17 sec)
Video 4: Predict an answer with a simple model (7 min 42 sec)
Video 5: Copy other people’s work to do data science (3 min 18 sec)

แต่ละหัวข้อนอกจากวิดีโอแล้วยังมีสคริปต์กับรูปประกอบด้วย เข้าใจได้ง่ายดีมากเลย

ไมโครซอฟต์ประกาศเปิดตัวบริการ Azure Data Lake

azure_data_lakeในงาน Build 2015 Microsoft ประกาศเปิดตัวบริการ Azure Data Lake บริการเก็บข้อมูลบน Cloud สำหรับ Big Data Analytics

แนวคิด Data Lake เป็นเรื่องค่อนข้างใหม่ หลักการง่ายๆ ก็คือเป็นแหล่งรวบรวมข้อมูล “ดิบ” ขององค์กร คือเก็บไว้ในรูปแบบดั้งเดิมให้มากที่สุด แล้วจะนำไปใช้อย่างไรค่อยว่ากันอีกที ซึ่งแตกต่างกับแนวคิด data warehouse แต่สามารถใช้งานร่วมกันได้

Azure Data Lake มีฟีเจอร์หลักดังนี้

  • Compatible กับ HDFS (Hadoop File System) ทำให้สามารถใช้งานร่วมกับ Hadoop distribution อย่าง HortonWorks หรือ Cloudera ได้เลย
  • เก็บข้อมูลได้ไม่จำกัด เน้น throughput สูง ไม่มีการกำหนดลิมิตขนาดข้อมูลที่เก็บได้ หรือแม้แต่ขนาดของไฟล์
  • พร้อมสำหรับใช้งานสำคัญในองค์กร

วีดีโอแนะนำบริการ ซึ่งอธิบายภาพรวมได้ดีทีเดียว


แหล่งข้อมูลเพิ่มเติม:

Microsoft Azure Blog : Introducing Azure Data Lake

TechCrunch : Microsoft Announces Azure Data Lake, A Data Repository For Big Data Analytics