منصه Rockset لتحليل البيانات في الوقت الفعلي مع قواعد البيانات العلائقية
أعلنت شركة Rockset اليوم أنها قامت بدمج قاعدة بيانات التحليلات الخاصة بها مع قواعد البيانات العلائقية MySQL و PostgreSQL لتمكين المؤسسات من تشغيل الاستعلامات مقابل البيانات المنظمة في الوقت الفعلي. قال فينكات فينكاتراماني ، الرئيس التنفيذي لشركة Rockset ، لموقع VentureBeat ، إنه بدلاً من الاضطرار إلى تحويل البيانات إلى مستودع بيانات سحابي لتشغيل التحليلات ، يمكن للمؤسسات الآن إلغاء تحميل معالجة التحليلات إلى قاعدة بيانات Rockset تعمل على نفس النظام الأساسي. تعتمد منصة Rockset على منصة RocksDB التي طورتها شركة Facebook ، وهي عبارة عن محرك قاعدة بيانات منظم لسجل مفتوح المصدر يستند إلى مخزن مفاتيح / قيمة تم توسيعه لدعم استعلامات SQL. وأضاف فينكاتراماني أن هذا النهج يمكّن المؤسسات من إلغاء تحميل الاستعلامات إلى محرك فهرسة يمكنه معالجة الاستعلامات الثانوية بينما تستمر المعاملات في المعالجة باستخدام قاعدة بيانات علائقية. المشكلة التي تواجهها العديد من المنظمات اليوم هي أن لديها بالفعل استثمارات واسعة في قواعد البيانات العلائقية مفتوحة المصدر. لم يتم تصميم MySQL ولا PostreSQL لمعالجة التحليلات على نطاق واسع ، وهذا أحد أسباب اعتماد العديد من المؤسسات إما لقاعدة بيانات NoSQL أو بحيرة بيانات في السحابة. إن استبدال قواعد البيانات هذه بقاعدة بيانات علائقية خاصة يمكنها أيضًا معالجة التحليلات في الوقت الفعلي سيكون باهظ التكلفة بالنسبة للكثيرين.
نهج جديد
تقدم Rockset حجة لنهج بديل يعتمد على مؤشر متقارب يمكن استخدامه لتحليل البيانات العلائقية المنظمة ، بالإضافة إلى البيانات شبه المنظمة والجغرافية والمتسلسلة الزمنية في الوقت الفعلي. يمكن تحجيم الاستعلامات التحليلية المعقدة لتشمل JOINS مع قواعد البيانات الأخرى أو بحيرات البيانات أو تدفقات الأحداث. يتم إدخال جميع الحقول في فهرس متقارب يتضمن فهرسًا مقلوبًا وفهرسًا عموديًا وفهرس صف.
بالإضافة إلى عمليات الدمج مع قواعد البيانات العلائقية مفتوحة المصدر ، توفر الشركة أيضًا موصلات إلى MongoDB و DynamoDB و Kafka و Kinesis و Amazon Web Services (AWS) و Google Cloud Platform وغيرها.
قال فينكاتراماني إنه نظرًا لأن المنظمات تجمع البيانات في الوقت الفعلي ، فإنها تحتاج أيضًا بشكل متزايد إلى تحليلها في الوقت الفعلي. وأضاف: "أصبحت أعباء العمل القائمة على الدُفعات أعباء عمل في الوقت الفعلي".
قال فينكاتراماني إن نقل البيانات إلى بحيرة البيانات باستخدام عملية موجهة على دفعات يوفر فقط وسيلة لمعالجة كمية أكبر من البيانات التاريخية. أشار فينكاتراماني إلى أن مؤسسات تكنولوجيا المعلومات ربما لا تزال بحاجة إلى بحيرة بيانات ، لكن التحليلات في الوقت الفعلي ستكون في قلب معظم عمليات الأعمال الرقمية.
نشرت Rockset في وقت سابق من هذا العام نتائج اختبار Star Schema Benchmark الذي يُظهر أداء استعلام زمن الاستجابة بالمللي ثانية مقابل معيار Star Schema Benchmark (SSB). تدعي الشركة أنها البائع الوحيد الذي ينشر معايير تُظهر أنه يمكن تنفيذ استعلامات أسرع بـ 9.4 مرة من المنافسين بينما تستوعب في نفس الوقت مليار حدث في اليوم مع ثانية واحدة من زمن انتقال البيانات.
جمعت الشركة في الخريف الماضي 40 مليون دولار إضافية لتنمية قوتها العاملة وتسريع تطوير المنتجات والبحث مع تعزيز جهودها في الوصول إلى السوق.
مستقبل منصات الوقت الحقيقي
ليس من الواضح إلى أي درجة ستفسح العمليات الموجهة نحو الدُفعات التي هيمنت على هندسة تكنولوجيا المعلومات لعقود الطريق لمنصات الوقت الفعلي. تاريخيًا ، كانت مؤسسات البيانات قد طبقت التحليلات على أنها عادة ما تكون من عدة ساعات إلى يوم واحد لأنه تم تحديث قاعدة البيانات الأساسية بين عشية وضحاها باستخدام عملية موجهة بشكل دفعي. تريد المؤسسات اليوم أن تكون قادرة على تطبيق التحليلات بشكل مستمر ، على سبيل المثال ، النقر على البيانات من خلاصات الوسائط الاجتماعية - في الوقت الفعلي ، أثناء معالجتها. تشمل حالات الاستخدام الأخرى لوجستيات سلسلة التوريد وأنظمة تتبع التسليم ، ولوحات المتصدرين للألعاب ، وأنظمة الكشف عن الاحتيال ، وتتبع الصحة واللياقة البدنية ، وتطبيقات التجارة الإلكترونية.
بالطبع ، لقد ولت الأيام التي كانت فيها المؤسسات موحدة على منصة قاعدة بيانات واحدة طويلة. التحدي الآن هو نسج مجموعة متعددة اللغات من قواعد البيانات معًا بطريقة تسمح للمؤسسة بالاستفادة من إمكانيات الأنظمة الأساسية المتعددة المحسّنة لفئات مختلفة من أعباء العمل.