ما هي أنواع بيانات Amazon Redshift؟

Ma Hy Anwa Byanat Amazon Redshift



Amazon Redshift هو حل سحابي تقدمه AWS ويفي بالغرض من مستودع البيانات. مستودع البيانات هو مساحة كبيرة في السحابة تخزن كميات هائلة من البيانات. الفرق بين مستودع البيانات وقاعدة البيانات هو أن الأول لا يخزن البيانات الحالية فحسب ، بل يخزن أيضًا التاريخ الكامل للبيانات.

ستتعرف هذه المقالة على Amazon Redshift بواسطة AWS وأنواع البيانات التي تدعمها هذه الخدمة.







ما هو Amazon RedShift؟

إنه حل سحابة لتخزين البيانات يعتمد على 'PostgreSQL' . يستخدم تقنية تسمى 'معالجة موازية ضخمة (MPP)' لمعالجة بيتابايت من البيانات بسرعة البرق. يوفر هذا حلاً سهلاً للتنبؤ في الوقت الفعلي استنادًا إلى البيانات التاريخية وحلول التدفق.



يوضح الشكل التالي آلية عمل Amazon Redshift:







هذا الشرح الرسومي لكيفية عمل Amazon Redshift بسيط جدًا وواضح. يوفر لنا معلومات حول كيفية استرداد البيانات ومعالجتها بشكل أكبر لإنشاء المخرجات وإنشاء تطبيقات تعتمد على البيانات.

يمكن أيضًا رؤية بنية مستودع البيانات في Amazon Redshift في الشكل الموضح أدناه:



الآن ، سوف نتوجه إلى استخدامات وميزات هذه الخدمة.

سمات

كما ذكرنا سابقًا ، يعتمد Amazon Redshift على PostgreSQL ويستخدم تقنية تسمى Massively Parallel Processing التي تمكنها من معالجة بيتابايت من البيانات في أي وقت من الأوقات. لذلك ، يوفر Redshift عددًا جيدًا من الميزات والاستخدامات. بعض هذه الميزات مذكورة أدناه:

  • أمن البيانات والتشفير.
  • تحليل الأعمال.
  • دعم التطبيق القائم على البيانات.
  • التحليل التنبئي.
  • التكرار الآلي للمهام.
  • تحجيم البيانات المتزامنة.
  • تخزين البيانات.

يمكن رؤية بعض الميزات الإضافية لهذه الخدمة في الشكل الموضح أدناه:

كانت هذه هي معظم الميزات التي تقدمها Redshift وسننتقل الآن إلى أنواع البيانات التي تدعمها هذه الخدمة.

أنواع البيانات

Amazon Redshift هو حل لتخزين البيانات مع عدد كبير من الميزات. يدعم كلا من أنواع البيانات المهيكلة وغير المهيكلة. نظرًا لأنه يعتمد على PostgreSQL ، يمكن معالجة البيانات من خلال استعلامات SQL بسيطة.

الآن ، يطرح سؤال آخر ، أي كيف تختلف تنسيقات البيانات هذه عن بعضها البعض؟ دعونا نناقش هذين التنسيقين للبيانات.

البيانات المنظمة

يُطلق على نوع البيانات المنسق بدرجة عالية والذي يمكن ترجمته بسهولة بواسطة خوارزميات التعلم الآلي اسم البيانات المنظمة. تعمل قاعدة بيانات SQL مع البيانات المنظمة. البيانات المنظمة في شكل جدول مثل البيانات المستخدمة من قبل قواعد البيانات العلائقية

يعد MYSQL أحد أنظمة إدارة قواعد بيانات SQL المستخدمة على نطاق واسع. يمكن رؤية هندستها المعمارية أدناه في الشكل المعطى:

البيانات غير المهيكلة

البيانات غير المنظمة هي نمط أقل وتنسيق بيانات أقل مثل البيانات المستخدمة في قواعد البيانات غير العلائقية. MongoDB هي قاعدة بيانات مشهورة غير علائقية. لا تعمل استعلامات SQL على قواعد البيانات غير العلائقية ، لذلك تسمى قواعد البيانات هذه أيضًا قواعد بيانات NoSQL.

كما ذكرنا سابقًا ، يعد MongoDB نظامًا غير منظم لإدارة قواعد البيانات ويمكن رؤية بنيته أدناه في الشكل المحدد:

لقد راجعنا نوعي البيانات الأساسيين المستخدمين في قواعد البيانات وسننتقل الآن إلى أنواع البيانات الفعلية التي يدعمها Amazon Redshift. أنواع البيانات هذه هي:

  • البيانات الرقمية
  • بيانات الشخصية
  • بيانات التاريخ والوقت
  • البيانات المنطقية
  • بيانات HLLSKETCH
  • بيانات سوبر
  • استبدال البيانات

دعونا نناقش أنواع البيانات هذه:

البيانات الرقمية

نوع البيانات هذا لا يحتاج إلى شرح. وهو يدعم البيانات الموجودة في شكل أعداد صحيحة وكسور عشرية ونقطة عائمة وأنواع بيانات رقمية أخرى.

يمكن رؤية خصائص نوع البيانات الصحيح في الشكل أدناه:

يخزن نوع البيانات العشري البيانات بناءً على الدقة من المستخدم. خصائصه كالتالي:

بيانات الشخصية

تندرج أنواع بيانات CHAR و VARCHAR ضمن فئة أنواع البيانات المستندة إلى الأحرف. NCHAR و NVARCHAR هما أيضًا أنواع بيانات من نوع الأحرف. بخلاف CHAR و VARCHAR ، يقوم هذان النوعان من البيانات بتخزين أحرف Unicode بطول ثابت. دعونا نلقي نظرة على خصائص أنواع البيانات هذه ، مثل:

  • CHAR ، CHARACTER ، NCHAR لديها مجموعة من 4 كيلوبايت.
  • VARCHAR ، NVARCHAR لديه نطاق 64 كيلو بايت.
  • يبلغ مدى BPCHAR 256 بايت.
  • TEXT له نطاق 260 بايت.

بيانات التاريخ والوقت

أنواع بيانات التاريخ والوقت هي DATE و TIME و TIMETZ و TIMESTAMP و TIMESTAMPTZ. القدرات الوظيفية لأنواع البيانات هذه هي كما يلي:

  • DATE يخزن ببساطة تواريخ التقويم.
  • TIME يخزن الوقت دون الرجوع إلى أي منطقة زمنية. إنه التوقيت العالمي المتفق عليه (UTC) افتراضيًا.
  • يقوم TIMETZ بتخزين الوقت بالرجوع إلى المنطقة الزمنية. إنه التوقيت العالمي المنسق (UTC) في كل من جداول المستخدم وجداول النظام افتراضيًا.
  • لا تتضمن TIMESTAMP الوقت فحسب ، بل تشمل التواريخ أيضًا. إنه التوقيت العالمي المنسق (UTC) في كل من جداول المستخدم وجداول النظام افتراضيًا.
  • لا تتضمن TIMESTAMPTZ الوقت فحسب ، بل تتضمن التواريخ أيضًا. إنه التوقيت العالمي المنسق (UTC) في جداول المستخدم فقط ، افتراضيًا.

البيانات المنطقية

نوع البيانات المنطقية هو نوع بيانات ثنائي ، مما يعني أن هناك قيمتين فقط. يرد جدول الخصائص لنوع البيانات المنطقية أدناه في الشكل:

بيانات HLLSKETCH

يستخدم نوع البيانات هذا لتخزين الرسومات. يمكن أن يمثل الانزياح الأحمر الرسومات في شكل متناثر أو كثيف. تبدأ الرسومات التخطيطية كمتفرقة ثم تتحول تدريجيًا إلى كثيفة عندما يوفر تنسيق كثيف مزيدًا من الكفاءة من خلال اتباع الرابط.

بيانات سوبر

يتعامل نوع البيانات هذا مع البيانات غير المهيكلة التي يمكن أن تكون في شكل مصفوفات أو هياكل متداخلة أو JSON. لا يوجد نموذج أو تنسيق للبيانات. يمكن للمستخدمين استكشاف المزيد من المعلومات من خلال التنقل في الرابط.

استبدال البيانات

يخزن نوع البيانات هذا أيضًا الأحرف. ومع ذلك ، فإن الطول محدود. يتيح Amazon Redshift إرسال بيانات VARBYTE إلى أي نوع عدد صحيح أو بيانات نوع الحرف. للحصول على مزيد من المعلومات حول نوع البيانات هذا ، اتبع الرابط أدناه.

هذا كل ما في Amazon Redshift وأنواع البيانات التي يدعمها.

خاتمة

Amazon Redshift هي خدمة AWS تخدم في شكلها الأساسي الغرض من مستودع البيانات ولكنها حل قوي جدًا ومميز للتحليلات والتنبؤ. ناقشت هذه المقالة الانزياح الأحمر وأنواع البيانات التي تدعمها. تم شرح أنواع البيانات هذه باختصار جنبًا إلى جنب مع خصائصها.