البيانات

المصطلح بالإنجليزيالمصطلح بالعربيةالتعريف بالعربية
A/B Testingاختبار أ/بتجربةٌ تُعرض فيها نسختان من شيءٍ ما كصفحة ويب لمجموعتَي مستخدمين مختلفتَين لتحديد أيهما يُحقق أداءً أفضل. تستند إلى البيانات لاتخاذ القرار بدلاً من التخمين.
Ad Hoc Analysisالتحليل الفوريالإجابةُ عن سؤالٍ غير مخطط له بشكلٍ آني باستخدام البيانات، كمعرفة المبيعات في ساعةٍ بعينها من أسبوعٍ ماضٍ. يُنفَّذ عند الطلب وبشكلٍ مستقل عن التقارير المجدولة.
Aggregationالتجميعدمجُ صفوفٍ كثيرة من البيانات في قيمةٍ ملخَّصة واحدة، كجمع المبيعات الإجمالية أو إحصاء الطلبات. يُختزل التفصيلُ ليُعطي صورةً أشمل وأوضح.
API (Application Programming Interface)واجهة برمجة التطبيقاتبوابةٌ برمجية تُتيح لنظامَي برمجيات التواصل وتبادل البيانات فيما بينهما. حين تسحب بياناتٍ من خدمة الطقس أو نظام الدفع، فأنت تستخدم واجهةً برمجية في الغالب.
Backfillالملء الرجعيإعادةُ تشغيل أنبوب البيانات لفتراتٍ زمنية ماضية لتعبئة البيانات التاريخية المفقودة. مثلاً، تحميل بيانات السنتين الماضيتين عند إعداد أنبوبٍ جديد.
Batch Processingمعالجة الدُّفعاتمعالجةُ مجموعاتٍ كبيرة من سجلات البيانات دفعةً واحدة في أوقاتٍ مجدولة، كتشغيل مهمةٍ كل ليلة لتحديث أرقام المبيعات. فعّالةٌ لكنها ليست آنية.
CDC (Change Data Capture)التقاط تغييرات البياناتتقنيةٌ ترصد وتُسجّل كل عمليات الإدراج والتعديل والحذف في قاعدة البيانات المصدر بشكلٍ فوري. تُستخدم لإبقاء مستودعات البيانات متزامنةً دون إعادة تحميلٍ كامل.
Cloud Storageالتخزين السحابيتخزينُ البيانات على خوادم بعيدة تديرها مزوّدو خدماتٍ كـ AWS وAzure وGoogle Cloud بدلاً من الأجهزة المحلية. قابلٌ للتوسع وبتكلفةٍ منخفضة ويُمكن الوصول إليه من أي مكان.
Cohort Analysisتحليل المجموعاتتجميعُ المستخدمين وفق خاصيةٍ مشتركة أو تاريخ بدءٍ ومتابعة سلوكهم عبر الزمن. مثلاً، مقارنة معدل احتفاظ العملاء الذين اشتركوا في يناير بأولئك الذين اشتركوا في فبراير.
Connectorموصِّلتكاملٌ جاهز يربط مصدر البيانات بأداة الأنبوب بنقراتٍ قليلة، كربط Salesforce بمستودع البيانات. يُغني عن كتابة كودٍ مخصص لكل مصدر.
Correlationالارتباطمقياسٌ لشدة العلاقة بين متغيرَين، تتراوح قيمته بين −1 و1. الارتباطُ الموجب يعني ارتفاعهما معاً، والسالب يعني ارتفاع أحدهما حين ينخفض الآخر.
Dashboardلوحة المعلوماتشاشةٌ بصرية توحّد الأرقام الرئيسية والمخططات في مكانٍ واحد، شبيهةً بلوحة قيادة السيارة. تُمكّن من فهم أداء الأعمال بنظرةٍ سريعة دون الحاجة إلى تصفّح تقاريرٍ متفرقة.
Data Catalogكتالوج البياناتفهرسٌ قابل للبحث يُوثّق جميع أصول البيانات في المنظمة، شاملاً مواقعها ومعانيها. يُعين فرقَ البيانات على العثور على البيانات وفهمها بسرعة.
Data Cleaningتنظيف البياناتعمليةُ رصد الأخطاء والتكرارات والقيم المفقودة في مجموعة البيانات وتصحيحها قبل التحليل. البياناتُ القذرة تُفضي إلى استنتاجاتٍ خاطئة، أما النظيفة فتُنتج رؤىً موثوقة.
Data Dictionaryقاموس البياناتوثيقةٌ تصف معنى كل عمودٍ في مجموعة البيانات وتنسيقه وقيمه المسموح بها. المرجعُ الذي يُعين الجميع على فهم البيانات بتعريفاتٍ موحَّدة.
Data Distributionتوزيع البياناتالنمطُ الذي تتوزع فيه القيم عبر نطاقٍ معين، يُعرض غالباً كمدرَّجٍ تكراري. من أشهر أنواعه: التوزيع الطبيعي (منحنى الجرس) والمتحيّز والمنتظم.
Data Governanceحوكمة البياناتمجموعةٌ من القواعد والأدوار والعمليات التي تضمن إدارة البيانات بشكلٍ صحيح عبر المنظمة. تُحدّد من يملك البيانات ومن يصل إليها وكيف تُستخدم.
Data Lakeبحيرة البياناتنظامٌ لتخزين كمياتٍ هائلة من البيانات الخام بأي تنسيق، سواءٌ أكانت منظَّمةً أم شبه منظَّمةٍ أم غير منظَّمة. خلافاً للمستودع، تُخزَّن البيانات أولاً وتُنظَّم لاحقاً.
Data Lakehouseمستودع البيانات المختلطمعماريةٌ هجينة تجمع مرونة بحيرة البيانات في التخزين مع أداء مستودع البيانات في الاستعلام. تُتيح التخزين الخام والتحليل المنظَّم في بيئةٍ واحدة متكاملة.
Data Modelنموذج البياناتتصميمٌ يحدد كيفية هيكلة البيانات وعلاقاتها وطريقة تخزينها، كمخطط بناءٍ للقاعدة أو أداة التحليل. النموذجُ الجيد يُسرّع الاستعلامات ويُيسّر التحليل.
Data Pipelineخط أنابيب البياناتسلسلةٌ آلية من الخطوات تنقل البيانات وتعالجها من نظامٍ إلى آخر. تشبه حزام المصنع الناقل الذي يحمل البيانات من المصدر إلى الوجهة النهائية.
Data Profilingتحليل خصائص البياناتفحصُ مجموعة البيانات لفهم هيكلها ومحتواها واكتمالها وجودتها. الخطوةُ الأولى التي تسبق التنظيف أو التحليل في أي مشروع بياناتٍ جدي.
Data Qualityجودة البياناتمقياسٌ لدقة البيانات واكتمالها واتساقها وتوقيتها. البياناتُ الرديئة تُفضي إلى قراراتٍ تجارية خاطئة، أما الجودةُ العالية فتبني الثقة في النتائج.
Data Storyقصة البياناتسردٌ يُدمج البيانات والمرئيات والسياق لشرح رؤيةٍ لجمهورٍ تجاري. يُضفي معنىً على الأرقام بالإجابة عن سؤالَي «ماذا يعني؟» و«لماذا يهم؟».
Data Visualizationتصوير البياناتتحويلُ الأرقام الخام إلى مخططاتٍ وخرائط ورسوماتٍ بيانية يسهل استيعابها. الصورةُ تحكي قصة البيانات أسرع بكثيرٍ من جدولٍ مليء بالأرقام.
Data Warehouseمستودع البياناتقاعدةُ بياناتٍ ضخمة مُصمَّمة خصيصاً للتحليل والتقارير، تختزن البيانات التاريخية من مصادر متعددة. مُحسَّنةٌ للقراءة والاستعلام لا للمعاملات اليومية.
Data Wranglingمعالجة البيانات الخامتحويلُ البيانات الخام الفوضوية وتنسيقها إلى شكلٍ نظيفٍ جاهز للتحليل. تستنزف هذه المرحلةُ في الغالب الجزءَ الأكبر من وقت محلل البيانات.
Databaseقاعدة البياناتمجموعةٌ منظَّمة من البيانات المخزنة إلكترونياً وتُديرها نظامُ إدارة قواعد البيانات. تُتيح تخزين البيانات واسترجاعها وإدارتها بكفاءةٍ عالية.
Descriptive Statisticsالإحصاء الوصفيأرقامٌ أساسية تُلخّص مجموعة البيانات كالمتوسط والحد الأدنى والحد الأقصى والعدد. تُخبرك بما حدث في البيانات على مستوىً عالٍ وبسرعة.
Dimensionبُعدسمةٌ وصفية تُصنَّف بها البيانات، كاسم الدولة أو المنتج أو التاريخ. تُجيب الأبعادُ عن أسئلة «من؟» و«ماذا؟» و«أين؟» و«متى؟» في أي تحليل.
Dimension Tableجدول الأبعادجدولٌ يختزن المعلومات الوصفية حول الكيانات في جدول الحقائق، كأسماء المنتجات وبيانات العملاء والتواريخ. يُوفّر السياقَ الذي يُحيط بالأرقام ويمنحها معنىً.
Drill Downالتعمق في البياناتالنقرُ على رقمٍ ملخَّص للاطلاع على التفاصيل الكامنة وراءه، كالانتقال من إجمالي المبيعات إلى المبيعات حسب المدينة. يُعين على اكتشاف السبب الجذري لأي اتجاه.
ELT (Extract, Load, Transform)استخراج وتحميل وتحويل البياناتنسخةٌ حديثة من ETL تُحمَّل فيها البيانات الخام أولاً في المستودع، ثم تجري التحويلات هناك بـ SQL. أسرعُ وأكثر مرونةً مع مجموعات البيانات الضخمة.
Embedded Analyticsالتحليلات المدمجةدمجُ المخططات والتقارير مباشرةً داخل تطبيقٍ آخر كنظام إدارة علاقات العملاء أو الموقع الإلكتروني. يرى المستخدمون الرؤى التحليلية دون مغادرة الأداة التي يستخدمونها.
ETL (Extract, Transform, Load)استخراج وتحويل وتحميل البياناتالعمليةُ الجوهرية لسحب البيانات من المصدر وتنظيفها وإعادة هيكلتها ثم تحميلها في الوجهة كمستودع البيانات. تُشكّل العمودَ الفقري لمعظم أنابيب البيانات.
Fact Tableجدول الحقائقجدولٌ في مستودع البيانات يختزن الأحداث التجارية القابلة للقياس كعمليات البيع ومشاهدات الصفحات. يحتوي على أرقامٍ (مقاييس) ومفاتيح أجنبية تُشير إلى جداول الأبعاد.
Filteringالتصفيةانتقاءُ الصفوف التي تستوفي شرطاً محدداً فقط، كعرض الطلبات القادمة من المملكة العربية السعودية وحدها. تُضيّق البيانات لتركّز على ما يهمك في سؤالٍ بعينه.
Forecastingالتنبؤاستخدامُ البيانات التاريخية والأنماط للتنبؤ بالقيم المستقبلية، كتقدير إيراد الشهر القادم. يُقلّص الغموضَ ويُسهم في التخطيط واتخاذ القرار المستنير.
Foreign Keyالمفتاح الأجنبيعمودٌ في جدولٍ يرتبط بالمفتاح الأساسي لجدولٍ آخر لإنشاء علاقةٍ بينهما. يُطبّق قاعدة أن البيانات المرتبطة يجب أن توجد في كلا الجدولَين.
Granularityمستوى التفاصيلدرجةُ التفصيل في مجموعة البيانات، سواءٌ أكان كل صفٍّ يمثّل معاملةً أم يوماً أم عميلاً. كلما ارتفع المستوى زادت التفاصيل، وكلما انخفض زاد التجميع.
Hypothesis Testingاختبار الفرضياتأسلوبٌ إحصائي لتحديد ما إذا كانت ملاحظةٌ في البيانات حقيقيةً أم محض صدفة. تبدأ بافتراضٍ (فرضية) وتستخدم البيانات لقبوله أو رفضه.
Indexفهرسبنيةٌ في قاعدة البيانات تُسرّع استرجاع البيانات بتمكين قاعدة البيانات من تحديد الصفوف بسرعةٍ دون مسح الجدول بأكمله. كفهرس الكتاب تماماً، يوفّر وقت البحث.
Ingestionاستيعاب البياناتالخطوةُ الأولى في جلب البيانات من مصدرٍ خارجي إلى نظامك، كسحب البيانات من API أو قاعدة بيانات. تُمثّل حرف «E» (الاستخراج) في عملية ETL.
Joiningربط الجداولدمجُ جدولَين بمطابقة الصفوف بناءً على عمودٍ مشترك، كربط جدول العملاء بجدول الطلبات عبر معرّف العميل. يُتيح تحليل البيانات المترابطة معاً.
KPI (Key Performance Indicator)مؤشر الأداء الرئيسيرقمٌ محدد يُستخدم لقياس مدى تحقق هدفٍ تجاري، كالمبيعات الشهرية أو عدد زوار الموقع. يُخبرك على الفور إن كانت الأعمال تسير في المسار الصحيح.
Lineageنسب البياناتخريطةٌ توضّح مصدر البيانات وكيف تحرّكت وتحوّلت عبر أنظمتك المختلفة. تُفيد في استكشاف الأخطاء وفهم أثر أي تغييرٍ في مسار البيانات.
Meanالمتوسط الحسابيمجموعُ الأرقام مقسوماً على عددها، يُعطي نقطةً مرجعية مركزية للبيانات. الأكثرُ استخداماً لكنه قد يكون مضللاً حين توجد قيمٌ شاذة متطرفة.
Measureمقياسرقمٌ يُحسب عبر تجميع البيانات، كإجمالي المبيعات أو متوسط قيمة الطلب. في أدوات تحليل الأعمال، المقاييسُ هي الأرقام التي تُحلّلها لا الفئات التي تُصنّف بها.
Medianالوسيطالقيمةُ الوسطى في قائمةٍ مرتبة بحيث تكون نصف القيم فوقه ونصفها دونه. أكثرُ موثوقيةً من المتوسط حين تتضمن البيانات قيمٍ شاذة متطرفة.
Metadataالبيانات الوصفيةبياناتٌ تصف بياناتٍ أخرى، كتاريخ إنشاء الملف واسم مالكه وأسماء أعمدته. تُعينك على فهم محتوى مجموعة البيانات دون الاطلاع على السجلات الفعلية.
Missing Valuesالقيم المفقودةخلايا في مجموعة البيانات لم تُسجَّل فيها البيانات أو لا تتوفر. تُعالَج إما بتعبئتها بقيمٍ مقدَّرة (احتساب) أو بحذف الصفوف المعنية حسب السياق.
Modeالمنوالالقيمةُ التي تتكرر بأعلى تردد في مجموعة البيانات. فلو كان معظم العملاء يطلبون مقاس «M»، فذلك هو منوال عمود المقاسات.
Normal Distributionالتوزيع الطبيعيتوزيعٌ يشبه منحنى الجرس تتمركز فيه معظم القيم حول المتوسط وتقلّ نحو الأطراف. تتبع كثيرٌ من الظواهر الطبيعية هذا النمط كأطوال البشر ونتائج الاختبارات.
Normalizationالتسوية / التطبيعتنظيمُ قاعدة البيانات للحدّ من تكرار البيانات بتقسيمها إلى جداولٍ مترابطة. تُبقي البيانات نظيفةً ومتسقةً وأيسر في الصيانة.
NoSQLقواعد البيانات غير العلائقيةفئةٌ من قواعد البيانات تُخزّن البيانات بتنسيقاتٍ غير الجداول التقليدية، كالوثائق وأزواج المفاتيح والقيم والرسوم البيانية. مناسبةٌ للبيانات المرنة أو الهائلة الحجم.
OLAP (Online Analytical Processing)المعالجة التحليلية عبر الإنترنتتقنيةٌ تُتيح للمستخدمين استكشاف البيانات من زوايا متعددة بسرعةٍ عالية، كتقطيع مكعبٍ من البيانات. مُصمَّمةٌ للتحليل لا للمعاملات اليومية.
Orchestrationتنسيق العملياتتنسيقُ مهام أنبوب البيانات المتعددة وجدولتها لتُنفَّذ بالترتيب الصحيح وفي التوقيت المناسب. أدواتٌ كـ Airflow وPrefect تتولى هذه المهمة.
Outlierالقيمة الشاذةنقطةُ بياناتٍ تختلف اختلافاً كبيراً عن بقية المجموعة، كراتبٍ بمليون دولار في بيانات أجورٍ تتراوح معظمها حول خمسين ألفاً. القيمُ الشاذة تُشوّه النتائج وتستوجب التحقيق.
Paginated Reportتقرير مرقَّمتقريرٌ مُصمَّم للطباعة أو التصدير بصيغة PDF مع تنسيقٍ دقيق عبر صفحاتٍ متعددة. شائعٌ في الفواتير والقوائم المالية والوثائق التنظيمية.
Partitioningالتقسيمتجزئةُ الجدول الضخم إلى أقسامٍ فيزيائية أصغر بناءً على عمودٍ كالتاريخ أو المنطقة لتسريع الاستعلامات. يقرأ النظامُ القسم المطلوب فحسب بدلاً من مسح الجدول كله.
Pivot Tableالجدول المحوريأداةٌ في Excel أو برامج تحليل الأعمال تُلخّص مجموعات البيانات الكبيرة بتجميع القيم وتحليلها. تُظهر مثلاً إجمالي المبيعات لكل منتجٍ شهراً بشهر بنقراتٍ قليلة.
Primary Keyالمفتاح الأساسيمعرِّفٌ فريدٌ لكل صفٍّ في جدول قاعدة البيانات يضمن عدم وجود صفَّين متطابقَين. مثلاً، عمود Customer_ID يحمل رقماً مختلفاً لكل عميل.
Queryاستعلامسؤالٌ أو طلبٌ تُرسله إلى قاعدة البيانات لاسترجاع بياناتٍ محددة أو تعديلها، يُكتب عادةً بـ SQL. كمثل: «أعطني جميع عملاء الرياض الذين طلبوا الشهر الماضي».
Refresh Rateمعدل التحديثالفترةُ الزمنية بين كل سحبٍ للبيانات الحديثة في لوحة المعلومات أو التقرير، كساعةٍ واحدة أو مرةٍ يومياً. يُحدد مدى حداثة المعلومات التي يراها المستخدمون.
Regression Analysisتحليل الانحدارتقنيةٌ إحصائية تُنمذج العلاقة بين متغيرٍ تابع ومتغيرٍ أو أكثر مستقل. تُستخدم لفهم التأثيرات والتنبؤ بالقيم المستقبلية.
Reportتقريروثيقةٌ أو شاشةٌ تعرض بياناتٍ منظّمة للإجابة عن سؤالٍ تجاري، كإجمالي الإيراد حسب المنطقة. يُولَّد عادةً وفق جدولٍ زمني منتظم كيوميٍّ أو أسبوعي.
Row-Level Securityأمان على مستوى الصفإعدادٌ يُقيّد البيانات التي يستطيع كل مستخدمٍ رؤيتها بناءً على دوره، كعرض كل مندوب مبيعاتٍ لعملائه فحسب. يحمي البيانات الحساسة داخل تقارير تحليل الأعمال.
Samplingأخذ العيناتانتقاءُ مجموعةٍ فرعية تمثيلية أصغر من مجموعة البيانات الكبيرة لتحليلها. يُوفّر الوقتَ والموارد مع الحفاظ على دقةٍ كافية في الاستنتاجات.
Schemaمخطط البياناتالهيكلُ التصميمي لقاعدة البيانات الذي يحدد الجداول والأعمدة وأنواع البيانات وعلاقاتها. كهيكل العظمي الذي يُنظّم كيفية تخزين البيانات وترابطها.
Scorecardبطاقة الأداءعرضٌ ملخَّص يُبيّن ما إذا كانت مؤشرات الأداء تبلغ أهدافها، غالباً بألوان الأحمر والأصفر والأخضر. تمنح القيادةَ فحصاً سريعاً لصحة الأعمال.
Seasonalityالموسميةنمطٌ متكرر في البيانات بفتراتٍ منتظمة، كارتفاع مبيعات التجزئة كل ديسمبر. التعرفُ على الموسمية يُعين على التخطيط ووضع توقعاتٍ واقعية.
Segmentationالتجزئةتقسيمُ البيانات إلى مجموعاتٍ ذات معنى بناءً على خصائصٍ مشتركة، كتجميع العملاء حسب الفئة العمرية أو الموقع. يُعين على تخصيص الاستراتيجيات لكل شريحة.
Self-Service BIذكاء الأعمال الذاتيأدواتٌ تُمكّن مستخدمي الأعمال من بناء تقاريرهم الخاصة دون الحاجة إلى فريق تقنية المعلومات. Power BI وTableau أبرز الأمثلة عليها.
Semantic Layerالطبقة الدلاليةطبقةٌ وسيطة تُترجم جداول قاعدة البيانات الخام إلى مصطلحاتٍ تجارية مفهومة كـ«الإيراد» و«العملاء». تضمن توحيد التعريفات عبر جميع أقسام الشركة.
Skewnessالانحراف (التواء البيانات)مقياسٌ لعدم تناسق التوزيع، أي ما إذا كان ذيل البيانات أطول على اليسار أم اليمين. البياناتُ المنحرفة تجعل المتوسط والوسيط يتباعدان تباعداً ملحوظاً.
Slice and Diceتقطيع البياناتتصفيةُ البيانات وتقسيمها حسب فئاتٍ متعددة لدراستها من زوايا مختلفة. كعرض المبيعات حسب الشهر ثم المنتج ثم المنطقة في تسلسلٍ تحليلي متدرج.
Snowflake Schemaمخطط الندفة الثلجيةنسخةٌ أكثر تطبيعاً من مخطط النجمة تُقسَّم فيها جداول الأبعاد إلى جداولٍ فرعية. يُقلّص تكرارَ البيانات لكنه يُعقّد الاستعلامات قليلاً.
SQL (Structured Query Language)لغة الاستعلام الهيكليةاللغةُ المعيارية للتعامل مع قواعد البيانات العلائقية: قراءةً وإدراجاً وتعديلاً وحذفاً. المهارةُ الأساسية الأولى لكل من يعمل في مجال البيانات.
Standard Deviationالانحراف المعياريرقمٌ يُبيّن مدى تشتت قيم البيانات حول المتوسط. الانحرافُ الصغير يعني قيماً متقاربة، والكبير يعني قيماً متفرقة ومتباعدة.
Star Schemaمخطط النجمةتصميمٌ لقاعدة البيانات يتمحور حول جدول حقائقٍ مركزي تتصل به جداول أبعادٍ متعددة على شكل نجمة. الهيكلُ الأكثر شيوعاً في مستودعات البيانات لسرعة الاستعلام.
Stream Processingمعالجة البيانات المتدفقةمعالجةٌ مستمرة للبيانات لحظةَ وصولها في الوقت الفعلي، كتحليل منشورات التواصل الاجتماعي فور نشرها. تُتيح الرؤى الفورية والتنبيهات الآنية.
Tableجدولاللبنةُ الأساسية لقاعدة البيانات العلائقية، منظَّمةٌ في صفوفٍ (سجلات) وأعمدة (حقول). كل جدولٍ يمثّل كياناً واحداً كـ«العملاء» أو «الطلبات».
Time Seriesالسلاسل الزمنيةتسلسلٌ من نقاط البيانات المُسجَّلة في فتراتٍ زمنية منتظمة، كأسعار الأسهم اليومية أو الإيراد الشهري. تحليلُها يكشف الاتجاهات والموسمية والشذوذ.
Trend Analysisتحليل الاتجاهاتدراسةُ البيانات عبر الزمن لتحديد الأنماط المتكررة، كرصد ما إذا كانت المبيعات تتصاعد أم تتراجع شهراً بعد شهر. يُعين على التنبؤ بالسلوك المستقبلي استناداً إلى الماضي.
Varianceالتباينمقياسٌ لمدى بُعد كل قيمةٍ عن المتوسط، يُبيّن درجة انتشار البيانات. يساوي مربعَ الانحراف المعياري رياضياً.

لإثراء معرفتك
القائمة البريدية الخاصة بمعاذ!
ماراح اكون مزعج - بس كل ايميل بيكون مهم