| المصطلح بالإنجليزي | المصطلح بالعربية | التعريف بالعربية |
|---|---|---|
| A/B Testing | اختبار أ/ب | تجربةٌ تُعرض فيها نسختان من شيءٍ ما كصفحة ويب لمجموعتَي مستخدمين مختلفتَين لتحديد أيهما يُحقق أداءً أفضل. تستند إلى البيانات لاتخاذ القرار بدلاً من التخمين. |
| Ad Hoc Analysis | التحليل الفوري | الإجابةُ عن سؤالٍ غير مخطط له بشكلٍ آني باستخدام البيانات، كمعرفة المبيعات في ساعةٍ بعينها من أسبوعٍ ماضٍ. يُنفَّذ عند الطلب وبشكلٍ مستقل عن التقارير المجدولة. |
| Aggregation | التجميع | دمجُ صفوفٍ كثيرة من البيانات في قيمةٍ ملخَّصة واحدة، كجمع المبيعات الإجمالية أو إحصاء الطلبات. يُختزل التفصيلُ ليُعطي صورةً أشمل وأوضح. |
| API (Application Programming Interface) | واجهة برمجة التطبيقات | بوابةٌ برمجية تُتيح لنظامَي برمجيات التواصل وتبادل البيانات فيما بينهما. حين تسحب بياناتٍ من خدمة الطقس أو نظام الدفع، فأنت تستخدم واجهةً برمجية في الغالب. |
| Backfill | الملء الرجعي | إعادةُ تشغيل أنبوب البيانات لفتراتٍ زمنية ماضية لتعبئة البيانات التاريخية المفقودة. مثلاً، تحميل بيانات السنتين الماضيتين عند إعداد أنبوبٍ جديد. |
| Batch Processing | معالجة الدُّفعات | معالجةُ مجموعاتٍ كبيرة من سجلات البيانات دفعةً واحدة في أوقاتٍ مجدولة، كتشغيل مهمةٍ كل ليلة لتحديث أرقام المبيعات. فعّالةٌ لكنها ليست آنية. |
| CDC (Change Data Capture) | التقاط تغييرات البيانات | تقنيةٌ ترصد وتُسجّل كل عمليات الإدراج والتعديل والحذف في قاعدة البيانات المصدر بشكلٍ فوري. تُستخدم لإبقاء مستودعات البيانات متزامنةً دون إعادة تحميلٍ كامل. |
| Cloud Storage | التخزين السحابي | تخزينُ البيانات على خوادم بعيدة تديرها مزوّدو خدماتٍ كـ AWS وAzure وGoogle Cloud بدلاً من الأجهزة المحلية. قابلٌ للتوسع وبتكلفةٍ منخفضة ويُمكن الوصول إليه من أي مكان. |
| Cohort Analysis | تحليل المجموعات | تجميعُ المستخدمين وفق خاصيةٍ مشتركة أو تاريخ بدءٍ ومتابعة سلوكهم عبر الزمن. مثلاً، مقارنة معدل احتفاظ العملاء الذين اشتركوا في يناير بأولئك الذين اشتركوا في فبراير. |
| Connector | موصِّل | تكاملٌ جاهز يربط مصدر البيانات بأداة الأنبوب بنقراتٍ قليلة، كربط Salesforce بمستودع البيانات. يُغني عن كتابة كودٍ مخصص لكل مصدر. |
| Correlation | الارتباط | مقياسٌ لشدة العلاقة بين متغيرَين، تتراوح قيمته بين −1 و1. الارتباطُ الموجب يعني ارتفاعهما معاً، والسالب يعني ارتفاع أحدهما حين ينخفض الآخر. |
| Dashboard | لوحة المعلومات | شاشةٌ بصرية توحّد الأرقام الرئيسية والمخططات في مكانٍ واحد، شبيهةً بلوحة قيادة السيارة. تُمكّن من فهم أداء الأعمال بنظرةٍ سريعة دون الحاجة إلى تصفّح تقاريرٍ متفرقة. |
| Data Catalog | كتالوج البيانات | فهرسٌ قابل للبحث يُوثّق جميع أصول البيانات في المنظمة، شاملاً مواقعها ومعانيها. يُعين فرقَ البيانات على العثور على البيانات وفهمها بسرعة. |
| Data Cleaning | تنظيف البيانات | عمليةُ رصد الأخطاء والتكرارات والقيم المفقودة في مجموعة البيانات وتصحيحها قبل التحليل. البياناتُ القذرة تُفضي إلى استنتاجاتٍ خاطئة، أما النظيفة فتُنتج رؤىً موثوقة. |
| Data Dictionary | قاموس البيانات | وثيقةٌ تصف معنى كل عمودٍ في مجموعة البيانات وتنسيقه وقيمه المسموح بها. المرجعُ الذي يُعين الجميع على فهم البيانات بتعريفاتٍ موحَّدة. |
| Data Distribution | توزيع البيانات | النمطُ الذي تتوزع فيه القيم عبر نطاقٍ معين، يُعرض غالباً كمدرَّجٍ تكراري. من أشهر أنواعه: التوزيع الطبيعي (منحنى الجرس) والمتحيّز والمنتظم. |
| Data Governance | حوكمة البيانات | مجموعةٌ من القواعد والأدوار والعمليات التي تضمن إدارة البيانات بشكلٍ صحيح عبر المنظمة. تُحدّد من يملك البيانات ومن يصل إليها وكيف تُستخدم. |
| Data Lake | بحيرة البيانات | نظامٌ لتخزين كمياتٍ هائلة من البيانات الخام بأي تنسيق، سواءٌ أكانت منظَّمةً أم شبه منظَّمةٍ أم غير منظَّمة. خلافاً للمستودع، تُخزَّن البيانات أولاً وتُنظَّم لاحقاً. |
| Data Lakehouse | مستودع البيانات المختلط | معماريةٌ هجينة تجمع مرونة بحيرة البيانات في التخزين مع أداء مستودع البيانات في الاستعلام. تُتيح التخزين الخام والتحليل المنظَّم في بيئةٍ واحدة متكاملة. |
| Data Model | نموذج البيانات | تصميمٌ يحدد كيفية هيكلة البيانات وعلاقاتها وطريقة تخزينها، كمخطط بناءٍ للقاعدة أو أداة التحليل. النموذجُ الجيد يُسرّع الاستعلامات ويُيسّر التحليل. |
| Data Pipeline | خط أنابيب البيانات | سلسلةٌ آلية من الخطوات تنقل البيانات وتعالجها من نظامٍ إلى آخر. تشبه حزام المصنع الناقل الذي يحمل البيانات من المصدر إلى الوجهة النهائية. |
| Data Profiling | تحليل خصائص البيانات | فحصُ مجموعة البيانات لفهم هيكلها ومحتواها واكتمالها وجودتها. الخطوةُ الأولى التي تسبق التنظيف أو التحليل في أي مشروع بياناتٍ جدي. |
| Data Quality | جودة البيانات | مقياسٌ لدقة البيانات واكتمالها واتساقها وتوقيتها. البياناتُ الرديئة تُفضي إلى قراراتٍ تجارية خاطئة، أما الجودةُ العالية فتبني الثقة في النتائج. |
| Data Story | قصة البيانات | سردٌ يُدمج البيانات والمرئيات والسياق لشرح رؤيةٍ لجمهورٍ تجاري. يُضفي معنىً على الأرقام بالإجابة عن سؤالَي «ماذا يعني؟» و«لماذا يهم؟». |
| Data Visualization | تصوير البيانات | تحويلُ الأرقام الخام إلى مخططاتٍ وخرائط ورسوماتٍ بيانية يسهل استيعابها. الصورةُ تحكي قصة البيانات أسرع بكثيرٍ من جدولٍ مليء بالأرقام. |
| Data Warehouse | مستودع البيانات | قاعدةُ بياناتٍ ضخمة مُصمَّمة خصيصاً للتحليل والتقارير، تختزن البيانات التاريخية من مصادر متعددة. مُحسَّنةٌ للقراءة والاستعلام لا للمعاملات اليومية. |
| Data Wrangling | معالجة البيانات الخام | تحويلُ البيانات الخام الفوضوية وتنسيقها إلى شكلٍ نظيفٍ جاهز للتحليل. تستنزف هذه المرحلةُ في الغالب الجزءَ الأكبر من وقت محلل البيانات. |
| Database | قاعدة البيانات | مجموعةٌ منظَّمة من البيانات المخزنة إلكترونياً وتُديرها نظامُ إدارة قواعد البيانات. تُتيح تخزين البيانات واسترجاعها وإدارتها بكفاءةٍ عالية. |
| Descriptive Statistics | الإحصاء الوصفي | أرقامٌ أساسية تُلخّص مجموعة البيانات كالمتوسط والحد الأدنى والحد الأقصى والعدد. تُخبرك بما حدث في البيانات على مستوىً عالٍ وبسرعة. |
| Dimension | بُعد | سمةٌ وصفية تُصنَّف بها البيانات، كاسم الدولة أو المنتج أو التاريخ. تُجيب الأبعادُ عن أسئلة «من؟» و«ماذا؟» و«أين؟» و«متى؟» في أي تحليل. |
| Dimension Table | جدول الأبعاد | جدولٌ يختزن المعلومات الوصفية حول الكيانات في جدول الحقائق، كأسماء المنتجات وبيانات العملاء والتواريخ. يُوفّر السياقَ الذي يُحيط بالأرقام ويمنحها معنىً. |
| Drill Down | التعمق في البيانات | النقرُ على رقمٍ ملخَّص للاطلاع على التفاصيل الكامنة وراءه، كالانتقال من إجمالي المبيعات إلى المبيعات حسب المدينة. يُعين على اكتشاف السبب الجذري لأي اتجاه. |
| ELT (Extract, Load, Transform) | استخراج وتحميل وتحويل البيانات | نسخةٌ حديثة من ETL تُحمَّل فيها البيانات الخام أولاً في المستودع، ثم تجري التحويلات هناك بـ SQL. أسرعُ وأكثر مرونةً مع مجموعات البيانات الضخمة. |
| Embedded Analytics | التحليلات المدمجة | دمجُ المخططات والتقارير مباشرةً داخل تطبيقٍ آخر كنظام إدارة علاقات العملاء أو الموقع الإلكتروني. يرى المستخدمون الرؤى التحليلية دون مغادرة الأداة التي يستخدمونها. |
| ETL (Extract, Transform, Load) | استخراج وتحويل وتحميل البيانات | العمليةُ الجوهرية لسحب البيانات من المصدر وتنظيفها وإعادة هيكلتها ثم تحميلها في الوجهة كمستودع البيانات. تُشكّل العمودَ الفقري لمعظم أنابيب البيانات. |
| Fact Table | جدول الحقائق | جدولٌ في مستودع البيانات يختزن الأحداث التجارية القابلة للقياس كعمليات البيع ومشاهدات الصفحات. يحتوي على أرقامٍ (مقاييس) ومفاتيح أجنبية تُشير إلى جداول الأبعاد. |
| Filtering | التصفية | انتقاءُ الصفوف التي تستوفي شرطاً محدداً فقط، كعرض الطلبات القادمة من المملكة العربية السعودية وحدها. تُضيّق البيانات لتركّز على ما يهمك في سؤالٍ بعينه. |
| Forecasting | التنبؤ | استخدامُ البيانات التاريخية والأنماط للتنبؤ بالقيم المستقبلية، كتقدير إيراد الشهر القادم. يُقلّص الغموضَ ويُسهم في التخطيط واتخاذ القرار المستنير. |
| Foreign Key | المفتاح الأجنبي | عمودٌ في جدولٍ يرتبط بالمفتاح الأساسي لجدولٍ آخر لإنشاء علاقةٍ بينهما. يُطبّق قاعدة أن البيانات المرتبطة يجب أن توجد في كلا الجدولَين. |
| Granularity | مستوى التفاصيل | درجةُ التفصيل في مجموعة البيانات، سواءٌ أكان كل صفٍّ يمثّل معاملةً أم يوماً أم عميلاً. كلما ارتفع المستوى زادت التفاصيل، وكلما انخفض زاد التجميع. |
| Hypothesis Testing | اختبار الفرضيات | أسلوبٌ إحصائي لتحديد ما إذا كانت ملاحظةٌ في البيانات حقيقيةً أم محض صدفة. تبدأ بافتراضٍ (فرضية) وتستخدم البيانات لقبوله أو رفضه. |
| Index | فهرس | بنيةٌ في قاعدة البيانات تُسرّع استرجاع البيانات بتمكين قاعدة البيانات من تحديد الصفوف بسرعةٍ دون مسح الجدول بأكمله. كفهرس الكتاب تماماً، يوفّر وقت البحث. |
| Ingestion | استيعاب البيانات | الخطوةُ الأولى في جلب البيانات من مصدرٍ خارجي إلى نظامك، كسحب البيانات من API أو قاعدة بيانات. تُمثّل حرف «E» (الاستخراج) في عملية ETL. |
| Joining | ربط الجداول | دمجُ جدولَين بمطابقة الصفوف بناءً على عمودٍ مشترك، كربط جدول العملاء بجدول الطلبات عبر معرّف العميل. يُتيح تحليل البيانات المترابطة معاً. |
| KPI (Key Performance Indicator) | مؤشر الأداء الرئيسي | رقمٌ محدد يُستخدم لقياس مدى تحقق هدفٍ تجاري، كالمبيعات الشهرية أو عدد زوار الموقع. يُخبرك على الفور إن كانت الأعمال تسير في المسار الصحيح. |
| Lineage | نسب البيانات | خريطةٌ توضّح مصدر البيانات وكيف تحرّكت وتحوّلت عبر أنظمتك المختلفة. تُفيد في استكشاف الأخطاء وفهم أثر أي تغييرٍ في مسار البيانات. |
| Mean | المتوسط الحسابي | مجموعُ الأرقام مقسوماً على عددها، يُعطي نقطةً مرجعية مركزية للبيانات. الأكثرُ استخداماً لكنه قد يكون مضللاً حين توجد قيمٌ شاذة متطرفة. |
| Measure | مقياس | رقمٌ يُحسب عبر تجميع البيانات، كإجمالي المبيعات أو متوسط قيمة الطلب. في أدوات تحليل الأعمال، المقاييسُ هي الأرقام التي تُحلّلها لا الفئات التي تُصنّف بها. |
| Median | الوسيط | القيمةُ الوسطى في قائمةٍ مرتبة بحيث تكون نصف القيم فوقه ونصفها دونه. أكثرُ موثوقيةً من المتوسط حين تتضمن البيانات قيمٍ شاذة متطرفة. |
| Metadata | البيانات الوصفية | بياناتٌ تصف بياناتٍ أخرى، كتاريخ إنشاء الملف واسم مالكه وأسماء أعمدته. تُعينك على فهم محتوى مجموعة البيانات دون الاطلاع على السجلات الفعلية. |
| Missing Values | القيم المفقودة | خلايا في مجموعة البيانات لم تُسجَّل فيها البيانات أو لا تتوفر. تُعالَج إما بتعبئتها بقيمٍ مقدَّرة (احتساب) أو بحذف الصفوف المعنية حسب السياق. |
| Mode | المنوال | القيمةُ التي تتكرر بأعلى تردد في مجموعة البيانات. فلو كان معظم العملاء يطلبون مقاس «M»، فذلك هو منوال عمود المقاسات. |
| Normal Distribution | التوزيع الطبيعي | توزيعٌ يشبه منحنى الجرس تتمركز فيه معظم القيم حول المتوسط وتقلّ نحو الأطراف. تتبع كثيرٌ من الظواهر الطبيعية هذا النمط كأطوال البشر ونتائج الاختبارات. |
| Normalization | التسوية / التطبيع | تنظيمُ قاعدة البيانات للحدّ من تكرار البيانات بتقسيمها إلى جداولٍ مترابطة. تُبقي البيانات نظيفةً ومتسقةً وأيسر في الصيانة. |
| NoSQL | قواعد البيانات غير العلائقية | فئةٌ من قواعد البيانات تُخزّن البيانات بتنسيقاتٍ غير الجداول التقليدية، كالوثائق وأزواج المفاتيح والقيم والرسوم البيانية. مناسبةٌ للبيانات المرنة أو الهائلة الحجم. |
| OLAP (Online Analytical Processing) | المعالجة التحليلية عبر الإنترنت | تقنيةٌ تُتيح للمستخدمين استكشاف البيانات من زوايا متعددة بسرعةٍ عالية، كتقطيع مكعبٍ من البيانات. مُصمَّمةٌ للتحليل لا للمعاملات اليومية. |
| Orchestration | تنسيق العمليات | تنسيقُ مهام أنبوب البيانات المتعددة وجدولتها لتُنفَّذ بالترتيب الصحيح وفي التوقيت المناسب. أدواتٌ كـ Airflow وPrefect تتولى هذه المهمة. |
| Outlier | القيمة الشاذة | نقطةُ بياناتٍ تختلف اختلافاً كبيراً عن بقية المجموعة، كراتبٍ بمليون دولار في بيانات أجورٍ تتراوح معظمها حول خمسين ألفاً. القيمُ الشاذة تُشوّه النتائج وتستوجب التحقيق. |
| Paginated Report | تقرير مرقَّم | تقريرٌ مُصمَّم للطباعة أو التصدير بصيغة PDF مع تنسيقٍ دقيق عبر صفحاتٍ متعددة. شائعٌ في الفواتير والقوائم المالية والوثائق التنظيمية. |
| Partitioning | التقسيم | تجزئةُ الجدول الضخم إلى أقسامٍ فيزيائية أصغر بناءً على عمودٍ كالتاريخ أو المنطقة لتسريع الاستعلامات. يقرأ النظامُ القسم المطلوب فحسب بدلاً من مسح الجدول كله. |
| Pivot Table | الجدول المحوري | أداةٌ في Excel أو برامج تحليل الأعمال تُلخّص مجموعات البيانات الكبيرة بتجميع القيم وتحليلها. تُظهر مثلاً إجمالي المبيعات لكل منتجٍ شهراً بشهر بنقراتٍ قليلة. |
| Primary Key | المفتاح الأساسي | معرِّفٌ فريدٌ لكل صفٍّ في جدول قاعدة البيانات يضمن عدم وجود صفَّين متطابقَين. مثلاً، عمود Customer_ID يحمل رقماً مختلفاً لكل عميل. |
| Query | استعلام | سؤالٌ أو طلبٌ تُرسله إلى قاعدة البيانات لاسترجاع بياناتٍ محددة أو تعديلها، يُكتب عادةً بـ SQL. كمثل: «أعطني جميع عملاء الرياض الذين طلبوا الشهر الماضي». |
| Refresh Rate | معدل التحديث | الفترةُ الزمنية بين كل سحبٍ للبيانات الحديثة في لوحة المعلومات أو التقرير، كساعةٍ واحدة أو مرةٍ يومياً. يُحدد مدى حداثة المعلومات التي يراها المستخدمون. |
| Regression Analysis | تحليل الانحدار | تقنيةٌ إحصائية تُنمذج العلاقة بين متغيرٍ تابع ومتغيرٍ أو أكثر مستقل. تُستخدم لفهم التأثيرات والتنبؤ بالقيم المستقبلية. |
| Report | تقرير | وثيقةٌ أو شاشةٌ تعرض بياناتٍ منظّمة للإجابة عن سؤالٍ تجاري، كإجمالي الإيراد حسب المنطقة. يُولَّد عادةً وفق جدولٍ زمني منتظم كيوميٍّ أو أسبوعي. |
| Row-Level Security | أمان على مستوى الصف | إعدادٌ يُقيّد البيانات التي يستطيع كل مستخدمٍ رؤيتها بناءً على دوره، كعرض كل مندوب مبيعاتٍ لعملائه فحسب. يحمي البيانات الحساسة داخل تقارير تحليل الأعمال. |
| Sampling | أخذ العينات | انتقاءُ مجموعةٍ فرعية تمثيلية أصغر من مجموعة البيانات الكبيرة لتحليلها. يُوفّر الوقتَ والموارد مع الحفاظ على دقةٍ كافية في الاستنتاجات. |
| Schema | مخطط البيانات | الهيكلُ التصميمي لقاعدة البيانات الذي يحدد الجداول والأعمدة وأنواع البيانات وعلاقاتها. كهيكل العظمي الذي يُنظّم كيفية تخزين البيانات وترابطها. |
| Scorecard | بطاقة الأداء | عرضٌ ملخَّص يُبيّن ما إذا كانت مؤشرات الأداء تبلغ أهدافها، غالباً بألوان الأحمر والأصفر والأخضر. تمنح القيادةَ فحصاً سريعاً لصحة الأعمال. |
| Seasonality | الموسمية | نمطٌ متكرر في البيانات بفتراتٍ منتظمة، كارتفاع مبيعات التجزئة كل ديسمبر. التعرفُ على الموسمية يُعين على التخطيط ووضع توقعاتٍ واقعية. |
| Segmentation | التجزئة | تقسيمُ البيانات إلى مجموعاتٍ ذات معنى بناءً على خصائصٍ مشتركة، كتجميع العملاء حسب الفئة العمرية أو الموقع. يُعين على تخصيص الاستراتيجيات لكل شريحة. |
| Self-Service BI | ذكاء الأعمال الذاتي | أدواتٌ تُمكّن مستخدمي الأعمال من بناء تقاريرهم الخاصة دون الحاجة إلى فريق تقنية المعلومات. Power BI وTableau أبرز الأمثلة عليها. |
| Semantic Layer | الطبقة الدلالية | طبقةٌ وسيطة تُترجم جداول قاعدة البيانات الخام إلى مصطلحاتٍ تجارية مفهومة كـ«الإيراد» و«العملاء». تضمن توحيد التعريفات عبر جميع أقسام الشركة. |
| Skewness | الانحراف (التواء البيانات) | مقياسٌ لعدم تناسق التوزيع، أي ما إذا كان ذيل البيانات أطول على اليسار أم اليمين. البياناتُ المنحرفة تجعل المتوسط والوسيط يتباعدان تباعداً ملحوظاً. |
| Slice and Dice | تقطيع البيانات | تصفيةُ البيانات وتقسيمها حسب فئاتٍ متعددة لدراستها من زوايا مختلفة. كعرض المبيعات حسب الشهر ثم المنتج ثم المنطقة في تسلسلٍ تحليلي متدرج. |
| Snowflake Schema | مخطط الندفة الثلجية | نسخةٌ أكثر تطبيعاً من مخطط النجمة تُقسَّم فيها جداول الأبعاد إلى جداولٍ فرعية. يُقلّص تكرارَ البيانات لكنه يُعقّد الاستعلامات قليلاً. |
| SQL (Structured Query Language) | لغة الاستعلام الهيكلية | اللغةُ المعيارية للتعامل مع قواعد البيانات العلائقية: قراءةً وإدراجاً وتعديلاً وحذفاً. المهارةُ الأساسية الأولى لكل من يعمل في مجال البيانات. |
| Standard Deviation | الانحراف المعياري | رقمٌ يُبيّن مدى تشتت قيم البيانات حول المتوسط. الانحرافُ الصغير يعني قيماً متقاربة، والكبير يعني قيماً متفرقة ومتباعدة. |
| Star Schema | مخطط النجمة | تصميمٌ لقاعدة البيانات يتمحور حول جدول حقائقٍ مركزي تتصل به جداول أبعادٍ متعددة على شكل نجمة. الهيكلُ الأكثر شيوعاً في مستودعات البيانات لسرعة الاستعلام. |
| Stream Processing | معالجة البيانات المتدفقة | معالجةٌ مستمرة للبيانات لحظةَ وصولها في الوقت الفعلي، كتحليل منشورات التواصل الاجتماعي فور نشرها. تُتيح الرؤى الفورية والتنبيهات الآنية. |
| Table | جدول | اللبنةُ الأساسية لقاعدة البيانات العلائقية، منظَّمةٌ في صفوفٍ (سجلات) وأعمدة (حقول). كل جدولٍ يمثّل كياناً واحداً كـ«العملاء» أو «الطلبات». |
| Time Series | السلاسل الزمنية | تسلسلٌ من نقاط البيانات المُسجَّلة في فتراتٍ زمنية منتظمة، كأسعار الأسهم اليومية أو الإيراد الشهري. تحليلُها يكشف الاتجاهات والموسمية والشذوذ. |
| Trend Analysis | تحليل الاتجاهات | دراسةُ البيانات عبر الزمن لتحديد الأنماط المتكررة، كرصد ما إذا كانت المبيعات تتصاعد أم تتراجع شهراً بعد شهر. يُعين على التنبؤ بالسلوك المستقبلي استناداً إلى الماضي. |
| Variance | التباين | مقياسٌ لمدى بُعد كل قيمةٍ عن المتوسط، يُبيّن درجة انتشار البيانات. يساوي مربعَ الانحراف المعياري رياضياً. |
الرئيسية البيانات