ماجستير في البيانات الكبيرة والتحليلات

عام

وصف البرنامج

ماجستير في البيانات الكبيرة والتحليلات

ماجستير على الانترنت في البيانات الكبيرة والتحليلات

ولد ماجستير في البيانات الكبيرة والتحليلات نتيجة للاتحاد بين الخبرة الواسعة في التدريب والبحث ، في مجال التكنولوجيا ، والتي تتميز UPC ، مدعومة بالاعتراف والاعتمادات لديها ، على الصعيدين الوطني و الدولي؛ والخبرة في التدريب عبر الإنترنت ، مع التركيز التكنولوجي والأعمال ، من OBS .

ستسمح بنية الماجستير في البيانات الكبيرة والتحليلات للطلاب بتحديد متى يمكن لنوع حلول البيانات الكبيرة أن يساعد المؤسسة ويحكم تنفيذها داخلها.

خلال البرنامج ، ستظهر ثلاث كتل كبيرة:

  • كتلة I. الإدارة والتخزين.
  • بلوك II العمليات والتحليل.
  • بلوك الثالث التصور والأعمال.

خلال البرنامج ، سيتم تطبيق المعرفة بالحلول التكنولوجية بطريقة عملية ، لأن الهدف هو تقريب الطالب من التكنولوجيا الحالية المتاحة في السوق لتكون قادرة على لمسها ورؤية قابليتها للتطبيق.

فرص وظيفية

في OBS ، نلتزم بالتدريب كمحرك للتغيير والنمو والتحسين الشخصي والمهني. سيساهم التطبيق في المجال المهني للكفاءات المتقدمة ، في جميع أنحاء البرنامج ، في نمو الطلاب وتحسينهم وكذلك شركاتهم.

يعد التحول الرقمي للشركات حقيقة واقعة وهذا يعني حدوث تغييرات في المجالات الوظيفية المختلفة لها. ولهذا السبب يجب أن يكون المحترفون على استعداد لاستخدام الأدوات الجديدة التي توفرها البيئة التكنولوجية الجديدة.

تم تصنيف الرحلات الاحترافية إلى:

  • المسؤول عن مشاريع البيانات الكبيرة وتحليلات الأعمال المتقدمة.
  • مستشار خارجي
  • رئيس تحليلات البيانات الضخمة للبنية التحتية في مجال تكنولوجيا المعلومات والاتصالات.
  • مسؤول البيانات الرئيسي
  • محلل بيانات

أهداف

مع وجود نظام بيئي يضم 1000 من حلول البيانات الكبيرة ، ضمن سوق متغيرة لا يتوقف عن النمو عامًا بعد عام ، من الضروري التكيّف المستمر وتحديد أسس البنية بشكل صحيح ، ولكن دائمًا تحت مظلة توقعات الأعمال.

لن تحصل الكميات الكبيرة من البيانات والتنوع والسرعة على ما هو أكثر من مجرد إهدار موارد منظمة ليست واضحة حول ما تريد حلها. لذلك ، فإن معرفة السبب وراء توقعات المنظمة (خفض التكاليف أو زيادة الإيرادات) وما هي العناصر التي ستشير إلى صلاحية مشروع البيانات الكبيرة.

ماجستير في البيانات الكبيرة والتحليلات يقدم نهجا عملية وصارمة في الأساس موجهة لتنفيذ تكنولوجيا البيانات الكبيرة مع ضمانات النجاح.

الهدف العام

الهدف العام للماجستير في البيانات الضخمة والتحليلات هو توفير المعرفة اللازمة لإدارة مشروع البيانات الضخمة من جميع جوانبه ، بدءًا من كيفية تحديد الفرصة في المنظمة إلى ما يتم تسليمه إلى مجالات العمل.

يركز الماجستير في البيانات الكبيرة والتحليلات على أكثر من حل واحد. الهدف من ذلك هو أن يتمكن المسؤول المسؤول من تحديد ما إذا كانت المؤسسة تواجه تحدي البيانات الكبيرة ولديها عملية محددة من الخطوات التي يجب اتباعها: تحديد نوع الحلول التي سيتم تبنيها ؛ الملامح المهنية ستحتاج ؛ إعداد خطة الجدوى الاقتصادية ويكون الأساسيات لإدارة قابلية التوسع.

أهداف محددة

تم تصميم منهج الماجستير في البيانات الكبيرة والتحليلات لتحقيق الأهداف المحددة التالية:

  • فهم كيفية تحويل مؤسسة تقليدية ، من خلال تطبيق مفهوم تحليل البيانات أو تحليلات البيانات الكبيرة ، إلى مؤسسة تعتمد على البيانات.
  • تعرف على الأطر التكنولوجية الرئيسية للسوق وتطبيقاتها الرئيسية: Hadoop ، Spark ، Neo4j.
  • حدد الأنواع المختلفة من المعلومات وعمليات تخزينها وجودتها.
  • فهم كيفية استخراج المعرفة من البيانات لإنشاء نماذج تنبؤية من خلال الإحصاءات التنبؤية والتعلم الآلي.
  • إتقان تقنيات إدارة البيانات: الاستحواذ والتخزين والعملية والتحليل والتصور.
  • اكتشف تقنيات التصور الجديدة للوحة القيادة لتحسين عملية صنع القرار.

المناهج الدراسية

كتلة I. الإدارة والتخزين

دورة تسوية البيانات الكبيرة

بالتوازي مع الوحدة 1 ، يبدأ الطلاب برنامج Big Data and Analytics مع دورة التسوية هذه التي توفر قواعد المعرفة التقنية اللازمة لمتابعة البرنامج وتنفيذ مشاريع البيانات الكبيرة. في هذه الدورة ، سيجد الطلاب موارد مادية تسمح لهم بالتعمق في مواضيع مختلفة ضرورية لمتابعة الدورة وسيأتون للامتحانات التي ستكون بمثابة دليل لتقييم معارفهم والتقييم النهائي للدورة.

الوحدة 1. إدارة تحليلات البيانات الكبيرة

في هذه الوحدة ، سوف نقدم المفاهيم الأساسية للبيانات الكبيرة لمعرفة كيفية تحديد مفاتيح كل مشروع وقابلية التوسع. إن اكتشاف تباين البيانات وقياس الحجم والسرعة ، قبل البدء ، سيساعدنا على تحديد المراحل التي ينبغي تنفيذها قبل البدء في مشروع البيانات الضخمة ، والأهم من ذلك ، ما العائد الذي نتوقعه من المشروع؟ ما التوقعات التي لديها الأعمال؟

الأهداف:

  • تحديد متى يكون المشروع بيانات كبيرة.
  • ابحث عن العائد على الاستثمار في مشروع البيانات الكبيرة.
  • فهم وتطبيق مفاهيم الظلام البيانات والبيانات المفتوحة.
  • قم بتوجيه المؤسسة لتكون مؤسسة تعتمد على البيانات ودعم المشروع.
  • معرفة شرعية البيانات.
  • تحديد شخصية علم البيانات داخل المنظمة.

الوحدة 2. هندسة البيانات الكبيرة

سيكون النظام الإيكولوجي لحلول البيانات الضخمة كبيرًا مثل أنواع البيانات وقدرة العمليات التي نحتاجها في المشروع يركز معظمهم على قابلية التوسع والتنوع ويعتمدون أساسًا على البيئات السحابية. لا ترغب بعض الشركات في تحميل بياناتها الأكثر أهمية في السحابة وتفضل أن تكون في المنزل ، بينما تفضل شركات أخرى 100٪ من البيئات السحابية أو المختلطة.

في هذه الوحدة ، سوف نكتشف PROs و NOCs لكل هندسة ، ومقدمي الحلول الرئيسيين ، وكيف يمكننا بناء أكثر البيئات مرونة ، ونبحث دائمًا عن الهيكل الأكثر كفاءة في الحلول والتكلفة.

الأهداف:

  • اكتشاف نماذج من أبنية On Premise، Hybrid، On Cloud.
  • فهم دور Hadoop و HDFS كأساس لموازنة العمليات.
  • تعرف على ما هو سبارك والنظام البيئي Hive و Pig و Sqoop و Flume.
  • تحديد مزايا Kubernetes و Databricks.

الوحدة 3. ETLs و ELTs

يمكن الحصول على المعلومات من مصادر خارج المنظمة (الشبكات الاجتماعية ، البيانات المفتوحة ، من بين أمور أخرى) وقواعد البيانات الداخلية (CRMs ، ERP ، المعاملات ، وغيرها). يجب تحويل كل هذه البيانات قبل قراءتها أو بعد ذلك لمعالجتها لاحقًا من خلال عمليات التجميع التي تسمح لنا بالحصول على مؤشرات الأداء الرئيسية.

في هذا الوقت ، يجب أن نحدد قواعد الجودة للتحقق من صحة البيانات وعدم إفقار بحيرة البيانات الخاصة بنا.

في هذه الوحدة التعليمية ، سنتعلم تحديد الأسس التي يجب أن تتضمنها جميع عمليات تحميل البيانات لضمان النزاهة والتعقيم والتاريخ والعودة في الأحمال.

الأهداف:

  • فهم الفرق بين ETLs و ELTs.
  • فهم فوائد عمليات ETL.
  • تحديد مؤشرات الأداء الرئيسية ل MDM.
  • دمج النظم المختلفة.
  • القدرة على إدارة استخدام الاستثناءات.
  • فهم الفرق بين بحيرة البيانات ومستودع البيانات.

الوحدة 4. بحيرات البيانات

يتطلب تسجيل كميات كبيرة من المعلومات أنواعًا مختلفة من قواعد البيانات ، إلى جانب قواعد البيانات العلائقية مع اتباع نهج أكثر تقليدية ؛ على سبيل المثال ، تعد مقاطع الفيديو أو الطرق أو المسارات الحرجة أو المستندات أو الشبكات الاجتماعية مصادر شائعة بشكل متزايد بين مصادر المعلومات التي تهم الشركة.

لقد تكيف سوق التكنولوجيا مع كل منهم وخلق حلولًا لتتمكن من تخزينها واستغلالها على النحو الأمثل. في هذه الوحدة ، سنكتشف مزاياها وعيوبها ، وسننفذ ممارسات صغيرة على كل منها لاستكشاف إمكاناتها.

الأهداف:

  • معرفة قواعد البيانات العلائقية مقابل NOSQL.
  • تعرف قواعد البيانات عمودي.
  • تعرف قواعد البيانات الرسم البياني. Neo4j.
  • تعرف قواعد البيانات الوثائقية.
  • اكتشاف مصادر البيانات خارج المنظمة لإثراء بحيرة البيانات الخاصة بنا.
  • فهم دور تدفقات البيانات في صنع القرار في الوقت الحقيقي.
بلوك II العمليات والتحليل

الوحدة 5. استخراج البيانات

في هذه الوحدة التعليمية ، سنتعلم استخراج المعلومات من مجموعة بيانات بحيرة البيانات ، وقبل كل شيء ، لجعلها قابلة للتفسير. خلال العملية ، يجب أن نكون واضحين بشأن أهداف العمل ، والأدوات التي ستساعدنا على تطهير البيانات ، وتحديد النماذج الرياضية الأفضل وتأهيل النتائج.

الأهداف:

  • حدد مجموعة البيانات التي يمكن أن تحل بشكل أفضل مسألة العمل ، من البيانات المتاحة.
  • تحويل مجموعة بيانات الإدخال.
  • حدد أنسب أساليب استخراج البيانات ، على سبيل المثال ، الشبكات العصبية ، أشجار القرارات ، قواعد التجميع أو الارتباط.
  • فهم عملية استخراج المعرفة.
  • تفسير وتقييم البيانات.

الوحدة 6. تحليلات متقدمة: R و Python

بمجرد حصولنا على البيانات الصحيحة ، سيكون الوقت قد حان لاستخراج المعرفة وتفسيرها ونقل المعرفة إلى مستوى جديد. في هذه الوحدة ، سننشئ قاعدة إحصائية صغيرة للعمل مع اثنين من أدوات التحليلات المتقدمة الرئيسية في السوق: R و Python. معهم ، سيتم تنفيذ ممارسات صغيرة لاكتشاف وقت استخدام كل منها واستخراج أقصى إمكانات من البيانات.

الأهداف:

  • معرفة أساس الإحصاء وحساب الاحتمالات.
  • تطبيق تحليل البيانات متعدد المتغيرات.
  • فهم وتطبيق السلاسل الزمنية.
  • فهم عملية الرقابة الإحصائية لجودة البيانات.
  • حساب الارتباطات والأنماط.
  • تعرف على عملية تجميع البيانات.

الوحدة 7. تعلم الآلة

في الوحدات النمطية السابقة ، نرى كيفية تفسير البيانات الحالية ، وكيفية استخراج المعرفة بكل ما حدث لنا. في هذه الوحدة التعليمية ، سنقترب من "التعلم الآلي" لنرى كيف يمكننا ، مع المعلومات الجيدة ، التعامل مع المتنبئين. سنكتشف التقنيات الرئيسية وأدوات السوق ونوع وحجم المعلومات الضرورية وسنقوم بإنشاء وحدات عملية صغيرة لمعرفة مدى قابليتها للتطبيق.

الأهداف:

  • فهم الفرق بين التعلم الخاضع للإشراف والتعليم غير الخاضع للإشراف.
  • معرفة أساليب التصنيف المختلفة ، من الأشجار القرار إلى تقنيات بايزي.
  • فهم مفهوم التعلم الآلي.
  • تحديد المصدر المفتوح الرئيسي والبرمجيات التجارية.
بلوك الثالث التصور والأعمال

الوحدة 8. حوكمة البيانات.

بمجرد أن تتوفر لدينا جميع المعلومات ، يجب أن نحدد قواعد الاستخدام: من يمكنه رؤية البيانات ، وتعريف كل البيانات ، والنسب وتزويد المستخدمين بالأدوات اللازمة لتفسيرها.

حوكمة البيانات هي المكان الذي تفشل فيه العديد من الشركات ، والتي لها قيمتان مختلفتان لنفس مؤشر الأداء الرئيسي أو التنبؤي ، مما يؤدي إلى عدم الثقة بين مجالات العمل المختلفة.

في هذه الوحدة التعليمية ، سوف نتعلم أساليب حوكمة المعلومات للحفاظ على النزاهة والأمن والتتبع ، لضمان أن البيانات تساعد على اتخاذ قرارات آمنة دون إثارة عدم الثقة.

الأهداف:

  • فهم ما هي إمكانية الوصول إلى البيانات.
  • إدارة البيانات كأصل.
  • ضمان النزاهة.
  • تحديد KPIs الرئيسية وتتبع البيانات.
  • فهم مفهوم الأمن.

الوحدة 9. تقنيات التصور

في هذه الوحدة ، سوف نكتشف تقنيات التصوير المرئي المختلفة ومتى نستخدم كل منها. تحتاج الكميات الكبيرة من البيانات إلى تمثيلات رسومية جديدة لتفسيرها: خرائط الحرارة ، المجموعات ، الأبعاد ، المسارات الحرجة ، من بين أشياء أخرى.

بالإضافة إلى الرسومات ، من المهم ربط التقييم بكل واحد منهم وإنشاء تفسير. يمكن للمؤشرات أن تربك وتعيق عملية صنع القرار وتوجيهها ووضعها في سياقها وإخضاعها للمساعدة في تفسير أفضل:

الأهداف:

  • اكتشاف الأنواع المتاحة من الرسومات.
  • تعرف على حالات الاستخدام والتمثيلات الرسومية الرئيسية الخاصة بهم.فهم العملية المرتبطة بتمرير الرسومات إلى سرد قصة العمل.
  • تعرف على كيفية تبسيط وإضافة لوحات معلومات العنوان.

الوحدة 10. تصور البيانات وأدوات الخدمة الذاتية

أخيرًا ، نظرًا لأن النظام البيئي لأدوات التصور معقد ، سيكون من المهم اختيار الأنسب لكل نوع من المنظمات. يجب أن نضع في اعتبارنا أننا في مؤسسة نسعى لتبسيط التكنولوجيا ويجب أن نجد حلاً للمنظمة بأكملها. عندها فقط يمكننا أن نضمن بسهولة أمان وإمكانية الوصول وتوافر نفس مؤشرات الأداء الرئيسية.

الخدمة الذاتية هي عنصر أساسي في المؤسسات الكبيرة التي تضم الوفود والفروع ، إلخ. يتيح لك تطبيق اللامركزية على المعلومات وجعل كل عقدة في المؤسسة مستقلة ، في هذه الوحدة سوف نكتشف الأدوات الرئيسية لتصور البيانات والخدمة الذاتية.

الأهداف:

  • حدد أدوات السوق الرئيسية: Qlikview / sense ، Tableau ، PowerBI ، Cognos.
  • تعرف على نقاط القوة والضعف لكل منها.
  • قم بإجراء دراسة حالة باستخدام Qliksense وبيانات الخدمة الذاتية.
المشروع النهائي

خلال مشروع الماجستير النهائي (PFM) ، سيعمل الطالب جنبًا إلى جنب مع شركة حقيقية في تطوير المشروع. سيكون لهذا الخيار للقيام بذلك لشركتك الخاصة أو الاختيار من بين الخيارات التي تقترحها المدرسة.

قد تأخذ المشروعات المقترحة طريقتين ، الأعمال و / أو التكنولوجية ، وفي هذه الطرق قد تتخذ أشكالًا متعددة ، فيما يلي بعض الأمثلة:

النهج 1. الأعمال

  • مثال 1. تطوير خطة العمل بما في ذلك المعدات والبنية التحتية والتسليمات التجارية في حالة عمل نظرية مع أنواع مختلفة من البيانات.
  • مثال 2. مشروع استشارات الأعمال لحالة عمل حقيقية.

التركيز 2. التكنولوجية

  • مثال 1. تطوير لوحات معلومات العمل باستخدام أداة سوق بها أنواع مختلفة من البيانات وتعريف المؤشرات.
ورش العمل

في الماجستير في البيانات الكبيرة والتحليلات ، ستتاح للطالب الفرصة لإجراء ورشتي عمل عمليتين. ورش العمل هذه هي:

ورشة عمل 1. Neo4j

في ورشة العمل هذه ، سوف نعرف من الناحية الفنية كيف تعمل قواعد بيانات Graph. كيفية تسخير القوة التي يمكنهم المساهمة بها عند البحث عن المسارات الحرجة الأكثر استخدامًا ، التكرار الهرمي أمام قواعد البيانات العلائقية.

ورشة عمل 2. واتسون

يمكن أن تمر حلول إعداد بيئة الذكاء الاصطناعي / تعلم الآلة من خلال منتجات Open Soucer المختلفة المترابطة ، أو حل يجمع منتجات السوق الرئيسية ويضمن قابلية التشغيل البيني بين الإصدارات والترقيات التلقائية والتعاقد كخدمة. هذه هي المزايا الرئيسية لشركة Watson ، وفي هذه الورشة العملية البحتة ، سوف نكتشف كيفية توفير بيئة لعلوم البيانات لدينا والتي يمكننا من خلالها التحكم في الحلول والتكلفة.

أدوات

خلال الدورة التدريبية ، سنتناول حلول السوق الرئيسية في كل طبقة من الطبقات التي تشكل حل البيانات الكبيرة. شركاء الحلول الرئيسيين (IBM ، Amazon ، Google Cloud ، Azure) ، قواعد البيانات (Neo4J ، HDFS ، Cassandra ، MongoDB) ، ETLs (Kafka ، Pentaho ، Powercenter) ، عرض تقديمي (Tableau ، Qlik) وغيرها.

لا يسعى الماجستير إلى تدريب طلابهم تقنيًا في كل من هذه الأدوات ، ولكن على النهج من وجهة نظر نظرية ، راجع PROs و CONs لكل منهم وأداء ممارسات صغيرة لفهم عملها بشكل مباشر. ستكون الممارسات بسيطة وسهلة لحلها ، وليس كونها محور التركيز الرئيسي ، ولكن يجب ألا تكون سيدًا نظريًا بحتًا.

متطلبات الماجستير

نبذة عن الطالب ومتطلبات القبول

تم تصميم وحدات البرنامج للمهنيين من أي قطاع ممن يرغبون في تنفيذ مشروع البيانات الكبيرة في شركتهم ، وتحديد أنواع المشاريع من هذا النوع وتحديد أفضل خريطة طريق للمشروع من أجل حلها بنجاح.

لمحات الأصل هي:

  • الخريجين في الهندسة التقنية ، ADE والعلوم (الطب ، الرياضيات ، الفيزياء ، الكيمياء).
  • المهنيين الذين يعملون في قطاع تكنولوجيا المعلومات والاتصالات.
  • المراكز المتوسطة للشركات التي ترغب في الحصول على مركز مفيد في مواجهة الفرص المستقبلية في الشركة.
  • المحترفون في BI (ذكاء الأعمال) الذين يرغبون في توسيع معارفهم.
  • الملفات الشخصية / المستشارون الفنيون الذين يعملون حاليًا مع البيانات والذين يرغبون في الحصول على رؤية إدارة شاملة.
المعايرة بالتحليل الكيماوي

عند الانتهاء من البرنامج ، سوف يحصل الطلاب على:

  • لقب ثلاث نقاط.
  • شهادة معتمدة من قبل UPC ، إذا تم الوفاء بمتطلبات الجامعة في نهاية البرنامج
آخر تحديث للآذار (مارس) 2020

منحة Keystone الدراسية

اكتشف الاختيارات التي يمكن أن تمنحها لك منحتنا الدراسية

عن هذه الكلية

OBS Business School nace en 2006 como la primera escuela de negocios 100% online en lengua española. Se funda en el entorno del Grupo Planeta, líder mundial en la publicación de contenidos para el mer ... قراءة المزيد

OBS Business School nace en 2006 como la primera escuela de negocios 100% online en lengua española. Se funda en el entorno del Grupo Planeta, líder mundial en la publicación de contenidos para el mercado de habla hispana y con un importante know-how en e-learning, con la colaboración del partner estratégico: إظهار محتوى أقل
برشلونة , مدريد + 1 أكثر أقل