Python: المتجهات والمصفوفات والمصفوفات باستخدام NumPy

Python Vectors Matrices



في هذا الدرس ، سنلقي نظرة على بعض النصائح والحيل الأنيقة للعب مع المتجهات والمصفوفات والمصفوفات باستخدام مكتبة NumPy في Python. يعد هذا الدرس نقطة انطلاق جيدة جدًا إذا كنت قد بدأت في علم البيانات وتحتاج إلى نظرة عامة رياضية تمهيدية لهذه المكونات وكيف يمكننا اللعب بها باستخدام NumPy في الكود.

تتيح لنا مكتبة NumPy إجراء عمليات متنوعة يجب إجراؤها على هياكل البيانات المستخدمة غالبًا في التعلم الآلي وعلوم البيانات مثل المتجهات والمصفوفات والمصفوفات. سنعرض فقط العمليات الأكثر شيوعًا مع NumPy والتي تُستخدم في الكثير من خطوط أنابيب التعلم الآلي. أخيرًا ، يرجى ملاحظة أن NumPy هي مجرد طريقة لإجراء العمليات ، لذا فإن العمليات الحسابية التي نعرضها هي المحور الرئيسي لهذا الدرس وليس حزمة NumPy نفسها. هيا بنا نبدأ.







ما هو المتجه؟

وفقًا لـ Google ، المتجه هو كمية لها اتجاه بالإضافة إلى الحجم ، خاصةً عند تحديد موضع نقطة في الفضاء بالنسبة إلى أخرى.





تعتبر المتجهات مهمة جدًا في التعلم الآلي لأنها لا تصف فقط الحجم ولكن أيضًا اتجاه الميزات. يمكننا إنشاء متجه في NumPy باستخدام مقتطف الكود التالي:





استيراد numpyكماعلى سبيل المثال

row_vector = np.array([1و2و3])
مطبعة(ناقلات التوالي)

في مقتطف الشفرة أعلاه ، أنشأنا متجهًا للصف. يمكننا أيضًا إنشاء متجه عمود على النحو التالي:

استيراد numpyكماعلى سبيل المثال

col_vector = np.array([[1]و[2]و[3]])
مطبعة(col_vector)

صنع مصفوفة

يمكن فهم المصفوفة ببساطة على أنها مصفوفة ثنائية الأبعاد. يمكننا إنشاء مصفوفة باستخدام NumPy عن طريق إنشاء مصفوفة متعددة الأبعاد:



مصفوفة = np.array([[1و2و3]و[4و5و6]و[7و8و9]])
مطبعة(مصفوفة)

على الرغم من أن المصفوفة تشبه تمامًا المصفوفة متعددة الأبعاد ، هيكل بيانات المصفوفة غير مستحسن لسببين:

  1. المصفوفة هي المعيار عندما يتعلق الأمر بحزمة NumPy
  2. تُرجع معظم العمليات باستخدام NumPy مصفوفات وليس مصفوفة

استخدام مصفوفة متفرقة

للتذكير ، المصفوفة المتفرقة هي التي تكون فيها معظم العناصر صفرًا. الآن ، هناك سيناريو شائع في معالجة البيانات والتعلم الآلي هو معالجة المصفوفات التي تكون فيها معظم العناصر صفرًا. على سبيل المثال ، ضع في اعتبارك مصفوفة تصف صفوفها كل مقطع فيديو على Youtube وتمثل الأعمدة كل مستخدم مسجل. تمثل كل قيمة ما إذا كان المستخدم قد شاهد مقطع فيديو أم لا. بالطبع ، معظم القيم في هذه المصفوفة ستكون صفرًا. ال ميزة مع مصفوفة متفرقة هو أنه لا يخزن القيم التي تساوي صفرًا. ينتج عن هذا ميزة حسابية ضخمة وتحسين التخزين أيضًا.

دعنا ننشئ مصفوفة شرارة هنا:

من استيراد scipy متفرق

original_matrix = np.array([[1و0و3]و[0و0و6]و[7و0و0]])
sparse_matrix = sparse.csr_matrix(original_matrix)
مطبعة(مصفوفة متفرقة)

لفهم كيفية عمل الكود ، سنلقي نظرة على الإخراج هنا:

في الكود أعلاه ، استخدمنا وظيفة NumPy لإنشاء ملف صف متناثر مضغوط مصفوفة حيث يتم تمثيل العناصر غير الصفرية باستخدام الفهارس الصفرية. هناك أنواع مختلفة من المصفوفات المتناثرة ، مثل:

  • عمود متفرق مضغوط
  • قائمة القوائم
  • قاموس المفاتيح

لن نتعمق في المصفوفات المتفرقة الأخرى هنا ، لكننا نعلم أن كلًا منها محدد ولا يمكن وصف أحد بأنه 'الأفضل'.

تطبيق العمليات على جميع عناصر المتجه

إنه سيناريو شائع عندما نحتاج إلى تطبيق عملية مشتركة على عناصر متجهية متعددة. يمكن القيام بذلك عن طريق تحديد لامدا ثم توجيه نفس الشيء. دعونا نرى بعض مقتطفات الشفرة لنفسه:

مصفوفة = np.array([
[1و2و3]و
[4و5و6]و
[7و8و9]])

mul_5 = لامدا x: x* 5
vectorized_mul_5 = np.vectorize(مول_5)

vectorized_mul_5(مصفوفة)

لفهم كيفية عمل الكود ، سنلقي نظرة على الإخراج هنا:

في مقتطف الشفرة أعلاه ، استخدمنا وظيفة vectorize التي تعد جزءًا من مكتبة NumPy ، لتحويل تعريف لامدا بسيط إلى وظيفة يمكنها معالجة كل عنصر من عناصر المتجه. من المهم أن نلاحظ أن vectorize هو مجرد حلقة فوق العناصر وليس له تأثير على أداء البرنامج. يسمح NumPy أيضًا بامتداد البث ، مما يعني أنه بدلاً من الشفرة المعقدة أعلاه ، كان بإمكاننا القيام بما يلي ببساطة:

مصفوفة* 5

وكانت النتيجة هي نفسها تمامًا. كنت أرغب في إظهار الجزء المعقد أولاً ، وإلا كنت ستتخطى القسم!

يعني ، التباين والانحراف المعياري

باستخدام NumPy ، من السهل إجراء العمليات المتعلقة بالإحصاءات الوصفية للمتجهات. يمكن حساب متوسط ​​المتجه على النحو التالي:

np.mean(مصفوفة)

يمكن حساب تباين المتجه على النحو التالي:

np.var(مصفوفة)

يمكن حساب الانحراف المعياري للمتجه على النحو التالي:

على سبيل المثال ، الأمراض المنقولة جنسياً(مصفوفة)

ناتج الأوامر المذكورة أعلاه على المصفوفة المعطاة هنا:

تحويل المصفوفة

التحويل هو عملية شائعة جدًا سوف تسمع عنها عندما تكون محاطًا بالمصفوفات. التحويل هو مجرد طريقة للتبديل بين قيم المصفوفة والعمودية. يرجى ملاحظة أن أ لا يمكن تبديل المتجه كمتجه هو مجرد مجموعة من القيم دون تصنيف هذه القيم إلى صفوف وأعمدة. يرجى ملاحظة أن تحويل متجه صف إلى متجه عمود لا يتم نقله (بناءً على تعريفات الجبر الخطي ، والتي تقع خارج نطاق هذا الدرس).

في الوقت الحالي ، سنجد السلام بمجرد تبديل مصفوفة. من السهل جدًا الوصول إلى تبديل المصفوفة باستخدام NumPy:

مصفوفة T.

ناتج الأمر أعلاه على المصفوفة المعطاة هنا:

يمكن إجراء نفس العملية على متجه الصف لتحويله إلى متجه عمود.

تسطيح المصفوفة

يمكننا تحويل مصفوفة إلى مصفوفة أحادية البعد إذا أردنا معالجة عناصرها بطريقة خطية. يمكن القيام بذلك باستخدام مقتطف الشفرة التالي:

مصفوفة()

ناتج الأمر أعلاه على المصفوفة المعطاة هنا:

لاحظ أن المصفوفة المسطحة هي مصفوفة ذات بعد واحد ، ببساطة خطية في الموضة.

حساب القيم الذاتية والمتجهات الذاتية

تستخدم المتجهات الذاتية بشكل شائع في حزم التعلم الآلي. لذلك ، عندما يتم تقديم دالة التحويل الخطي كمصفوفة ، فإن X ، المتجهات الذاتية هي المتجهات التي تتغير فقط في مقياس المتجه ولكن ليس اتجاهه. يمكننا القول بأنه:

الخامس عشر = γv

هنا ، X هي المصفوفة المربعة و تحتوي على القيم الذاتية. أيضا ، v يحتوي على المتجهات الذاتية. باستخدام NumPy ، من السهل حساب القيم الذاتية والمتجهات الذاتية. إليك مقتطف الشفرة حيث نعرض نفس الشيء:

التقييمات ، المنفذين = np.linalg.eig(مصفوفة)

ناتج الأمر أعلاه على المصفوفة المعطاة هنا:

المنتجات النقطية من النواقل

المنتجات النقطية للمتجهات هي طريقة لضرب متجهين. يخبرك عن كم من المتجهات في نفس الاتجاه ، على عكس الضرب التبادلي الذي يخبرك بالعكس ، مدى ضآلة المتجهات في نفس الاتجاه (يسمى المتعامد). يمكننا حساب حاصل الضرب القياسي لمتجهين كما هو موضح في مقتطف الشفرة هنا:

أ = np.array([3و5و6])
ب = np.array([2. 3وخمسة عشرو1])

np.dot(أ ، ب)

يتم عرض إخراج الأمر أعلاه على المصفوفات المعطاة هنا:

جمع وطرح وضرب المصفوفات

تعد إضافة وطرح المصفوفات المتعددة عملية مباشرة في المصفوفات. هناك طريقتان يمكن من خلالها القيام بذلك. دعونا نلقي نظرة على مقتطف الشفرة لإجراء هذه العمليات. لغرض الحفاظ على هذا الأمر بسيطًا ، سنستخدم نفس المصفوفة مرتين:

np. إضافة(مصفوفة ، مصفوفة)

بعد ذلك ، يمكن طرح مصفوفتين على النحو التالي:

np. طرح(مصفوفة ، مصفوفة)

ناتج الأمر أعلاه على المصفوفة المعطاة هنا:

كما هو متوقع ، تتم إضافة / طرح كل عنصر في المصفوفة مع العنصر المقابل. يشبه ضرب المصفوفة إيجاد حاصل الضرب النقطي كما فعلنا سابقًا:

np.dot(مصفوفة ، مصفوفة)

سيجد الكود أعلاه قيمة الضرب الحقيقية لمصفوفتين ، على النحو التالي:

مصفوفة*مصفوفة

ناتج الأمر أعلاه على المصفوفة المعطاة هنا:

استنتاج

في هذا الدرس ، مررنا بالعديد من العمليات الحسابية المتعلقة بالمتجهات والمصفوفات والمصفوفات التي يشيع استخدامها في معالجة البيانات والإحصاءات الوصفية وعلوم البيانات. كان هذا درسًا سريعًا يغطي فقط الأقسام الأكثر شيوعًا والأكثر أهمية من مجموعة متنوعة من المفاهيم ، ولكن يجب أن تعطي هذه العمليات فكرة جيدة جدًا حول ما يمكن إجراء جميع العمليات أثناء التعامل مع هياكل البيانات هذه.

يرجى مشاركة ملاحظاتك بحرية حول الدرس على Twitter مع تضمين التغريدة و تضمين التغريدة (هذا أنا!).