مجموعة الباندا بواسطة المتوسط

Mjmw T Albanda Bwastt Almtwst



عندما نضيف قيمتين أو أكثر معًا ويتم تقسيم مجموعها على إجمالي عدد القيم المضافة معًا ، تكون النتيجة متوسطًا. يعرض Pandas Mean متوسط ​​البيانات أو القيمة على طول محور معين. سيتم إرجاع سلسلة بمتوسط ​​عبر محور بواسطة حيوانات الباندا إذا تم تطبيق طريقة المتوسط ​​() على إطار البيانات. ترجع Pandas قيمة عددية (رقم فردي) إذا تم استخدام 'mean ()' في سلسلة. يمكن تطبيق الوظائف على الفئات بعد إنشاء مجموعات الفئات. إنها فكرة بسيطة ولكنها تقنية فعالة للغاية يتم تطبيقها بشكل متكرر في علم البيانات. يسمح لنا بإنشاء ملخص للبيانات لكل مجموعة ، وتطبيق التعديلات الخاصة بالمجموعة ، وإجراء ترشيح البيانات. باستخدام وظيفة groupby () ، يمكن تقسيم الكائن ، ويمكن تطبيق وظيفة ، ويمكن بعد ذلك دمج المنتجات. يمكن تجميع مجموعات البيانات الكبيرة باستخدام هذا ، ويمكن إجراء العمليات على المجموعات.

كيفية استخدام طريقة groupby.mean () في الباندا؟

لحساب متوسط ​​إطار البيانات أو متوسط ​​أعمدة معينة من إطار البيانات ، يمكننا استخدام الدالة groupby.mean (). سنوضح كيفية استخدامه في الأمثلة التالية.







مثال # 01: تحديد متوسط ​​عمود واحد صحيح من خلال تجميع بيانات عمود واحد

باستخدام الدالة pd.DataFrame () ، سننشئ أولاً إطار بيانات حتى نتمكن من تقسيم بيانات عمود أو أعمدة إطار البيانات إلى مجموعات ثم نجد قيمتها المتوسطة. قبل إنشاء إطار البيانات ، يجب علينا استيراد وحدة الباندا مع المكتبة الخاملة.





كما يتضح ، لقد أنشأنا إطار البيانات الخاص بنا باستخدام قاموس الباندا. لدينا 3 أعمدة في إطار بيانات df ، أي 'العناصر' و 'الشركة المصنعة' و 'الكمية'. في العمود 'العناصر' ، قمنا بتخزين القيم ('قميص' ، 'ربطة عنق' ، 'بنطلون' ، 'قميص' ، 'ربطة عنق' ، 'بنطلون' ، 'قميص' ، 'بنطلون' ، 'بنطلون' ، ' التعادل ') ، بينما تحتوي العمودين' الشركة المصنعة 'و' الكمية 'على القيم (' إيطاليا '،' فرنسا '،' الصين '،' فرنسا '،' الصين '،' إيطاليا '،' الصين '،' إيطاليا '، 'فرنسا') و (13 ، 16 ، 21 ، 32 ، 26 ، 41 ، 24 ، 42 ، 12 ، 15) على التوالي. دعنا نجمع القيم في عمود الشركة المصنعة ونحدد متوسط ​​قيمة الكمية لكل مصنع متميز.





قيمة الشركة المصنعة 'الصين' لها قيمة كمية متوسطة تبلغ 21.5 ، ومتوسط ​​قيمة الكمية لـ 'فرنسا' هو 20.0 ، ومتوسط ​​قيمة الكمية لـ 'إيطاليا' هو 32.0. يمكننا أيضًا تحديد فهرس للإخراج باستخدام وظيفة reset_index مع وظيفة groupby.mean ().



مثال # 02: ابحث عن متوسط ​​عمود واحد عائم عن طريق تجميع بيانات عمود واحد

لقد رأينا كيف يمكننا إيجاد متوسط ​​عمود الأعداد الصحيحة بعد تجميع البيانات. لنجرب الآن عمود نوع بيانات آخر مثل عائم. سيتم إنشاء إطار بيانات بعمود واحد على الأقل بقيم عائمة باستخدام الدالة pd.DataFrame ().

من خلال وضع قاموس داخل pd.DataFrame () ، قمنا بإنشاء إطار بيانات بثلاثة أعمدة. يخزن العمود 'name' أسماء بعض اللاعبين العشوائيين ('Sam' و 'Jay' و 'Leo' و 'Mike' و 'Will' و 'Billy' و 'Jhonny' و 'Lara' و 'Hanna' ، 'Tony') ، العمود 'team' الذي يمثل الفريق الذي ينتمي إليه كل لاعب ('A' ، 'A' ، 'B' ، 'A' ، 'B' ، 'A' ، 'C' ، 'B' '،' C '،' C ') وعمود 'الارتفاع' يخزن ارتفاعات كل لاعب كقيمة عائمة (5.6 ، 5.4 ، 6.3 ، 5.2 ، 5.5 ، 6.4 ، 5.6 ، 5.8 ، 6.0 ، 5.2). دعنا نجمع البيانات في عمود 'الفريق' ونحدد متوسط ​​قيمة الارتفاع لكل قيمة 'فريق' مميزة.

يمكنك أن ترى أن متوسط ​​ارتفاع لاعبي الفريق 'أ' يبلغ 5.65 ، في حين أن متوسط ​​ارتفاع اللاعبين في الفريقين 'ب' و 'ج' هو 5.866 و 5.6 على التوالي.

مثال # 03: حدد متوسط ​​الأعمدة المتعددة باستخدام الدالة groupby.mean ()

في الأمثلة السابقة ، حددنا متوسط ​​عمود واحد. ومع ذلك ، يمكن أيضًا تحديد متوسط ​​الأعمدة المتعددة لكل مجموعة. لنقم بإنشاء إطار بيانات يحتوي على أكثر من عمود رقمي واحد ، بعد استيراد وحدات الباندا والوحدات غير المعقدة.

في إطار البيانات الذي تم إنشاؤه حديثًا ، هناك ثلاثة أعمدة تحمل التسميات 'الاسم' و 'النتيجة' و 'التطابقات'. أسماء الأعمدة التي تحتوي على قيم البيانات كسلسلة ('Ron' ، 'Jim' ، 'Dany' ، 'Jim' ، 'Jim' ، 'Dany' ، 'Ron' ، 'Ron' ، 'Dany' ، 'Jim' ) ، بينما تتكون 'النتيجة' و 'المطابقات' من بيانات رقمية مثل (3 ، 4 ، 2 ، 4 ، 1 ، 5 ، 2 ، 3 ، 1 ، 2) و (2 ، 3 ، 1 ، 2 ، 1 ، 3 ، 4 ، 1 ، 2 ، 1). الآن دعنا نعثر على متوسط ​​العمود 'النتيجة' و 'المطابقات' بعد تجميع بيانات العمود 'الاسم'. سيتم استخدام الدالة groupby.mean () لهذا الغرض.

يمكن ملاحظة أن مجموعة 'داني' لديها متوسط ​​درجات 2.66 في 2.00 مباراة. مجموعة جيم لديها متوسط ​​نقاط 2.75 ومتوسط ​​قيمة المباريات التي لعبت هو 1.75. في حين أن متوسط ​​قيمة المجموعة 'رون' يبلغ 2.66 ومتوسط ​​قيمة المباريات التي تم لعبها هو 2.33.

يمكن أيضًا حساب متوسط ​​مجموعة الفئات حسب الكائن باستخدام طريقة agg (). سنقدم المتوسط ​​كوسيطة للدالة agg (). للتجميع باستخدام عمليات مفردة أو متعددة عبر المحور المحدد ، يمكننا استخدام الدالة agg ().

الإخراج هو نفسه كما كان من قبل.

مثال # 04: حدد متوسط ​​أعمدة معينة عن طريق تجميع الأعمدة المتعددة

في الأمثلة 1 و 2 و 3 ، قمنا بتجميع قيم أو بيانات عمود واحد. سنقوم الآن بتجميع أعمدة متعددة باستخدام قائمة تسميات الأعمدة داخل وظيفة groupby () ، ثم سنجد متوسط ​​القيمة لكل مجموعة. سيتم تمرير القاموس 'd' داخل وظيفة pd.Dataframe () كمدخل لإنشاء إطار البيانات.

لقد أنشأنا إطار البيانات المطلوب. يخزن العمود 'الرياضة' أسماء بعض الرياضات ('كرة الريشة' ، 'كرة القدم' ، 'التنس' ، 'كرة السلة' ، 'كرة القدم' ، 'التنس' ، 'كرة السلة' ، 'كرة القدم' ، 'كرة الريشة' ، ' كرة السلة '،' كرة السلة '،' التنس ') ، أسماء البلدان (' الصين '،' روسيا '،' إيطاليا '،' إسبانيا '،' روسيا '،' إيطاليا '،' الصين '،' إيطاليا '،' يتم تخزين 'إسبانيا' ، 'الصين' ، 'روسيا' ، 'إيطاليا') في عمود 'البلد'. بينما في العمود 'فوز' قمنا بتخزين عدد المباريات التي فازت بها كل دولة في كل رياضة (13 ، 10 ، 6 ، 7 ، 10 ، 12 ، 7 ، 11 ، 8 ، 13 ، 11 ، 6). دعنا نستخدم الدالة groupby.mean () للعثور على متوسط ​​قيم عمود 'الفوز' عن طريق تجميع عمودي 'الرياضة' و 'البلد'.

نجحت الوظيفة في تحديد متوسطات قيم عمود 'الفوز' لكل رياضة في البلد. يمكن إعادة تعيين إطار البيانات المُجمَّع حسب استخدام وظيفة reset_index () ، والتي تُنشئ أيضًا فهرسًا جديدًا ، مما يمنحه بنية إطار بيانات مناسبة.

تتم إضافة فهرس لكل صف من صفوف إطار البيانات. لترتيب النتائج في جدول جذاب ، يمكننا أيضًا استخدام الدالة pivot ().

استنتاج

في هذا البرنامج التعليمي ، ناقشنا معنى أو متوسط ​​الأرقام وكيفية العثور على متوسط ​​عمود معين (واحد أو أكثر) بعد تجميع العمود أو الأعمدة في إطار البيانات. قمنا بتنفيذ بعض الأمثلة في هذه المقالة لتعليمك كيفية تحديد متوسط ​​عدد صحيح واحد أو عمود عائم من خلال تجميع بيانات عمود واحد ؛ كيفية تحديد متوسط ​​الأعمدة المتعددة باستخدام الدالة groupby.mean () ؛ وكذلك كيفية تحديد متوسط ​​أعمدة معينة عن طريق تجميع الأعمدة المتعددة.