عمود مجموع الباندا

Mwd Mjmw Albanda



ستوضح هذه المقالة كيفية جمع كل أو أعمدة معينة في Pandas DataFrame باستخدام Python. سيتم استخدام الدالة DataFrame.sum () جنبًا إلى جنب مع بعض المعلمات المفيدة في الأمثلة العديدة لهذا البرنامج التعليمي. '

عندما ينتهي هذا البرنامج التعليمي ، قد تعرف كيفية:







    • أوجد مجموع عمود إطار البيانات في Pandas.
    • إضافة أعمدة إطار البيانات معًا
    • أضف أعمدة إلى Pandas Dataframe التي تفي بالشرط المحدد.
    • حدد المجموع بعد تجميع بيانات إطار البيانات.

كيفية تحديد مجموع أعمدة إطار البيانات؟

ترجع الدالة 'dataframe.sum ()' في Pandas المجموع الإجمالي للمحور المحدد. إذا كان الإدخال هو محور الفهرس ، فإن الوظيفة تضيف قيم كل عمود على حدة ، ثم تفعل الشيء نفسه لكل عمود ، وتعيد سلسلة تخزن مجموع البيانات / القيم في كل عمود. بالإضافة إلى ذلك ، فإنه يدعم حساب مجموع إطار البيانات عن طريق تجاهل القيم المفقودة.



بناء الجملة: DataFrame.sum (المحور = لا شيء ، skipna = لا شيء ، المستوى = لا شيء ، numeric_only = بلا ، min_count = 0 ، ** kwargs)



أين،





محور: {أعمدة (1) ، فهرس (0)}

ترتيب: تجاهل NA / القيم الفارغة عند حساب النتيجة.



مستوى: إذا كان المحور المحدد هرميًا (متعدد الفهارس) ، فاحسب إلى مستوى فهرس معين قبل التحويل إلى سلسلة.

رقمي فقط: تُقبل الأعمدة العائمة فقط و int و boolean. إذا لم يكن هناك شيء ، فحاول استخدام كل شيء ؛ إذا لم يكن الأمر كذلك ، فإن البيانات الرقمية فقط. بالنسبة إلى السلسلة ، لم يتم التنفيذ.

min_count: عدد القيم الممكنة المطلوبة لإكمال العملية. ستكون النتيجة NA إذا كان هناك عدد أقل من القيم غير NA الموجودة من min_count.

عائدات: DataFrame (إذا تم تحديد المستوى) أو سلسلة.

مثال # 01: تحديد مجموع عمود إطار البيانات وجميع الأعمدة

لقد طلبنا إطار بيانات أولاً مع أنواع البيانات الصالحة ، على سبيل المثال ، int ، float ، إلخ ، العمود أو الأعمدة التي يمكننا العثور على مجموع البيانات الخاصة بها. سيتم إنشاء إطار البيانات باستخدام الدالة pd.DataFrame ().


لقد أنشأنا إطار البيانات المطلوب من قاموس بيثون داخل دالة pd.DataFrame (). في إطار البيانات الذي تم إنشاؤه أعلاه ، هناك أربعة أعمدة 'الاسم' و 'اليوم 1' و 'اليوم 2' و 'اليوم 3'. من بين أربعة أعمدة ، فإن الأعمدة الثلاثة ، أي 'اليوم 1' و 'اليوم 2' و 'اليوم 3' هي أعمدة رقمية مع قيم البيانات (4 ، 4 ، 3 ، 2 ، 4 ، 6 ، 5 ، 3) ، (2 ، 4 ، 5 ، 2 ، 3 ، 4 ، 6 ، 2) و (7 ، 4 ، 3 ، 5 ، 6 ، 2 ، 1 ، 4) على التوالي. يمكننا فقط إيجاد مجموع هذه الأعمدة الثلاثة. يمكن تحديد مجموع كلتا السلسلتين (أي عمود) وإطار بيانات كامل باستخدام طريقة sum (). لنبدأ بتعليم كيفية جمع كل البيانات في عمود الباندا.


لتحديد المجموع ، استخدمنا طريقة sum () في عمود 'اليوم 2'. أعادت الدالة قيمة مجموع 28. على غرار ذلك ، قد نحدد مجموع كل عمود من أعمدة Dataframe. سيؤدي استخدام طريقة sum () عبر إطار البيانات بأكمله إلى تحقيق ذلك.


كما يتضح ، مجموع العمود 'اليوم 1' هو 31 ؛ بالنسبة لـ 'day2' ، يكون المجموع 28 ، بينما بالنسبة للعمود 'day3' ، تكون قيمة المجموع 32.

مثال # 02: استخدام الدالة sum () لتلخيص قيم عمود Dataframe معًا

كما ترى من إخراج المثال السابق ، لم تُرجع الدالة بيانات عمود إطار البيانات الفعلية التي تكون المجموع. ومع ذلك ، من خلال تعيين الأسلوب 'DataFrame.sum ()' إلى عمود DataFrame ، يمكنك الوصول إلى كل عمود في DataFrame ، بما في ذلك عمود المجموع. أولاً ، نقوم بإنشاء إطار بيانات آخر لهذا المثال.


باستخدام pd.DataFrame () ، تم إنشاء إطار البيانات الخاص بنا. لقد أنشأنا إطار البيانات بثلاثة أعمدة: العنصر والسعر والضريبة. عنصر العمود الذي يحتوي على قيم السلسلة ('قلم' ، 'علامة' ، 'مسطرة' ، 'ممحاة' ، 'قلم رصاص' ، 'حافظة' ، 'دباسة' ، 'دبابيس') ، سعر العمود الذي يخزن القيم (20 ، 15 ، 10 ، 3 ، 5 ، 30 ، 35 ، 10) ، ويتكون عمود 'الضريبة' من القيم (8 ، 5 ، 3 ، 3 ، 4 ، 10 ، 5 ، 2). فلنقم الآن بإضافة قيم عمود السعر والضرائب وتخزين النتائج في عمود جديد عن طريق الاحتفاظ بأعمدة إطار البيانات الأصلية.


كما يمكن ملاحظته جنبًا إلى جنب مع العمود الجديد 'إجمالي' ، يتم أيضًا إرجاع الأعمدة الأصلية لإطار البيانات المحدد بواسطة الوظيفة. يخزن العمود 'إجمالي' مجموع قيم العمودين 'السعر' و 'الضريبة' مقابل بيانات كل 'عنصر'.

مثال # 03: استخدام الدالة sum () لتحديد مجموع أعمدة Dataframe المحددة

لتجميع الأعمدة المتعددة لإطار البيانات معًا ، يمكننا تحديد قائمة بتسميات الأعمدة ثم تطبيق طريقة sum () في القائمة للعثور على المجموع. مثل الأمثلة السابقة ، سننشئ إطار البيانات أولاً.


لقد أنشأنا إطار البيانات الخاص بنا بأربعة أعمدة 'طلاب' و 'علامات 1' و 'علامات 2' و 'علامات 3'. يخزن العمود 'الطلاب' البيانات ('Larry' و 'James' و 'Rob' و 'Arya' و 'Max' و 'Ben' و 'Gwen' و 'Bill') والعمود 'Marks1' الذي يخزن القيم (8 ، 9 ، 6 ، 8 ، 10 ، 7 ، 9 ، 9) ، بينما الأعمدة 'العلامات 2' و 'العلامات 3' تخزن القيم العددية (6 ، 6 ، 8 ، 6 ، 7 ، 9 ، 10 ، 9 ) و (7 ، 6 ، 9 ، 7 ، 8 ، 7 ، 10 ، 10) على التوالي.


أولاً ، قمنا بإنشاء كائن قائمة بتسميات الأعمدة 'الطلاب' و 'العلامات 1' و 'العلامات 3'. ثم يتم تطبيق طريقة sum () على القائمة. تلخص الوظيفة قيم العلامات 1 والأعمدة 3 فقط لأن العمود 'الطلاب' غير رقمي ، لذلك لا يمكن لوظيفة sum () العثور على مجموع قيم العمود 'الطلاب'. لقد قمنا بتخزين مجموع قيم العمودين 'العلامات 1' و 'العلامات 3' في العمود 'المجموع'.

مثال # 04: أضف أعمدة Pandas Dataframe التي ترضي شرطًا محددًا

في هذا المثال ، سنضيف قيم الأعمدة المحددة إذا كانت تفي بالشرط المحدد.


هناك 5 أعمدة في إطار البيانات الذي تم إنشاؤه حديثًا ، أي 'الشركة' و 'مبيعات الأسبوع الأول' و 'مبيعات الأسبوع 2' و 'مبيعات الأسبوع 3' و 'الفروع'. الآن ، لنفترض أننا لا نريد إضافة قيمة العمود الأخير عندما نضيف أو نعثر على مجموع قيم صفوف إطار البيانات المحددة. لنفترض أننا أردنا فقط إضافة قيم الأعمدة بكلمة 'أسبوع' في تسمياتها. يمكن إنشاء قائمة الفهم لتحديد ما إذا كانت كلمة 'أسبوع' موجودة في تسمية العمود أم لا.


الآن قمنا بإحضار الأعمدة التي تحتوي على كلمة 'أسبوع' في تسمياتها. يمكننا تلخيص الأعمدة التي تحتوي على كلمة 'أسبوع' باستخدام محور = 1 وسيطة في دالة sum ().


بهذه الطريقة ، يمكننا تلخيص البيانات بأمان عبر الأعمدة من حيث الصفوف دون تضمين أي أعمدة لا نريدها.

المثال الخامس: تحديد المجموع بعد تجميع بيانات إطار البيانات

يمكننا أيضًا العثور على مجموع أعمدة إطار البيانات بعد تجميع بيانات عمود واحد أو أكثر. سيتم استخدام طريقة groupby () لتجميع البيانات في فئات داخل العمود. لنقم بإنشاء إطار بيانات حتى نتمكن من تجميع بيانات أحد أعمدته.


سنقوم الآن بتجميع البيانات في العمود 'العمر' ونجمع قيم العمودين 'النتيجة 1' و 'النتيجة 2' لكل فئة من فئات المجموعة.


يمكننا أن نرى أن تلخيص البيانات في إطار البيانات بعد تجميع قيم البيانات أولاً حسب العمر ينتج عنه مجموع عمودي اعتمادًا على الفئات العمرية.

استنتاج

في هذا البرنامج التعليمي ، حاولنا أن نعلمك كيفية حساب المجموع عبر إطارات البيانات باستخدام طريقة Pandas sum. لقد ناقشنا إضافة القيم من الصفوف والعمود في أمثلة هذا المنشور. بالإضافة إلى ذلك ، تعلمت كيفية إضافة الأعمدة بشكل شرطي وكيفية جمع القيم بعد تجميع عمود إطار البيانات. الآن قد تتمكن من جمع أعمدة إطار البيانات معًا أو جمع القيم داخل عمود إطار البيانات بنفسك.