حشو الباندا النان بالرقم 0

Hshw Albanda Alnan Balrqm 0



يتضمن علم البيانات عادةً بيانات مفقودة. يمكن إهمال الصف بأكمله أو إضافة قيمة إلى تركيبة الصف والعمود. سيكون إسقاط الصف / العمود أمرًا سخيفًا لأنه يلغي مقياسًا معينًا لكل صف. NaN ، التي تعني 'ليس رقمًا' ، هي إحدى الطرق النموذجية لإظهار قيمة مفقودة من مجموعة من البيانات. للحصول على النتائج المرجوة ، يعد التعامل مع NaN أمرًا مهمًا للغاية. لذلك ، دعنا نتعرف على كيفية تغيير قيم NaN في صف أو عمود من Pandas DataFrame إلى 0.

Pandas تملأ قيم NaN

إذا كان أحد الأعمدة في إطار البيانات الخاص بك يحتوي على قيم NaN أو None ، فيمكنك استخدام الدالتين 'fillna ()' أو 'replace ()' لتعبئتها بصفر (0).

يملأ()







تمتلئ قيم NA / NaN بالطريقة المقدمة باستخدام وظيفة 'fillna ()'. يمكن استخدامه من خلال النظر في بناء الجملة التالي:



إذا كنت تريد ملء قيم NaN لعمود واحد ، فإن بناء الجملة يكون كما يلي:




عندما يُطلب منك ملء قيم NaN لإطار DataFrame الكامل ، يكون بناء الجملة كما هو مذكور:






يحل محل()

لاستبدال عمود واحد من قيم NaN ، يكون بناء الجملة المقدم كما يلي:




حيث أنه لاستبدال قيم NaN الخاصة بإطار DataFrame بالكامل ، يتعين علينا استخدام البنية المذكورة التالية:


في هذا الجزء من الكتابة ، سنستكشف الآن ونتعلم التنفيذ العملي لكلتا الطريقتين لملء قيم NaN في Pandas DataFrame.

مثال 1: املأ قيم NaN باستخدام طريقة Pandas 'Fillna ()'

يوضح هذا الرسم التوضيحي تطبيق وظيفة Pandas “DataFrame.fillna ()” لملء قيم NaN في DataFrame المحدد بـ 0. يمكنك إما ملء القيم المفقودة في عمود واحد أو يمكنك تعبئتها لكامل DataFrame. هنا ، سنرى كلتا الطريقتين.

لوضع هذه الاستراتيجيات موضع التنفيذ ، نحتاج إلى الحصول على منصة مناسبة لتنفيذ البرنامج. لذلك ، قررنا استخدام أداة 'Spyder'. لقد بدأنا كود Python الخاص بنا عن طريق استيراد مجموعة أدوات 'pandas' إلى البرنامج لأننا نحتاج إلى استخدام ميزة Pandas لإنشاء DataFrame وكذلك لملء القيم المفقودة في DataFrame هذا. يتم استخدام 'pd' كاسم مستعار لـ 'pandas' في جميع أنحاء البرنامج.

الآن ، لدينا وصول إلى ميزات Pandas. نستخدم أولاً وظيفة 'pd.DataFrame ()' لإنشاء إطار البيانات الخاص بنا. استدعينا هذه الطريقة وأعدناها بثلاثة أعمدة. عناوين هذه الأعمدة هي 'M1' و 'M2' و 'M3'. القيم في العمود 'M1' هي '1' و 'لا شيء' و '5' و '9' و '3'. الإدخالات في 'M2' هي 'بلا' و '3' و '8' و '4' و '6'. بينما يقوم 'M3' بتخزين البيانات كـ '1' و '2' و '3' و '5' و 'بلا'. نحن نطلب كائن DataFrame حيث يمكننا تخزين DataFrame هذا عندما يتم استدعاء طريقة “pd.DataFrame ()”. قمنا بإنشاء كائن DataFrame 'مفقود' وقمنا بتعيينه من خلال النتيجة التي حصلنا عليها من الوظيفة 'pd.DataFrame ()'. بعد ذلك ، استخدمنا طريقة 'print ()' في Python لعرض DataFrame على وحدة تحكم Python.


عندما نقوم بتشغيل هذا الجزء من التعليمات البرمجية ، يمكن عرض DataFrame بثلاثة أعمدة على الجهاز. هنا ، يمكننا أن نلاحظ أن جميع الأعمدة الثلاثة تحتوي على قيم خالية فيها.


أنشأنا DataFrame مع بعض القيم الخالية لتطبيق وظيفة Pandas 'fillna ()' لملء القيم المفقودة بـ 0. دعنا نتعلم كيف يمكننا القيام بذلك.

بعد عرض DataFrame ، قمنا باستدعاء وظيفة Pandas 'fillna ()'. هنا ، سوف نتعلم ملء القيم المفقودة في عمود واحد. تم ذكر بناء الجملة الخاص بذلك بالفعل في بداية البرنامج التعليمي. قدمنا ​​اسم DataFrame وحددنا عنوان العمود المحدد بوظيفة '.fillna ()'. بين أقواس هذه الطريقة ، قدمنا ​​القيمة التي سيتم وضعها في الأماكن الخالية. اسم DataFrame 'مفقود' والعمود الذي اخترناه هنا هو 'M2'. القيمة المقدمة بين أقواس 'fillna ()' هي '0'. أخيرًا ، أطلقنا على وظيفة 'print ()' لعرض DataFrame المحدث.


هنا ، يمكنك أن ترى أن العمود 'M2' في DataFrame لا يحتوي على أي قيم مفقودة الآن لأن قيمة NaN مليئة بـ 0.


لملء قيم NaN لكامل DataFrame بنفس الطريقة ، قمنا بتسمية 'fillna ()'. هذا بسيط للغاية. قدمنا ​​اسم DataFrame بوظيفة 'fillna ()' وقمنا بتعيين قيمة الوظيفة '0' بين القوسين. أخيرًا ، أظهرت لنا وظيفة 'print ()' إطار البيانات المعبأ.


هذا يمنحنا DataFrame بدون قيم NaN حيث يتم إعادة تعبئة جميع القيم بـ 0 الآن.

مثال 2: املأ قيم NaN باستخدام طريقة Pandas 'Replace ()'

يوضح هذا الجزء من المقالة طريقة أخرى لتعبئة قيم NaN في DataFrame. سنستخدم وظيفة 'replace ()' في Pandas لملء القيم في عمود واحد وفي DataFrame كامل.

نبدأ في كتابة الكود في أداة 'Spyder'. أولاً ، قمنا باستيراد المكتبات المطلوبة. هنا ، قمنا بتحميل مكتبة Pandas لتمكين برنامج Python من استخدام طرق Pandas. المكتبة الثانية التي قمنا بتحميلها هي NumPy وأطلقنا عليها الاسم المستعار 'np'. يعالج NumPy البيانات المفقودة بطريقة 'replace ()'.

بعد ذلك ، أنشأنا DataFrame به ثلاثة أعمدة - 'برغي' و 'مسمار' و 'مثقاب'. يتم إعطاء القيم في كل عمود على التوالي. يحتوي عمود 'المسمار' على قيم '112' و '234' و 'بلا' و '650'. يحتوي عمود 'الظفر' على '123' و '145' و 'بلا' و '711'. أخيرًا ، يحتوي عمود 'الحفر' على قيم '312' و 'لا شيء' و '500' و 'بلا'. يتم تخزين DataFrame في كائن DataFrame 'الأداة' ويتم عرضه باستخدام طريقة 'print ()'.


يمكن رؤية DataFrame مع أربع قيم NaN في السجل في صورة الإخراج التالية:


الآن ، نستخدم طريقة Pandas 'replace ()' لملء القيم الخالية في عمود واحد من DataFrame. بالنسبة للمهمة ، قمنا باستدعاء الوظيفة 'replace ()'. زودنا اسم DataFrame 'الأداة' والعمود 'المسمار' بطريقة '.replace ()'. بين أقواسها ، قمنا بتعيين القيمة '0' لإدخالات 'np.nan' في DataFrame. يتم استخدام طريقة 'print ()' لعرض المخرجات.


يظهر لنا DataFrame الناتج العمود الأول مع استبدال مدخلات NaN بـ 0 في عمود 'المسمار'.


الآن ، سوف نتعلم ملء القيم في DataFrame بالكامل. أطلقنا على طريقة 'replace ()' اسم DataFrame وقدمنا ​​القيمة التي نريد استبدالها بإدخالات np.nan. أخيرًا ، قمنا بطباعة DataFrame المحدث باستخدام وظيفة 'print ()'.


هذا يعطي لنا DataFrame الناتج مع عدم وجود سجلات مفقودة.

استنتاج

يعد التعامل مع الإدخالات المفقودة في DataFrame أمرًا أساسيًا ومتطلبًا ضروريًا لتقليل التعقيد والتعامل مع البيانات بتحد في عملية تحليل البيانات. يوفر لنا Pandas بعض الخيارات للتعامل مع هذه المشكلة. قدمنا ​​استراتيجيتين مفيدتين في هذا الدليل. نطبق كلتا التقنيتين بمساعدة أداة 'Spyder' لتنفيذ نماذج الرموز لجعل الأمور مفهومة قليلاً وتسهل عليك. سيؤدي اكتساب المعرفة بهذه الوظائف إلى شحذ مهاراتك في الباندا.