Pandas Join vs Merge

Pandas Join Vs Merge



'Pandas' هي أداة عالية الأداء لبيئة بيثون. إنه رمز مصدر 'مفتوح' لتحليل البيانات. يتم استخدام طريقة ربط الباندا وطريقة دمج الباندا لضم إطاري البيانات معًا في إطار بيانات واحد. في كلتا الطريقتين في الباندا ، يكمن الاختلاف في أن وظيفة 'ربط' الباندا تنضم إلى إطار البيانات باستخدام فهرس. بينما تنضم وظيفة 'دمج' الباندا إلى إطار البيانات باستخدام طريقة الفهرس والعمود التي يمكننا من خلالها تحديد العمود المطلوب بأنفسنا. يتم استخدام طريقة دمج الباندا في الغالب بالمقارنة مع طريقة الانضمام إلى الباندا. البرنامج الذي سنستخدمه للتنفيذ هو برنامج 'spyder' ، الموجود في بيئة Python التي ستوفر لنا فوائد لتنفيذ الكود الخاص بطريقة الانضمام إلى pandas () ووظيفة طريقة دمج الباندا ().

بناء جملة طريقة Pandas Join ()

“df1. انضم ( مدافع 2 ) '

'df' في بناء الجملة أعلاه هو اختصار لـ 'dataframe'. هناك نوعان من إطارات البيانات في بناء الجملة مع وظيفة 'ربط النقطة' ، والتي هي لاستدعاء الطريقة. إنها طريقة الباندا للانضمام إلى إطارين للبيانات. إنه يعمل عن طريق استخدام الفهرس لدمج إطارات البيانات في واحد.







بناء جملة طريقة دمج الباندا ()

“df1. دمج ( مدافع 2 و على = 'اسم العمود' ) '

يحتوي بناء جملة طريقة دمج الباندا على إطارين للبيانات هما 'df1' و 'df2'. تستدعي وظيفة 'دمج النقاط' طريقة ضم كل من إطارات البيانات بمظهر الأعمدة المقلوبة.



سنغطي الطرق التالية للجمع بين إطاري بيانات من أجل استخدام طرق دمج الباندا وضم الباندا:



  • تداخل طريقة انضمام الباندا.
  • ينضم الباندا إلى الطريقة باستخدام إعادة تعيين الفهرس.
  • طريقة دمج الباندا (العمود 'اليسار واليمين').
  • طريقة دمج الباندا صريحة.

إنشاء أطر البيانات لتنفيذ طريقة دمج Pandas و Pandas Join

أولاً ، علينا إنشاء إطار بيانات. لذلك ، سوف نستخدم أداة 'سبايدر'. بعد فتحه ، ابدأ في كتابة الكود. استيراد الباندا 'pd' لجمعية مكتبة الباندا. لدينا متغيرات إطار البيانات مثل 'x' و 'y' و 'p' و 'q بالمقابل و' a 'مع القيمتين' 1 'و' b 'مع القيمة المعينة كـ' 2 '.





الناتج هو 'df' تم إنشاؤه باستخدام القيم المعينة. يمكننا أن نجعلها كبيرة مثل البيانات.



إنشاء إطار بيانات آخر

علينا أن نصنع إطار بيانات آخر ، لفهم طرق انضمام الباندا ودمج الباندا بشكل واضح. هنا ، قمنا بإنشاء 'df' على غرار 'df' أعلاه ، فقط القيم التي تم تعيينها هي المتغيرات المختلفة. لدينا 'h' و 'j' و 's' و 'd' ، بينما نقوم بتعيين القيم 'b' بالقيمة '8' و 'Y' بالقيمة '3'.

يظهر الإخراج بسيط 'df' تم إنشاؤه.

مثال # 01: طريقة انضمام الباندا (متداخلة)

الآن ، سنرى كيفية ربط إطارين من إطارات البيانات باستخدام طريقة ربط الباندا. بالنسبة لهذه الطريقة ، يمكننا اختيار العمود الذي تختاره الذي نريد العمل عليه من إطار البيانات. لقد أخذنا المثال مع العمود المتداخل 'يسار' من 'df' ، لذا يمكننا إصلاح ذلك باستخدام 'اللاحقة' للتغلب على تداخل البيانات. هنا ، المتغيرات المستخدمة هي 'x' ، 'z' ، 'v' ، 'd'. 'p' و 'o' و 'l' و 'y' مع القيم المعينة كـ '3' و '6' و '7' و '9'. تستدعي '.join' الطريقة ، مع ضبط المحاذاة على الارتباط الأيسر مع لاحقة 'df' اليمنى. '. تعود 'اللاحقة' المستخدمة في الكود إلى وجود عمودين في إطار البيانات لهما نفس الاسم وهو 'مفتاح' ولن يتداخل هذا مع البيانات.

لا يعرض الإخراج أي بيانات متداخلة مع طريقة الانضمام إلى اثنين من 'df' باستخدام طريقة ربط الباندا.

مثال # 02: طريقة انضمام Pandas باستخدام إعادة تعيين الفهرس

في هذا المثال ، سنحدد العمود الذي يحتوي على المعلمة 'on' بشكل منفصل لاستخدامه كـ 'مفتاح' في طريقة الربط التي تساعد في الانضمام إلى إطاري البيانات. يتم عمل الشيء المشترك مع هذه المعلمة. أيضًا ، يجب أن يكون فهرس أحد 'df' مماثلاً للانضمام إليهما. يمكن أن تكون الأنواع المتشابهة من البيانات أو البيانات المستخدمة لنفس الغرض معًا للمعالجة. سيستخدم هذا الفهرس لا يزال ، باستخدام من اليمين. المتغيرات هي 's' و 't' و 'u' و 'v' و 'n' و 'w' و 'k' و 'q'. القيم المخصصة هي '3' و '6' و '7' و '9'. 'إعادة تعيين مؤشر النقطة' هي طريقة من حيوانات الباندا لإعادة تعيين فهرس 'df'. يعين فهرس إعادة التعيين جميع الأعداد الصحيحة لقائمة إطار البيانات الخاصة بك من 0 حتى يتم إطالة بيانات إطار البيانات.

هنا هو عرض الإخراج مع فهرس 'مفتاح' طريقة ربط الباندا.

مثال # 03: طريقة دمج الباندا (العمود 'يسار ويمين')

تقوم طريقة الدمج بإجراء عملية مماثلة لطريقة انضمام الباندا. كلتا الطريقتين مخصصتان لدمج البيانات على إطار بيانات مماثل. تعد طريقة الدمج أكثر تنوعًا وتتطلب تحديد المفتاح. يمكننا أيضًا تحديده على العمودين الأيمن والأيسر اعتمادًا على عمل إطار البيانات الخاص بك. المتغيرات في الكود هي 's' و 'd' و 'g' و 'f' و 'k' و 'j' و 'b' و 'q'. القيم المعينة هي '9' و '5' و '6' و '7'. يتم تنفيذ 'الانضمام' الخارجي على كل من 'df' باستخدام المعلمة 'كيف' لوظيفة طريقة دمج الباندا.

يُظهر الإخراج الذي نراه البيانات المدمجة لإطاري البيانات. يمثل 'NaN' 'ليس رقمًا' مما يعني أنه في حالة عدم وجود رقم معين في البيانات ، يظهر 'NaN' هناك.

مثال # 04: طريقة الدمج صراحة

هنا ، في هذا المثال ، طريقة الدمج هي تدمير الفهرس ولا يتم افتراض قيمة الفهرس في إطار البيانات. سنقوم بهذه الطريقة وفقًا للعمل المطلوب القيام به ، حيث يكون التحديد الصريح هو المتابعة. سيتم دمج البيانات بناءً على فهرس يسار أو فهرس يمين مع المعلمة. المتغيرات في إطار البيانات هذا هي 't' و 'r' و 'I' و 'u' و 'h' و 'o' و 'e' و 'e'. القيم المخصصة هي '2' و '4' و '6' و '4'. المثال أعلاه لطريقة دمج الباندا مع اختيار العمود وفقًا للحاجة هو الطريقة الأكثر قيمة وظهورًا للانضمام إلى إطاري البيانات. التحقق في نهاية سطر التعليمات البرمجية من أن مفتاح الدمج فريد في مجموعة البيانات.

في المخرجات أدناه ، لا يظهر الفهرس بدون الفهرس ولكن يتم تنفيذ الوظيفة بناءً على الفهرس الأيمن والأيسر.

استنتاج

أساليب الدمج () والرابط () هما طريقتان مناسبتان وفعالة للغاية. يتم استخدام هاتين الوظيفتين لضم إطار بيانات منفصلين على نفس إطار البيانات ولكن لهما استخدام مختلف حسب الحالة. في هذه المقالة ، تعلمنا الاختلافات الرئيسية بين طريقة الانضمام ودمج الباندا. بعد القيام بالأمثلة وفهم طريقة انضمام الباندا ، سنختتمها بمعرفة أنه إذا أردنا المزيد من المرونة والانضمام إلى نمط قاعدة البيانات ، فمن الأفضل استخدام طريقة دمج الباندا. من ناحية أخرى ، إذا أردنا دمج إطار البيانات مع الفهرس على نطاق واسع ، فيمكننا استخدام وظيفة طريقة ربط الباندا ().