احصل على عدد الأعمدة في R DataFrame

Ahsl Ly Dd Ala Mdt Fy R Dataframe



في R ، يعد الحصول على عدد الأعمدة عملية أساسية مطلوبة في العديد من المواقف عند العمل مع DataFrames. عند تقسيم البيانات وتحليلها ومعالجتها ونشرها وتصورها ، يعد عدد الأعمدة جزءًا مهمًا من المعلومات التي يجب معرفتها. لذلك ، يوفر R طرقًا مختلفة للحصول على إجمالي أعمدة DataFrame المحدد. في هذه المقالة ، سنناقش بعض الأساليب التي تساعدنا في الحصول على عدد أعمدة DataFrame.

مثال 1: استخدام دالة Ncol ()

ncol () هي الوظيفة الأكثر شيوعًا للحصول على إجمالي أعمدة DataFrames.







df <- data.frame ('y1' = c (10 ، 12 ، 14 ، 19) ،

'y2' = c (15 ، 22 ، 24 ، 29) ،
                 'y3' = c(25, 32, 34, 39))


ن <- ncol (df)

cat ('----- عدد الأعمدة في إطار البيانات:' ، n)

في هذا المثال ، نقوم أولاً بإنشاء 'df' DataFrame بثلاثة أعمدة تم تصنيفها كـ 'y1' و 'y2' و 'y3' باستخدام وظيفة data.frame () في R. يتم تحديد العناصر الموجودة في كل عمود باستخدام الدالة c () التي تخلق متجهًا للعناصر. ثم ، باستخدام المتغير 'n' ، يتم استخدام الدالة ncol () لتحديد إجمالي الأعمدة في 'df' DataFrame. أخيرًا ، باستخدام الرسالة الوصفية والمتغير 'n' ، تطبع الدالة cat () النتائج على وحدة التحكم.



كما هو متوقع ، يشير الإخراج المسترد إلى أن DataFrame المحدد له ثلاثة أعمدة:







مثال 2: عد الأعمدة الإجمالية لإطار البيانات الفارغ

بعد ذلك ، نطبق الدالة ncol () على DataFrame الفارغ الذي يحصل أيضًا على قيم الأعمدة الإجمالية ولكن هذه القيمة هي صفر.

فارغ _ pdf <- data.frame ()

n <- ncol (فارغ_ pdf)

cat ('--- الأعمدة في إطار البيانات:' ، n)

في هذا المثال ، نقوم بإنشاء DataFrame الفارغ ، 'blank_df' ، من خلال استدعاء data.frame () دون تحديد أي أعمدة أو صفوف. بعد ذلك ، نستخدم الدالة ncol () التي تُستخدم للعثور على عدد الأعمدة في DataFrame. يتم تعيين الدالة ncol () باستخدام 'blank_df' DataFrame هنا للحصول على إجمالي الأعمدة. نظرًا لأن DataFrame 'blank_df' فارغ ، فلا يحتوي على أي أعمدة. إذاً ، ناتج ncol (فارغ_دول) هو 0. يتم عرض النتائج بواسطة وظيفة cat () التي تم نشرها هنا.



يظهر الناتج القيمة '0' كما هو متوقع لأن DataFrame فارغ.

مثال 3: استخدام دالة Select_If () مع وظيفة Length ()

إذا أردنا استرداد عدد الأعمدة من أي نوع معين ، فيجب علينا استخدام وظيفة select_if () جنبًا إلى جنب مع وظيفة length () الخاصة بـ R. يتم استخدام هذه الوظائف التي يتم دمجها للحصول على إجمالي الأعمدة لكل نوع . يتم تنفيذ التعليمات البرمجية لاستخدام هذه الوظائف في ما يلي:

مكتبة (dplyr)

x1 <-LETTERS [1:10]

x2 <-rpois (10،2)

x3 <-rpois (10،5)

x4 <-sample (c ('Summer'، 'Winter')، 10، استبدل = TRUE)

df1 <-data.frame (x1 ، x2 ، x3 ، x4)

مدافع 1

الطول (select_if (df1 ، is.numeric))

في هذا المثال ، نقوم أولاً بتحميل حزمة dplyr حتى نتمكن من الوصول إلى وظيفة select_if () ووظيفة length (). ثم نقوم بإنشاء أربعة متغيرات - 'x1' و 'x2' و 'x3' و 'x4' على التوالي. هنا ، يحتوي 'x1' على أول 10 أحرف كبيرة من الأبجدية الإنجليزية. يتم إنشاء المتغيرات 'x2' و 'x3' باستخدام الدالة rpois () لإنشاء متجهين منفصلين من 10 أرقام عشوائية مع المعلمات 2 و 5 ، على التوالي. المتغير 'x4' هو متجه عامل به 10 عناصر تم أخذ عينات منها عشوائيًا من المتجه c ('الصيف' ، 'الشتاء').

بعد ذلك ، نحاول إنشاء 'df1' DataFrame حيث يتم تمرير جميع المتغيرات في وظيفة data.frame (). أخيرًا ، نستدعي وظيفة length () لتحديد طول 'df1' DataFrame الذي تم إنشاؤه باستخدام وظيفة select_if () من حزمة dplyr. تحدد الدالة select_if () الأعمدة من 'df1' DataFrame كوسيطة وتختار الدالة is.numeric () الأعمدة التي تحتوي على قيم رقمية فقط. بعد ذلك ، تحصل الدالة length () على إجمالي الأعمدة التي تم تحديدها بواسطة select_if () وهو ناتج الكود بأكمله.

يظهر طول العمود في الإخراج التالي الذي يشير إلى إجمالي أعمدة DataFrame:

مثال 4: استخدام وظيفة Sapply ()

على العكس من ذلك ، إذا أردنا فقط حساب القيم المفقودة للأعمدة ، فلدينا وظيفة sapply (). تتكرر الدالة sapply () فوق كل عمود من أعمدة DataFrame لتعمل على وجه التحديد. يتم تمرير الدالة sapply () أولاً باستخدام DataFrame كوسيطة. بعد ذلك ، يستغرق تنفيذ العملية على DataFrame هذا. يتم توفير تنفيذ الوظيفة sapply () للحصول على عدد قيم NA في أعمدة DataFrame على النحو التالي:

new_df <- data.frame (c1 = c (10، 11، NA، 13، NA) ،

c2 = c ('N' ، NA ، 'A' ، 'M' ، 'E') ،
c3 = ج (NA، 92، NA، NA، 95))

sapply (new_df، function (x) sum (is.na (x)))

في هذا المثال ، نقوم بإنشاء 'new_df' DataFrame بثلاثة أعمدة - 'c1' و 'c2' و 'c3'. يحتوي العمودان الأولان 'c1' و 'c3' على القيم الرقمية بما في ذلك بعض القيم المفقودة التي يمثلها NA. يحتوي العمود الثاني ، 'c2' ، على الأحرف بما في ذلك بعض القيم المفقودة والتي يمثلها أيضًا NA. بعد ذلك ، نطبق وظيفة sapply () على 'new_df' DataFrame ونحسب عدد القيم المفقودة في كل عمود باستخدام تعبير sum () داخل دالة sapply ().

الدالة is.na () هي ذلك التعبير المحدد للدالة sum () التي تُرجع متجهًا منطقيًا يشير إلى ما إذا كان كل عنصر في العمود مفقودًا أم لا. تجمع الدالة sum () قيم TRUE لحساب عدد القيم المفقودة في كل عمود.

ومن ثم ، يعرض الإخراج إجمالي قيم NA في كل عمود:

مثال 5: استخدام وظيفة Dim ()

بالإضافة إلى ذلك ، نريد الحصول على إجمالي الأعمدة جنبًا إلى جنب مع صفوف DataFrame. بعد ذلك ، توفر الدالة dim () أبعاد DataFrame. تأخذ الدالة dim () الكائن كحجة نريد استرداد أبعادها. إليك الكود لاستخدام وظيفة dim ():

d1 <- data.frame (team = c ('t1'، 't2'، 't3'، 't4')،

النقاط = ج (8 ، 10 ، 7 ، 4))

خافت (د 1)

في هذا المثال ، نحدد أولاً 'd1' DataFrame الذي تم إنشاؤه باستخدام وظيفة data.frame () حيث يتم تعيين عمودين 'فريق' و 'نقاط'. بعد ذلك ، نستدعي الدالة dim () عبر 'd1' DataFrame. تعرض الدالة dim () عدد الصفوف والأعمدة الخاصة بـ DataFrame. لذلك ، عندما نقوم بتشغيل خافت (d1) ، فإنه يعيد متجهًا بعنصرين - يعكس الأول منهما عدد الصفوف في DataFrame 'd1' ويمثل الثاني عدد الأعمدة.

يمثل الناتج أبعاد DataFrame حيث تشير القيمة '4' إلى إجمالي الأعمدة وتمثل القيمة '2' الصفوف:

خاتمة

لقد تعلمنا الآن أن حساب عدد الأعمدة في R هو عملية بسيطة ومهمة يمكن إجراؤها على DataFrame. من بين جميع الوظائف ، تعد وظيفة ncol () هي الطريقة الأكثر ملاءمة. الآن ، نحن على دراية بالطرق المختلفة للحصول على عدد الأعمدة من DataFrame المحدد.