عينة () الوظيفة في R

Ynt Alwzyft Fy R



في R ، نحصل على قيم عينة عشوائية من متجه أو قائمة باستخدام دالة العينة (). إنها تمكننا من اختيار مجموعة فرعية من البيانات بشكل عشوائي وهي مفيدة في العديد من التطبيقات الإحصائية. إذا كان الإدخال عبارة عن قائمة في دالة العينة () ، فسيكون الإخراج أيضًا قائمة بنفس عدد العناصر ، ولكن مع العناصر المحددة. توضح هذه المقالة الدالة sample () لـ R مع التطبيق الذي يعيّن الوسائط المختلفة.

مثال 1: استخدام الدالة Sample () مع وسيطة البيانات

يجب توفير دالة العينة () لـ R مع بيانات العينة لتوليد رقم عشوائيًا. بيانات العينة هي الوسيطة المطلوبة للدالة sample () التي يرد رمزها في ما يلي:

البيانات < - ج ( 10 و عشرين و 30 و 40 و خمسون و 60 و 70 و 80 و 90 و 100 )

عينة ( البيانات و 3 )

عينة ( البيانات و 3 )

هنا ، نقوم أولاً بتوليد متجهات العناصر الصحيحة داخل متغير 'dataX'. بعد ذلك ، نسمي الدالة sample () مرتين في الكود ونمرر متجه 'dataX' الذي أنشأناه سابقًا كوسيطة له. يأخذ أول استخدام للعينة (dataX، 3) عينة عشوائية من ثلاثة عناصر من متجه 'dataX'. النتائج عبارة عن تبديل عشوائي لثلاثة عناصر من 'dataX'. بعد ذلك ، نستخدم العينة (أ ، 5) مرة أخرى والتي تأخذ عينة عشوائية مستقلة أخرى من ثلاثة عناصر من متجه 'dataX'. هذه المرة ، تكون النتيجة مختلفة تمامًا عن النتيجة السابقة.







يُظهر الإخراج العناصر المختلفة عند استدعاء دالة العينة () مرتين. لاحظ أنه في كل مرة نقوم فيها بإنشاء العينة بشكل عشوائي ، يتم الحصول على عناصر مختلفة من المتجهات:





مثال 2: استخدام الدالة Sample () مع وسيطة الاستبدال

علاوة على ذلك ، لدينا وسيطة 'replace' للدالة sample () التي تأخذ القيم المنطقية. يمكن تحديد عنصر مشابه أكثر من مرة إذا تم أخذ عينة من العنصر باستخدام خيار الاستبدال ، TRUE. ومع ذلك ، إذا تم تعيين القيمة على FALSE ، فيمكن أن يكون هناك تحديد واحد فقط لكل عنصر مما يؤدي إلى أخذ عينات من العناصر بدون استبدال.





أرقام عشوائية = ج ( أحد عشر و 25 و 12 و 89 و أربعة خمسة و 16 و 67 و 38 و 96 و 55 و 73 )

عينة ( أرقام عشوائية و 4 و يستبدل = حقيقي )

عينة ( أرقام عشوائية و 5 و يستبدل = حقيقي )

هنا ، نحدد أولاً المتجه ببعض القيم الرقمية في المتغير 'random_numbers'. بعد ذلك ، نستدعي الدالة sample () حيث يتم تمرير 'random_numbers' كوسيطة. يتم تحديد قيمة '4' لوظيفة العينة () التي تشير إلى أنها تختار فقط أربع قيم عشوائية من المتجهات في 'الأرقام العشوائية'.

بعد ذلك ، تحدد الاستبدال = TRUE في دالة sample () أنه يمكن تحديد كل قيمة أكثر من مرة. بعد ذلك ، ننشر الدالة sample () مرة أخرى والتي تحدد قيم عشوائية '5' من المتجهات هذه المرة. وبالمثل ، قمنا بتعيين وسيطة الاستبدال بـ 'TRUE' كما كان من قبل بالنسبة لخيارات التحديد المتعددة لكل قيمة.



كما نرى ، يعرض الناتج الأول متجه 4 عناصر تم اختيارها عشوائيًا من متجه 'الأرقام العشوائية'. ومع ذلك ، فإن الإخراج التالي يعرض متجهًا لـ '5' عناصر محددة عشوائيًا:

مثال 3: استخدام الدالة Sample () مع وسيطة الحجم

الحجة التالية التي تمر بها دالة sample () هي 'الحجم'. 'الحجم' هو معلمة اختيارية تشير إلى قيمة العينات المراد سحبها. يتم تقديم رمز الدالة sample () مع معلمة 'size' في ما يلي:

ثلاثة أبعاد < - 1 : 10

عينة ( ثلاثة أبعاد و مقاس = 5 )

هنا ، يتم تعريف المتجه الرقمي على أنه سلسلة من الأعداد الصحيحة من 1 إلى 10 في متغير 'المتجهات'. يتم بعد ذلك استخدام دالة العينة () في اختيار العناصر العشوائية من المتجه. كما نرى ، تأخذ الدالة sample () وسيطين. الحجة الأولى هي المتجهات التي نحصل على العينة منها. الوسيطة التالية هي الحجم المحدد بقيمة '5' التي تشير إلى وجود خمسة عناصر فقط للاختيار من المتجه.

ومن ثم ، يتم إرجاع العناصر المحددة بترتيب عشوائي كمتجه جديد في المخرجات التالية:

مثال 4: استخدام الدالة Sample () لقائمة R.

علاوة على ذلك ، يمكن استخدام دالة sample () للقائمة في R. يحصل هذا القسم من المثال على قيم عشوائية من القائمة.

R_list < - قائمة ( 1 : 4 و

913 و

ج ( 'X' و 'YYY' و 'جيد' ) و

'ZZZ' و

5 )

نتيجة < - R_list [ عينة ( 1 :طول ( R_list ) و مقاس = 4 ) ]

نتيجة

هنا ، يتم تعريف قائمة 'R_list' بعناصر من أنواع مختلفة بما في ذلك متجه الأرقام ، ورقم واحد ، ومتجه حرف ، وسلسلة ، ورقم آخر. بعد ذلك ، نقوم بإنشاء متغير 'نتيجة' حيث يتم استدعاء دالة sample ().

داخل دالة العينة () ، قمنا بتعيين تعبير '1: length (R_list)' الذي يشير إلى متجهات المؤشرات التي يجب أخذ عينات من خلالها. بعد ذلك ، لدينا حجة 'حجم' لتحديد عدد العناصر التي سيتم أخذ عينات منها وهو '4'. لذلك ، 'R_list' يولد ثلاثة عناصر مختارة عشوائيا من قائمة 'R_list'. نظرًا لأن العناصر الموجودة في قائمة 'R_list' من أنواع مختلفة ، فإن العناصر الناتجة في 'النتيجة' يمكن أن تكون أيضًا من أنواع مختلفة.

يمثل الإخراج القائمة الجديدة التي تحتوي على مجموعة فرعية عشوائية من القائمة الأصلية:

مثال 5: استخدام دالة Sample () مع وسيطة احتمال

بالإضافة إلى ذلك ، لدينا معلمة 'prob' لوظيفة العينة (). تعطي الوسيطة 'prob' احتمال العنصر المحدد في المتجه. لاحظ أنه من المفترض أن يكون لجميع العناصر احتمالية متساوية عند عدم استخدام وسيطة 'prob'.

بياناتي = ج ( 31 و 99 و 5 و 24 و 72 )

عينة ( بياناتي و مقاس = 10 و يستبدل = حقيقي و

مشكلة = ج ( 0.5 و مندوب ( 0.1 و 4 ) ) )

هنا ، تتم الإشارة إلى عناصر المتجهات الرقمية 'my_data'. في الخطوة التالية ، نسمي الدالة sample () حيث يتم تمرير 'my_data' إلى 10 عناصر تم اختيارها عشوائيًا منها. بعد ذلك ، يتم تحديد وسيطة 'الحجم' التي تحدد أن القيمة المراد تحديدها عشوائيًا يجب أن تكون بحجم '10'. بعد ذلك ، نقوم بتعيين 'TRUE' إلى وسيطة 'replace' مما يعني أنه يتم استبدال كل عنصر محدد في المتجه قبل تحديد العنصر التالي. الوسيطة الثالثة التي تم تعريفها في دالة العينة () هي 'prob' التي تحدد احتمالية اختيار كل عنصر في متجه 'بياناتي'. تم ضبط احتمال العنصر الأول على '0.5'. بالنسبة لعناصر المتجه الأربعة المتبقية ، يكون الاحتمال '0.1'.

يتم استرداد المخرجات التالية بأعلى احتمالية للعنصر الأول في المتجهات كما هو متوقع:

مثال 6: استخدام الدالة Sample () لتصيير Barplot

أخيرًا ، يتم استخدام دالة العينة () لبناء Barplot في R لتصور توزيع متغير فئوي بتوزيع احتمالي معين.

عينة البيانات = ج ( 1 و 2 و 3 )

باربلوت ( طاولة ( عينة ( عينة البيانات و مقاس = 500 و يستبدل = حقيقي و مشكلة = ج ( .30 و .60 و .10 ) ) ) )

هنا ، بعد تحديد 'sample_data' بمتجه قيمة عدد صحيح ، نقوم بإنشاء Barplot عن طريق نشر دالة sample (). أولاً ، نسمي barplot الذي يستدعي دالة table () لإنشاء جدول تكراري للعينة الناتجة. بعد ذلك ، نحدد الدالة sample () داخل دالة table () حيث يتم سحب عينة عشوائية بحجم 1000 من متجه للأعداد الصحيحة من 1 إلى 3. ثم ، يتم استخدام الوسيطة 'prob' لتحديد احتمال اختيار كل عدد صحيح .

كما يمكننا أن نرى الآن ، يتم عرض Barplot في ما يلي مع الأشرطة الثلاثة ، واحد لكل عدد صحيح ، ويكون ارتفاع الأشرطة مرتبطًا بالعدد الصحيح الذي يحدث في العينة:

خاتمة

لقد رأينا كيف تعمل الدالة sample () مع أمثلة مختلفة. تُستخدم الدالة sample () مع وسيطات مختلفة حيث تكون بيانات العينة مطلوبة وتكون جميع الوسائط الأخرى اختيارية ويتم استدعاؤها في حالات محددة. ومع ذلك ، فإن الدالة sample () مفيدة في التحليل الإحصائي أو عند العمل مع مجموعات البيانات الكبيرة.