كيفية قراءة ملف Excel (xlsx) في لغة Python

How Read Excel File Python



ال .xlsx هو امتداد لوثيقة Excel التي يمكنها تخزين كمية كبيرة من البيانات في شكل جدول ، ويمكن إجراء العديد من أنواع الحسابات الحسابية والمنطقية بسهولة في جدول بيانات Excel. في بعض الأحيان يكون مطلوبًا قراءة البيانات من مستند Excel باستخدام برنامج Python النصي لأغراض البرمجة. توجد العديد من الوحدات النمطية في Python لقراءة مستند Excel. بعض الوحدات المفيدة هي xlrd و openpyxl ، و الباندا . تم عرض طرق استخدام هذه الوحدات لقراءة ملف Excel في Python في هذا البرنامج التعليمي.

المتطلبات المسبقة:

ستكون هناك حاجة إلى ملف Excel وهمي بامتداد .xlsx للتحقق من أمثلة هذا البرنامج التعليمي. يمكنك استخدام أي ملف Excel موجود أو إنشاء ملف جديد. هنا ، ملف اكسل جديد اسمه المبيعات. xlsx تم إنشاء الملف بالبيانات التالية. تم استخدام هذا الملف للقراءة باستخدام وحدات Python النمطية المختلفة في الجزء التالي من هذا البرنامج التعليمي.







المبيعات. xlsx



تاريخ المبيعات مندوب مبيعات كمية
05/12/18 Sila Ahmed 60000
12/06/19 عني حسين 50000
08/09/20 سرمين جهان 45000
04/07/21 محمود الحسن 30000

مثال 1: قراءة ملف Excel باستخدام xlrd

لا يتم تثبيت الوحدة النمطية xlrd مع Python افتراضيًا. لذلك ، يجب عليك تثبيت الوحدة قبل استخدامها. لا يدعم الإصدار الأخير من هذه الوحدة ملف Excel بامتداد .xlsx. لذلك ، يجب عليك تثبيت الإصدار 1.2.0 من هذه الوحدة لقراءة ملف xlsx. قم بتشغيل الأمر التالي من المحطة لتثبيت الإصدار المطلوب من xlrd .



$نقطةتثبيت xlrd== 1.2.0

بعد الانتهاء من عملية التثبيت ، قم بإنشاء ملف python بالبرنامج النصي التالي لقراءة ملف المبيعات. xlsx ملف باستخدام xlrd وحدة. open_workbook () الوظيفة المستخدمة في البرنامج النصي فتح ملف xlsx للقراءة. يحتوي ملف Excel هذا على ورقة واحدة فقط. لذلك workbook.sheet_by_index () تم استخدام الوظيفة في البرنامج النصي بقيمة الوسيطة 0. بعد ذلك ، يتم استخدام الدالة المتداخلة 'ل' تستخدم loop لقراءة قيم خلية ورقة العمل باستخدام قيم الصفوف والعمود. تم استخدام وظيفتين range () في البرنامج النصي لتحديد حجم الصف والعمود بناءً على بيانات الورقة. ال cell_value () تم استخدام الوظيفة لقراءة قيمة خلية معينة للورقة في كل تكرار للحلقة. سيتم فصل كل حقل في الإخراج بمسافة علامة تبويب واحدة.





# استيراد وحدة xlrd
استيراد xlrd

# افتح المصنف
المصنف = xlrd.open_workbook('sales.xlsx')

# افتح ورقة العمل
ورقة العمل = workbook.sheet_by_index(0)

# كرر الصفوف والأعمدة
لأنافينطاق(0و5):
ليفينطاق(0و3):
# اطبع قيم الخلية بمسافة علامة التبويب
مطبعة(ورقة عمل .cell_value(اي جاي)ونهاية=' t')
مطبعة(')

انتاج:

سيظهر الإخراج التالي بعد تنفيذ البرنامج النصي أعلاه.



مثال 2: قراءة ملف اكسل باستخدام openpyxl

ال openpyxl هي وحدة نمطية أخرى من نوع python لقراءة ملف xlsx ، كما أنها غير مثبتة مع Python افتراضيًا. قم بتشغيل الأمر التالي من المحطة لتثبيت هذه الوحدة قبل استخدامها.

$نقطةتثبيتopenpyxl

بعد الانتهاء من عملية التثبيت ، قم بإنشاء ملف python بالبرنامج النصي التالي لقراءة ملف المبيعات. xlsx ملف. مثل الوحدة النمطية xlrd ، ال openpyxl الوحدة لديها تحميل كتاب العمل () وظيفة لفتح ملف xlsx للقراءة. ال المبيعات. xlsx file كقيمة وسيطة لهذه الوظيفة. الهدف من wookbook.active تم إنشاؤه في البرنامج النصي لقراءة قيم ماكس_رو و ال max_column الخصائص. تم استخدام هذه الخصائص في حلقات for المتداخلة لقراءة محتوى ملف المبيعات. xlsx ملف. تم استخدام الدالة range () لقراءة صفوف الورقة ، كما تم استخدام الدالة iter_cols () لقراءة أعمدة الورقة. سيتم فصل كل حقل في الإخراج بمسافتين جدولة.

# استيراد وحدة Openyxl
استيراد openpyxl

# تحديد متغير لتحميل كتاب wookbook
wookbook = openpyxl.load_workbook('sales.xlsx')

# تحديد متغير لقراءة الورقة النشطة:
ورقة العمل = wookbook.active

# كرر الحلقة لقراءة قيم الخلية
لأنافينطاق(0و workheet.max_row):
ل مع ال فيورقة عمل(1و workheet.max_column):
مطبعة(مع ال[أنا].القيمة،نهاية=' t t')
مطبعة(')

انتاج:

سيظهر الإخراج التالي بعد تنفيذ البرنامج النصي أعلاه.

مثال 3: قراءة ملف اكسل باستخدام الباندا

لم يتم تثبيت وحدة الباندا مع الوحدة السابقة مثل بيثون. لذا ، إذا لم تقم بتثبيته من قبل ، فعليك تثبيته. قم بتشغيل الأمر التالي لتثبيت الباندا من المحطة.

$نقطةتثبيتالباندا

بعد الانتهاء من عملية التثبيت ، قم بإنشاء ملف python بالبرنامج النصي التالي لقراءة ملف المبيعات. xlsx ملف. ال read_excel () تستخدم وظيفة الباندا لقراءة ملف xlsx. تم استخدام هذه الوظيفة في البرنامج النصي لقراءة ملف المبيعات. xlsx ملف. ال إطار البيانات () استخدمت الوظيفة هنا لقراءة محتوى ملف xlsx في إطار البيانات وتخزين القيم في المتغير المسمى البيانات . تمت طباعة قيمة البيانات لاحقًا.

# استيراد الباندا
استيراد البانداكماpd

# قم بتحميل ملف xlsx
excel_data = pd.read_excel('sales.xlsx')
# اقرأ قيم الملف في إطار البيانات
البيانات = pd.DataFrame(excel_data ،الأعمدة=['تاريخ المبيعات'و'مندوب مبيعات'و'كمية'])
# طباعة المحتوى
مطبعة(محتوى الملف هو:ن'، البيانات)

انتاج:

سيظهر الإخراج التالي بعد تنفيذ البرنامج النصي أعلاه. إخراج هذا البرنامج النصي يختلف عن المثالين السابقين. تتم طباعة أرقام الصفوف في العمود الأول ، حيث تم حساب قيمة الصف من 0. تتم محاذاة قيم التاريخ مركزيًا. تتم محاذاة أسماء مندوبي المبيعات بشكل صحيح. يتم محاذاة المبلغ إلى اليسار.

استنتاج:

يحتاج مستخدمو python إلى العمل مع ملفات xlsx لأغراض البرمجة المختلفة. تم عرض ثلاث طرق مختلفة لقراءة ملف xlsx في هذا البرنامج التعليمي باستخدام ثلاث وحدات من Python. كل وحدة لها وظائف وخصائص مختلفة لقراءة ملف xlsx. سيساعد هذا البرنامج التعليمي مستخدمي python على قراءة ملف xlsx بسهولة باستخدام برنامج Python النصي بعد قراءة هذا البرنامج التعليمي.