[الباندا](http://pandas.pydata.org/) هي مكتبة بايثون لتحليل البيانات باستخدام إطارات البيانات. إطارات البيانات هي جداول بيانات ، والتي يمكن مقارنةها من الناحية المفاهيمية بجدول بيانات. سيشعر علماء البيانات المألوفون بـ R بأنهم في وطنهم هنا. الباندا غالبا ما تستخدم جنبا إلى جنب مع numpy ، pyplot ، و scikit - تعلم.
### استيراد الباندا
هو اصطلاح يستخدم على نطاق واسع لاستيراد مكتبة الباندا باستخدام الاسم المستعار `pd` :
يتكون إطار البيانات من عدد من الصفوف والأعمدة. يمثل كل عمود ميزة من مجموعة البيانات ، وكذلك الاسم ونوع البيانات. يمثل كل صف نقطة بيانات من خلال قيم المعالم المرتبطة. تسمح لك مكتبة الباندا بمعالجة البيانات في إطار بيانات بطرق مختلفة. الباندا لديها الكثير من الاحتمالات ، لذلك ما يلي هو مجرد خدش السطح لإعطاء الشعور للمكتبة.
## سلسلة
السلسلة هي نوع البيانات الأساسي في الباندا. سلسلة تشبه إلى حد كبير صفيف (مصفوفة NumPy) (في الحقيقة إنها مبنية على قمة كائن مصفوفة NumPy). يمكن أن تحتوي السلسلة A على تسميات للمحور ، حيث يمكن فهرستها بواسطة تسمية بدون فهرسة أرقام لموقع البيانات. يمكنه الاحتفاظ بأي قائمة بايثون صحيحة مثل قائمة ، قاموس ، إلخ.
## تحميل البيانات من ملف csv
ملف `.csv` هو ملف _قيمة مفصولة بفواصل_ . طريقة شائعة جدا لتخزين البيانات. لتحميل هذه البيانات في إطار بيانات `read_csv` ، استخدم الطريقة `read_csv` :
هنا ، يمكن أن يكون `file_path` مسارًا محليًا لملف csv على جهاز الكمبيوتر الخاص بك ، أو عنوان url يشير إلى واحد. قد يتم تضمين أسماء الأعمدة في ملف csv ، أو قد يتم تمريرها كوسيطة. لمزيد من المعلومات حول هذا ، وأكثر من ذلك بكثير ، ألق نظرة على [الوثائق](http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html?highlight=read_csv#pandas.read_csv) .
## الحصول على لمحة عامة عن إطار البيانات
لإظهار الصفوف القليلة الأولى من إطار البيانات ، تكون طريقة `head` مفيدة (مرة أخرى يجب أن يبدو هذا مألوفًا لمبرمجي R):
يمكن أن يكون إطار البيانات جزئيًا بعدة طرق. واحد من أبسط هو الحصول على عمود واحد. على سبيل المثال ، إذا كان إطار البيانات `df` يحتوي على عمود اسمه `age` ، فيمكننا استخلاصه كما يلي: